Skip to main content

ontolux bei der Berlin Buzzwords 2023

Bei der Berlin Buzzwords 2023, einer der führenden europäischen Konferenzen für moderne Dateninfrastruktur, Suche und maschinellem Lernen, präsentieren und diskutieren Data Scientists über Branchentrends. Qi Wu und Bertram Sändig  gehen in ihrem Vortrag auf domänenspezifische Ontologien im Machine Learning für die IT-Sicherheitsbranche ein.

 

Vom 18. bis 20. Juni 2023 fand die Buzzwords wieder live in Berlin statt.
Die Konferenz versteht sich als eine Art Plattform für Entwickler, Ingenieure, IT-Architekten, Analysten und Datenwissenschaftler, die sich mit Information Retrieval, der Durchsuchbarkeit großer Datenmengen, NoSQL und Big Data Processing beschäftigen. In vier parallelen Slots werden mehr als 60 Vorträge in Englisch gehalten.  

Qi und Bertram zeigten am 19.06.2023 um 16:30 Uhr in der Kulturbrauerei (Palais Atelier) mit ihrem Vortrag – Machine Learning mit bereichsspezifischer Ontologie für die IT-Sicherheitsbranche, wie durch die Kombination von Ontologie und maschinellem Lernen ein leistungsstarkes Werkzeug zur Analyse von IT-Sicherheitsdokumenten entwickelt werden kann.

 

Inhalt des Vortrages: 

Das BSI beobachtet und beurteilt die aktuelle IT-Sicherheitslage und deren langfristige Veränderung. Dazu gehören z.B. Hackergruppen oder neu entdeckte Sicherheitslücken. Zu diesem Zweck werden diverse Nachrichten-Quellen beobachtet und wichtige Informationen extrahiert, um aktuelle Trends zu erkennen und einen Überblick zu gewinnen.

Zur Optimierung dieses Prozesses entwickeln wir gemeinsam mit dem BSI ein System, das die Arbeit unterstützt, indem  Dokumente einer automatischen  Analyse mit Verfahren wie Named Entity Recognition (NER) und Named Entity Linking (NEL) unterzogen werden. Während NER die Zuordnung von Textstellen zu vorgegebenen Klassen durch Machine Learning bezeichnet (z.B. „Browser“ zu Software), wird beim NEL eine Zuordnung zu konkreten Entitäten einer Ontologie angestrebt (z.B. „DOS“ zu „Disk Operating System“). Wir erklären, wie wir mit der besonderen Herausforderung begrifflicher Ambiguitäten umgehen („DOS“ steht nicht nur für „Disk Operating System“ sondern auch für „Denial of Service“). Der Vortrag gibt einen Einblick in unser Entitäten-Erkennungs-System.

Qi Wu
Machine Learning Engineer bei ontolux, beschäftigt sich mit Themen wie Training und Optimierung von Modellen, mit dem Fokus auf Finetuning und Destillation, und setzt aktuelle Forschungsergebnisse in nutzbare Anwendungen für Kunden um. Während ihres Masterstudiums der Statistik hat sie bereits mit Prof. Dr. Alan Akbik am NLP-Framework FLAIR gearbeitet und sich mit ML im Bereich der natürlichen Sprachverarbeitung beschäftigt.

Bertram Sändig
leitet das Machine Learning Team bei ontolux. Er arbeitet an der Anpassung, Optimierung und Integration großer Sprachmodelle für das Textanalyse-Toolkit von ontolux und setzt aktuelle Forschungsergebnisse in nutzbare Anwendungen für Kunden um.

 

Programm zur Veranstaltung

Mehr zum Thema Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen.

Datum: 13.06.2023