Bundesamt für Sicherheit in der Informationstechnik

Forschungsorientierte Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen​

Zur Analyse von Gefahrenmeldungen werden vorhandene unstrukturierte Lageinformationen in strukturierte Daten verwandelt und den Mitarbeitern über eine Suchfunktion zur Verfügung gestellt. 

Herausforderung

Die Menge der zum Themenbereich “Cyber Security” verfügbaren Informationen wächst stetig. Es wird daher zunehmend anspruchsvoller, den Überblick zu behalten. Deshalb wünschte sich das BSI ein System, welches die Möglichkeiten der maschinengestützten Textanalyse nutzt, um seinen Mitarbeitern optimale Voraussetzungen bei der Informationsbeschaffung zu bieten.

Lösung

ontolux hat eine für den Kunden maßgeschneiderte Lösung geschaffen. Mit dieser werden zunächst vertrauenswürdige Quellen des World Wide Web nach den relevanten Informationen durchsucht. Hierbei kommt unser Crawler zum Einsatz. Verschiedene Quellenformate können in die Informationsbeschaffung einbezogen werden. Im nächsten Schritt findet eine semantische Anreicherung der Informationen statt, unter anderem auf Basis unseres NLP-Frameworks TXTWerk. Auf dieser Basis wird den Mitarbeitern des Bundesamts über eine intelligente Suche sowie Dashboards ermöglicht, individuelle Lageberichte zu erstellen, etwa zu Schadprogrammen, Datendiebstahl und anderen Bedrohungen. Darüber hinaus kann das System trainiert werden, um seiner Aufgabe immer besser gerecht zu werden.

Unser Kunde

Das Bundesamt für Sicherheit in der Informationstechnik (BSI) ist die deutsche Bundesbehörde für Fragen der IT-Sicherheit. Das BSI gestaltet die Informationssicherheit in der Digitalisierung durch Prävention, Detektion und Reaktion für Staat, Wirtschaft und Gesellschaft.

Kunde seit 2021

Bundesamt für Sicherheit in der Informationstechnik

Projekt

Forschungsorientierte Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen

Leistung

  • Beratung
  • Konzeption
  • Umsetzung

Technologien

  • NLP
  • Machine Learning
  • TXTWerk
  • Haystack
  • Elastic Stack
  • Poolparty
  • Scrapy
  • Doccano
Till Plumbaum Profilbild
Kontakt

Dr. Till Plumbaum

Robert-Koch-Platz 4
10115 Berlin