Texte verstehen. Mehrwerte schaffen.

Textdaten automatisiert verwerten

Mittels Text Mining können unstrukturierte Textinhalte strukturiert und für digitale Prozesse und Lösungen nutzbar gemacht werden. Verschaffen Sie sich einen Wissensvorsprung und profitieren Sie von den Informationen, die in Ihren Textdaten liegen. Als Text Mining-Spezialist unterstützen wir Sie, Ihre Textdaten so zu verwerten, dass Sie Ihren Nutzern und Kunden Mehrwerte liefern können.

Illustration zu Text Mining

Text Mining

Mit Text Mining Erlebnisse schaffen

Fast 80 Prozent aller Daten liegen in Textform wie E-Mails, Dokumenten, Kommentaren, PDFs, Dokumentationen und ähnlichem vor. Um sie für automatisierte Prozesse und Anwendungen nutzen zu können, müssen diese Daten in strukturierte Daten verwandelt werden. Erst durch Text Mining-Verfahren werden natürlichsprachige Texte maschinell verstehbar. Diese Verfahren bilden damit die Grundlage, um Informationen aus Textdaten zu extrahieren, mit zusätzlichen Informationen anzureichern und daraus datengetriebene KI-basierte Anwendungen entwickeln zu können. 

Unsere Leistungen

Als Spezialist für Text Mining haben wir Verfahren und Algorithmen entwickelt, mit denen wir nahezu 100 Prozent eines Textes automatisiert verstehen. 

Beratung

Wir zeigen Ihnen, welche internen und externen Informationen Sie sich zunutze machen können und beraten beim Aufbau datengesteuerter Prozesse.

Textanalyse

Wir analysieren und verstehen automatisiert deutsche und englischsprachige Texte. Mit Hilfe von Natural Language Processing erkennen wir die Bedeutung, reichern Textdaten mit zusätzlichen Informationen an und optimieren sie durch Machine Learning.

Implementierung

Wir implementieren Text Mining-Frameworks in Ihre Systemstruktur, binden externe Wissensdatenbanken und Expertensysteme an und schaffen automatisierte Text Mining-Anwendungen. Je nach Wunsch stellen wir Ihnen diese als Software-as-a-Service oder On-Premise zur Verfügung.

Datenbasierte Lösungen

Auf Basis der extrahierten Informationen erstellen wir datenbasierte Anwendungen, die Ihre Informationen auswertbar machen, zusätzliche Services bieten oder Prozesse vereinfachen.

NLP-Framework

TXTWerk

TXTWerk ist ein modulbasiertes System, das aus Texten Metadaten extrahiert und so aus unstrukturierten Texten strukturierte Daten liefert. Die multilinguale NLP-Lösung TXTWerk und die eingesetzten Verfahren haben einen starken Fokus auf die deutsche Sprache. Durch die Anwendung maschineller Lernverfahren in Kombination mit regelbasierten Ansätzen kann TXTWerk Texte lesen und verstehen, und das in Echtzeit und mit hoher Geschwindigkeit.
Das gesamte Framework kann einfach auf Ihre Anforderungen zugeschnitten werden, um so neue Domänen zu unterstützen.

Mittels TXTWerk lassen sich auch vollautomatisiert Textdokumente in SAP erschließen. Dazu steht TXTWerk als Erweiterung von SAP im SAP App Center zur Verfügung und ist damit eine perfekte Ergänzung zu SAP HANA.

Feature

Wissensdatenbanken

Feature

Named Entity Recognition und Disambiguation (NERD)

Feature

Sentiment und Opinion Mining

Feature

Text-Klassifikation

SAP Silver Partner Logo

SAP Partner

Text Mining für SAP-Daten

Überzeugen Sie sich selbst

Kundenprojekte

gruner_jahr_ontolux

G+J Digital Products

Für die Erstellung einer Content Curation Engine des Gruner+Jahr Verlages werden Texte aus 1.500 Web-Datenquellen für Redakteure aufbereitet, Informationen extrahiert und nach ausgewählten Kriterien herausgefiltert und bewertet.

PMG Presse Monitor Logo

PMG

Alle Texte in der PMG Pressedatenbank werden semantisch analysiert, klassifiziert, angereichert und indexiert, um die Suchfunktion auf dem Portal zu optimieren.
wir-liefern.org Logo

Wir-liefern.org

Mittels TXTWerk werden die von verschiedenen Charity-Anbietern eingetragenen Angebote klassifiziert, verschlagwortet und für die Website-Suche aufbereitet.

Was versteht man unter Text Mining?

Text Mining ist ein Analyseverfahren, indem mithilfe von Algorithmen aus unstrukturierten Daten sinnvolle Erkenntnisse und Strukturen erzeugt werden. Die Algorithmen greifen dabei auf linguistische sowie statistische Methoden zurück.

So lassen sich bspw. E-Mails oder PDFs nach bestimmten Kriterien auswerten, um nützliche Insights daraus zu generieren.

Was sind NLP-Frameworks?

NLP-Frameworks stellen technische Grundgerüste dar, wo Entwickler schon auf vorgefertigte Funktionen in Bezug auf Natural Language Processing zurückgreifen können.

ontolux hauseigenes NLP-Framework ist TXTWerk und lässt sich einfach in digitale Ökosysteme integrieren, um so große Textdaten auszuwerten.

Was kann alles TXTWerk?

TXTWerk ist ein NLP-Framework, was sich ohne großen Aufwand implementieren lässt, um damit aus deutschen sowie englischen Textdaten zusätzliche Meta- sowie strukturierte Daten zu erzeugen. TXTWerk zeichnet sich zudem von seiner Schnelligkeit aus, in welcher Texte analysiert werden.

Was sind Wissensgraphen?

Wissensgraphen sind Wissensdatenbanken, die auf ein grafisch-strukturiertes Datenmodell basieren. Wissensgraphen werden verwendet, um Verbindungen zwischen Entitäten, Objekten, Events etc. herzustellen und aufzuzeigen. TXTWerk stellt einen Wissensgraphen auf Basis von Wikipedia bereit. 

Was bedeutet Named Entity Recognition und Disambiguation (NERD)?

Bei der Entity Recognition (Entitäten-Erkennung) werden Texte daraufhin untersucht, welche Entitäten der realen Welt entsprechen (typischerweise Personen). 

Die Funktion wird bei TXTWerk mit der Entity Linking oder Disambiguation verknüpft, dadurch werde die Entitäten eindeutig mit einer Wissensdatenbank (z.B.: Wikipedia) verlinkt. Findet sich bspw. in einem Text der Begriff “Krebs”, so kann man mithilfe der NERD festgestellt werden, ob es sich um das Sternzeichen, Tier oder Krankheit handelt.

Was ist Sentiment und Opinion Mining?

Beim Sentiment und Opinion Mining werden Texte auf ihren enthaltenen Emotionen untersucht. So kann eine positive, neutrale oder negative Stimmung extrahiert werden.


Dafür eignen sich insbesondere Reviews, um auszulesen, wie Käufer das gekaufte Produkt fanden.

Was versteht man unter Text-Klassifikation?

Bei der Text-Klassifikation geht es darum, einen Text innerhalb vorgegebener Themenbereiche inhaltlich zu verorten, z. B. anhand von Ressorts ähnlich wie bei Zeitungen. Handelt es sich bei dem Text eher um einen politischen, einen kulturellen oder geht es um Sport? 

Kontakt

Sprechen Sie uns an

Dr. Till Plumbaum

Robert-Koch-Platz 4
10115 Berlin
 
Till Plumbaum Profilbild