Texte verstehen. Mehrwerte schaffen.
Textdaten automatisiert verwerten
Mittels Text Mining können unstrukturierte Textinhalte strukturiert und für digitale Prozesse und Lösungen nutzbar gemacht werden. Verschaffen Sie sich einen Wissensvorsprung und profitieren Sie von den Informationen, die in Ihren Textdaten liegen. Als Text Mining-Spezialist unterstützen wir Sie, Ihre Textdaten so zu verwerten, dass Sie Ihren Nutzern und Kunden Mehrwerte liefern können.

Text Mining
Mit Text Mining Erlebnisse schaffen
Fast 80 Prozent aller Daten liegen in Textform wie E-Mails, Dokumenten, Kommentaren, PDFs, Dokumentationen und ähnlichem vor. Um sie für automatisierte Prozesse und Anwendungen nutzen zu können, müssen diese Daten in strukturierte Daten verwandelt werden. Erst durch Text Mining-Verfahren werden natürlichsprachige Texte maschinell verstehbar. Diese Verfahren bilden damit die Grundlage, um Informationen aus Textdaten zu extrahieren, mit zusätzlichen Informationen anzureichern und daraus datengetriebene KI-basierte Anwendungen entwickeln zu können.
- Optimiert interne Unternehmensprozesse
- Verbessert die Dokumentenqualität
- Liefert neue Erkenntnisse
- Eröffnet neue Geschäftsmöglichkeiten
Unsere Leistungen
Als Spezialist für Text Mining haben wir Verfahren und Algorithmen entwickelt, mit denen wir nahezu 100 Prozent eines Textes automatisiert verstehen.
Beratung
Wir zeigen Ihnen, welche internen und externen Informationen Sie sich zunutze machen können und beraten beim Aufbau datengesteuerter Prozesse.
Textanalyse
Wir analysieren und verstehen automatisiert deutsche und englischsprachige Texte. Mit Hilfe von Natural Language Processing erkennen wir die Bedeutung, reichern Textdaten mit zusätzlichen Informationen an und optimieren sie durch Machine Learning.
Implementierung
Wir implementieren Text Mining-Frameworks in Ihre Systemstruktur, binden externe Wissensdatenbanken und Expertensysteme an und schaffen automatisierte Text Mining-Anwendungen. Je nach Wunsch stellen wir Ihnen diese als Software-as-a-Service oder On-Premise zur Verfügung.
Datenbasierte Lösungen
Auf Basis der extrahierten Informationen erstellen wir datenbasierte Anwendungen, die Ihre Informationen auswertbar machen, zusätzliche Services bieten oder Prozesse vereinfachen.
NLP-Framework
TXTWerk
TXTWerk ist ein modulbasiertes System, das aus Texten Metadaten extrahiert und so aus unstrukturierten Texten strukturierte Daten liefert. Die multilinguale NLP-Lösung TXTWerk und die eingesetzten Verfahren haben einen starken Fokus auf die deutsche Sprache. Durch die Anwendung maschineller Lernverfahren in Kombination mit regelbasierten Ansätzen kann TXTWerk Texte lesen und verstehen, und das in Echtzeit und mit hoher Geschwindigkeit.
Das gesamte Framework kann einfach auf Ihre Anforderungen zugeschnitten werden, um so neue Domänen zu unterstützen.
Mittels TXTWerk lassen sich auch vollautomatisiert Textdokumente in SAP erschließen. Dazu steht TXTWerk als Erweiterung von SAP im SAP App Center zur Verfügung und ist damit eine perfekte Ergänzung zu SAP HANA.
Feature
Wissensdatenbanken
-
Sie kennen es, jede Firma hat ihre eigenen Abkürzungen und Begriffe geschaffen. Für dieses Wissen erstellen wir zusammen eine eigene erweiterbare Wissensdatenbank. Die Grundlage für eine tiefgehende Analyse von unstrukturierten Texten und das Verständnis von Inhalten sind Wissensgraphen, die Zusammenhänge zwischen dem allgemeinen Wissen und Ihrer eigenen Sprache darstellen.Der allgemeine Wissensgraph basiert auf Wikidata und Wikipedia. Dadurch identifizieren wir Objekte der Welt, lernen ihre Zusammenhänge und erhalten so eine Wissensgrundlage mit über 7 Millionen Fakten. Somit erfassen wir nicht nur einfache Verknüpfungen, sondern legen auch Metainformationen ab, die Ihnen helfen, die richtigen Fakten je nach Kontext zu wählen.
Feature
Named Entity Recognition und Disambiguation (NERD)
-
Die Entitätenerkennung und Disambiguierung (NERD) ist eine unserer Kernkomponenten und wird stetig weiterentwickelt. Dabei werden die genutzten Algorithmen dem aktuellen Stand der Technik angepasst und auch die Unterstützung spezieller Domänen wird erweitert (Gesundheit, Recht, ...). Damit ermöglichen wir es Ihnen, auch aus Ihrem individuellen, domänenspezifischen Wissen in Ihren Textdaten optimalen Nutzen zu ziehen.
Das NERD-Modul erkennt für Sie die wichtigsten Informationen in Texten, wie beispielsweise Personen, Orte, Organisationen, Events, aber auch je nach Domäne Krankheiten oder z.B. Paragrafen. Aus Buchstaben werden so Bedeutungen.
Feature
Sentiment und Opinion Mining
- Im E-Commerce oder auch in Social Media werden über Kommentare Meinungen transportiert, die wichtige Informationen für Portale und Hersteller beinhalten können. Über eine gezielte Analyse dieser Meinungen lässt sich ein Stimmungsbild zu einer Marke oder einem Unternehmen erstellen, aber auch dedizierte Rückmeldung zu einem Produkt erlangen. So kann z.B. ein Kommentar das Produkt loben, aber gleichzeitig die Lieferung kritisieren. Mittels aspektorientiertem Opinion Mining analysieren wir solch ein Feedback für Sie automatisiert. So können Sie schnell reagieren und Quellen für Unzufriedenheit schnell beseitigen oder in Zukunft ganz vermeiden.
Feature
Text-Klassifikation
- Die Textklassifikation ist eine der Basistechniken im Bereich Natural Language Processing (NLP), dadurch aber nicht weniger komplex oder wichtig. Unsere Textklassifikation ordnet Ihre Dokumente automatisch zu Themen zu und erkennt die Dokumentenklasse, um die weiteren Verarbeitungsschritte zu bestimmen oder auch z.B. beleidigende Inhalte zu klassifizieren. Wir bringen vortrainierte Modelle z.B. für Nachrichtenmeldungen mit, können aber auch kundenspezifische Anforderungen umsetzen. Optimieren Sie so Ihr Datenmanagement und profitieren Sie von noch mehr Struktur in Ihren Textdaten.

SAP Partner
Text Mining für SAP-Daten
- Als SAP Silver Partner stellt ontolux das Text Mining Framework TXTWerk im SAP App Center bereit, womit sich deutsche oder englische Textdokumente aller Art innerhalb der SAP-Umgebung automatisch analysieren und auswerten lassen, ohne aufwendige Vorab-Konfiguration. Dabei werden diese vollautomatisch gelesen, verstanden, mit weiteren, vordefinierten Metadaten, zum Beispiel kundenspezifischen Zusatzinformationen aus Wissensdatenbanken, semantisch angereichert und klassifiziert. So entstehen Mehrwerte entlang der gesamten innerbetrieblichen Wertschöpfungskette. Das individuell an alle Erfordernisse anpassbare Framework TXTWerk ist, bezogen auf die SAP-Umgebung, die ideale Ergänzung zu SAP HANA. Zudem beraten wir SAP-Kunden beim Einsatz der HANA-internen Text Mining-Tools.
Überzeugen Sie sich selbst
Kundenprojekte

G+J Digital Products
Für die Erstellung einer Content Curation Engine des Gruner+Jahr Verlages werden Texte aus 1.500 Web-Datenquellen für Redakteure aufbereitet, Informationen extrahiert und nach ausgewählten Kriterien herausgefiltert und bewertet.
- Entitätenerkennung
- Klassifizierung der Mediathek
- Optimierte Suche und Empfehlungssystem

PMG
- Indexierung und Anreicherung
- Semantische Analyse
- Optimierte Portal-Suche

Wir-liefern.org
Mittels TXTWerk werden die von verschiedenen Charity-Anbietern eingetragenen Angebote klassifiziert, verschlagwortet und für die Website-Suche aufbereitet.
- Text-Klassifikation
- Semantische Verschlagwortung
- Verbesserte Suche
