Skip to main content

TXTWerk Demos

Disambiguierung

Was versteht man unter Disambiguierung?

Viele Wörter haben mehrere Bedeutungen und sind erst im Kontext klar zuordenbar. Mittels Named Entity Recognition and Disambiguation (NERD) werden mehrdeutige Entitäten oder Begriffe in einem Text eindeutig maschinell zugeordnet.

Wozu braucht man Disambiguierung?

Durch die Klärung von Mehrdeutigkeiten können NLP-Systeme präzisere und kontextsensitivere Ergebnisse erzielen. NERD ist eine wesentliche Technik in vielen NLP-Anwendungen, einschließlich Empfehlungssystemen und Frage-Antwort-Systemen.

NERD Modul

Testen Sie es selbst

Wie funktioniert die Disambiguierung in TXTWerk?

Der Disambiguierung ist der Prozess der Entitätenerkennung vorgelagert, so dass im Text benannte Entitäten wie Personen, Orte, Organisationen oder andere spezifische Begriffe identifiziert werden. Anschließend erfolgt die Disambiguierung basierend auf Kontextinformationen vektorbasiert im Text. Dies kann die umgebenden Wörter, Sätze oder Absätze einschließen, um zu verstehen, welche Bedeutung einer bestimmten Entität am wahrscheinlichsten ist. Für den Abgleich von erkannten Entitäten nutzen wir externe Wissensbasen wie Wikidata oder Datenbanken. 

Letztere können auch Ihre eigenen Daten sein, die zusätzliche Informationen über Entitäten und ihre Beziehungen enthalten, was zur Auswahl der richtigen Bedeutung beiträgt. Das Modul erkennt für Sie die wichtigsten Informationen in Texten, wie beispielsweise Personen, Orte, Organisationen, Events, aber auch je nach Domäne z.B. Krankheiten oder Paragrafen.

Kontakt

Sprechen Sie uns an

Cornelia Werk

Consultant NLP/Search