Skip to main content

Aufbau einer intelligenten Suche - Was kann schon schiefgehen?​

Vor über 20 Jahren habe ich das erste Mal einen Suchbegriff in eine Suchmaschine eingetippt. Welcher es war, habe ich mir natürlich nicht gemerkt. Nicht mal, welche Suchmaschine es war. Müsste ich aber tippen, würde ich Yahoo! vermuten. 
Schon damals waren Suchmaschinen ein erstaunliches Werkzeug, um Informationen zu finden: qualitativ bei weitem nicht so gut, wie wir das heute gewöhnt sind, aber doch erstaunlich hilfreich, wenn man bedenkt, dass ich vorher entweder Bücher wälzen musste oder – wenn ich das Internet zur Recherche verwendet habe – mich selbst mühsam durch die vorhandenen Seiten klicken musste.

Vorhandene Suchsysteme und ihre Grenzen

Also, wenn mir eine Suche schon damals das Leben leichter machen konnte: kann es so schwer sein, eine funktionierende Suche zu bauen?

Die Antwort ist leider: ja, eine gute Suche zu bauen ist nicht trivial. 
Neben dedizierten Suchmaschinen, die Informationen aus dem ganzen Internet einbeziehen, hat heutzutage jedes Unternehmen seine eigene Suche. Das ist auch sinnvoll, denn als Unternehmen möchte ich natürlich, dass meine User bei mir suchen (und kaufen) und nicht am Ende bei der Konkurrenz landen. 
Außerdem haben viele Unternehmen auch intern wahre Schatzkammern an Daten, die durchsuchbar sein sollten (und es häufig auch sind.) Informationen, die nur für den internen Gebrauch bestimmt sind, und gleichzeitig eine solche Menge und Vielfalt umfassen, dass es irgendwann nicht mehr reicht, zu wissen wo’s steht. Sowohl unternehmensbezogene Webseiten-Suchen als auch interne Suchen sind aus dem Suchkontext heutzutage also nicht mehr wegzudenken. Von Suchen in Shops ganz zu schweigen: Wer möchte sich heute schon noch durch einen ganzen Katalog an Produkten durchklicken?

Aufbau einer intelligenten Suchlösung

Wo setze ich dann aber an, wenn ich eine richtig gute Suche haben möchte?

Um eine gute Suche aufzubauen oder eine bereits bestehende Suche zu verbessern, kann man an ganz verschiedenen Stellen ansetzen. (Wobei “man” hier konkret heißt: es sollte schon ein Experte draufschauen.)
Bei bereits bestehenden Suchen stellen diese Stellen auch diejenigen Orte dar, an denen wir typischerweise Schwachstellen identifizieren können. Je nachdem, mit welcher Perspektive man auf eine Suche blickt, lassen sich unterschiedliche Ansatzpunkte identifizieren.

 

Welche Perspektiven der Suche gibt es denn?

Wir werden hier zwei verschiedene Perspektiven einnehmen: 

  • die funktionale Perspektive

  • die Perspektive des Nutzers

     

Bei der funktionalen Perspektive geht es darum, herauszufinden, wo im technischen Funktionsaufbau einer Suche für Verbesserungen angesetzt werden kann. 
Dafür sei ganz kurz erklärt, wie eine Suche grundlegend in aller Regel aufgebaut ist.

Voraussetzung ist eine Sammlung an Dokumenten, welche durchsucht werden sollen. Die Inhalte dieser Dokumente werden im Suchsystem hinterlegt. In der Regel erfordert das eine Form der Vorverarbeitung – was konkret dabei passiert, ist an dieser Stelle nicht relevant. 

Das Suchsystem selbst fungiert ähnlich wie eine Datenbank. In einem oder mehreren Indexen werden die Daten strukturiert abgespeichert. Strukturiert heißt in dem Fall, dass die Informationen aus den Dokumenten bzw. Metadaten über die Dokumente in verschiedenen Feldern abgespeichert sind.
Beispielsweise wird jedem Dokument eine ID zugeordnet, möglicherweise hat es auch einen ganz bestimmten Typen, einen Titel oder andere spezifische Eigenschaften. Jede dieser Eigenschaften wird in einem eigenen Feld gespeichert und so kann festgelegt werden, welche der Eigenschaften für die Suche relevant sind, welche beispielsweise nur zur Darstellung dienen und welche für Suchfilter genutzt werden können. 
Wird nun eine (vorverarbeitete) Suchanfrage an das Suchsystem gerichtet, wird je nach Konfiguration des Suchsystems in den Dokumenten im Index gesucht und entsprechend reicht das Suchsystem dann die Suchergebnisse weiter.

Erweitert man diese grundlegende Funktionsweise noch um einige Details, ergeben sich im Bild leicht auch die Punkte, an denen bei Verbesserungen angesetzt werden sollte.
Also noch einmal von vorn: Wir gehen von Dokumenten, die durchsucht werden sollen, aus.

Dokumentenpflege und -auffindbarkeit

Bei genauerer Betrachtung wird bewusst, dass diese Dokumente aber nicht im luftleeren Raum existieren, sondern in Datenquellen eingebettet sind, beispielsweise in ein CMS. Und hier beginnt bereits der Optimierungsprozess: Inhalte können nur gefunden werden, wenn sie existieren. Das klingt banal, heißt aber auch, dass schon in der Redaktion für Prozesse gesorgt werden müssen, die sicherstellen, dass jeder neu erstellte Inhalte bestimmte Vorgaben einhält. Solch eine Vorgabe könnte lauten: Gib dem Inhalt einen aussagekräftigen Titel. Gleichzeitig kann automatisch jedes Dokument mit dem Autor, seinem Erstellungs- ( oder Änderungs-) Zeitpunkt und einer Themenwelt, der es angehört, versehen werden. Zum redaktionellen Teil einer funktionierenden Suche gehört aber auch, dass Dokumente, die nicht mehr aktuell sind, aus dem Dokumentenbestand herausgenommen bzw. archiviert werden. Denn ohne einen gut strukturierten Dokumentenbestand kann auch die beste Suche die richtigen Informationen nicht finden.

Strukturierung der Dokumente für den Suchindex

Die Struktur der Dokumente bzw. ihrer Metadaten muss im Anschluss beim Indizierungsprozess in eine sinnvolle Struktur im Suchindex “übersetzt” werden. Bei der Anbindung der Datenquellen an das Suchsystem bzw. bei der Indizierung geht es darum, die Dokumente im Suchsystem selbst strukturiert zu hinterlegen: ein nächster Punkt, an dem bei Verbesserungen angesetzt werden kann. Neben der Überführung der Dokumentenstruktur in den Index gilt es hier auch einen Prozess zu etablieren, der regelmäßig die Quellen abfragt. Ziel ist immer ein möglichst aktueller Stand des Index, in dem auch neu erstellte oder geänderte Quellen existieren, gleichzeitig aber keine veralteten.

Individuelle Konfigurierung des Suchsystems​

Das Suchsystem selbst kann außerdem individuell konfiguriert werden. Es bietet Anpassungsmöglichkeiten an verschiedene Anforderungen (welche wir weiter unten im Rahmen der Nutzerperspektive genauer erklären). Im Wesentlichen lässt sich durch die Konfigurationsoptionen eines Suchsystems aber erreichen, dass eine Suche auch dann relevante Ergebnisse liefert, wenn die Suchanfrage nicht zu 100 Prozent mit einem Begriff im durchsuchten Dokument übereinstimmt.

User Experience bei einer Suchanfrage

Der vierte Punkt, an dem für Verbesserungen angesetzt werden kann, ist das große Thema User Experience. Denn ebenso wie die Dokumente stammen auch die Suchanfragen nicht aus einem luftleeren Raum. Sie werden vielmehr von Nutzern eingegeben. Nutzer, die individuelle Wünsche und Bedürfnisse haben, wenn sie mit der Suche interagieren. Eine möglichst intuitive Benutzbarkeit der Suche und eine sinnvolle Darstellung der gefundenen Suchergebnisse sind daher ein weiterer wichtiger Baustein auf dem Weg zu einer guten Suche.

Personalisierung der Suche

Damit im Zusammenhang steht auch der fünfte und letzte Ansatzpunkt für Verbesserungen: Personalisierung. Eine gute Suche ist nicht nur für möglichst viele Nutzer intuitiv bedienbar, sondern bezieht auch ein, welche Informationen über den Nutzer bekannt sind: welche Themen interessieren ihn besonders, wo befindet sich der Nutzer und welche Sprache spricht er, um nur einige Beispiele zu nennen. Wenngleich Personalisierung sehr komplex in der Umsetzung werden kann, lohnt es sich, beispielsweise geloggte Daten zum Verhalten der Nutzer zu sammeln und sich diese Daten gezielt zunutze zu machen.

Die Nutzerperspektive bei Suchlösungen

Die Perspektive des Nutzers ist unsere zweite Sicht darauf, wie eine gute Suche aussehen sollte. Der Nutzer ist schließlich die Person, die auf die Seite navigiert, den Suchschlitz anklickt, etwas eintippt, anschließend Ergebnisse präsentiert bekommt und mit diesen Ergebnissen auf verschiedene Weisen interagieren kann. Bei Tests haben sich hier für uns drei Stellschrauben herauskristallisiert, an denen gedreht werden kann, um eine Suche zufriedenstellend für den Nutzer zu gestalten:

1. Nutzerführung:

Mithilfe geeigneter Suchmethoden können Nutzer*innen gezielt zu ihrem Ziel geleitet werden. Zu diesen Methoden gehören eine automatische Vervollständigungsfunktion beim Tippen (Autosuggest), ebenso wie dynamische Filter und Facetten, die bei einer sinnvollen Eingrenzung der Suchergebnismenge unterstützen.

2. Suchergebnismenge:

Je treffsicherer eine Suche im gewünschten Ergebnis resultiert, desto zufriedener sind Nutzer. Daher bieten Suchsysteme wie Apache Solr und Elasticsearch die Möglichkeit, die Menge der Suchergebnisse optimal auf die Bedürfnisse Ihrer Nutzer hin zu konfigurieren, indem sprachliche Varianten ebenso in eine Suchfunktion integriert werden können wie z.B. eine automatische Toleranz bei Tippfehlern. 

3. Ranking:

Da die Aufmerksamkeit und Geduld von Nutzerinnen begrenzt ist, muss eine gute Suche besonders relevante Suchergebnisse auch besonders prominent platzieren. Um das Ranking der Suchergebnisse dahingehend zu optimieren, wenden wir State-of-the-Art-Methoden im Bereich Learning to Rank an.

Was heißt das abschließend für die Suche?

Nun, um zu unserer initialen Frage zurückzukehren, was schiefgehen kann: eine ganze Menge kann bei einer Suche falsch laufen. Das Ergebnis sind frustrierte Nutzer. Damit es so weit gar nicht erst kommt, gilt es schon beim Aufbau einer Suche die Perspektive des Nutzers im Blick zu haben: wie kann ich meine Suche intuitiv gestalten, gute Suchergebnisse erzielen und diese sinnvoll sortieren?

Bei der Umsetzung sollte dann wiederum der Funktionsaufbau eine Rolle spielen. Denn an allen drei Stellschrauben aus der Nutzerperspektive kann durch Maßnahmen an den verschiedenen funktionalen Bausteinen einer Suche gedreht werden.

Datum: 06.06.2023

Autorin

Cornelia Werk

Als Lead Consultant Search berät Cornelia mit ihrem Team Kunden bei Projekten zu intelligenter Suche auf der Basis von TXTWerk und Solr/Elasticsearch. Sie ist studierte Linguistin und hat bereits als Data Analystin fundierte Erfahrungen in den Bereichen intelligente Datenanalyse, KI und Qualitätsmanagement sammeln können.