Hinter Search, dem neuesten Feature von Brandwatch, verbirgt sich eine ziemlich beeindruckende Funktionsweise.

Genau wie bei der Google Suche können Nutzer einen Begriff eingeben, nach dem sie suchen möchten (z. B. eine Marke, Produkt, Ereignis usw.) und Brandwatch vervollständigt automatisch potenzielle Suchen.

Ich war fasziniert, als ich es zum ersten Mal ausprobierte. Als jemand, der Hunderte Stunden mit dem Schreiben von Queries verbringt, konnte ich sofort sehen, wie viel Zeit ich und unsere Kunden mit diesem Feature sparen können.

Ich wollte mehr über die Technologie erfahren, also sprach ich mit demjenigen, der es entworfen hat: Brandwatch Chief Data Scientist Aykut Firat.

Kurz zu dir, Aykut: Was ist dein Vorgeschichte?

Ich arbeite derzeit als Chief Data Scientist bei Brandwatch. Ich beschäftige mich mit NLP und Bildverarbeitungsproblemen, indem ich Deep-Learning-Techniken anwende. Zuvor habe ich für Startups gearbeitet und mich auf die intelligente Informationsintegration, evolutionäre Algorithmen und KI fokussiert, einschließlich einer KI, die ich mit meinem Berater während meiner Disseration am MIT mitgründete.

Search nutzt etwas, das sich „Entity Disambiguation“ nennt. Was ist das?

Entity Disambiguation extrahiert Einheiten in Texten und verbindet diese mit Einheiten basierend auf einer eindeutigen Wissensgrundlage. Diese Wissensgrundlage hier ist Wikipedia.

Damit können Milliarden von verschiedenen Gesprächen, die online stattfinden, durchsucht und diese zu Einheiten gruppiert werden. Eine Einheit kann eine Marke, Person, Ereignis und sogar ein breitgefasstes Thema, wie etwa Radfahren oder Cybersicherheit, sein.

Welches Problem löst Entity Disambiguation?

In Brandwatch nach mehrdeutigen Begriffen zu suchen ist nicht einfach. Wenn Sie z. B. nach dem Unternehmen Apple suchen, erhalten sie möglicherweise auch ungewünschte Ergebnisse rund um Apfelkuchen. Mit Entity Disambiguation sammeln wir nur die Einheiten, die Sie möchten und reduzieren die ungewünschten Ergebnisse.

Und wie funktioniert Entity Disambiguation?

Aus der Sicht des Nutzers ist es sehr einfach. Er wählt einfach die Einheit, an der er interessiert ist, aus einer Liste aus und erhält die Ergebnisse.

Technisch gesehen besteht es aus vier großen Komponenten:

  1. Die Wörter und Ausdrücke extrahieren, die auf Einheiten in Texten hinweisen
  2. Mithilfe des Kontexts im Text werden diesen Wörtern und Ausdrücken Eigenschaften zugeordnet
  3. Einheiten werden basierend auf einer Wissensbank mit kontextbezogenen Eigenschaften verbunden
  4. Und werden danach einer Suche zugeordnet

Kannst du dazu ein konkretes Beispiel geben?

Sehen wir uns diese Erwähnung an: „Blackberry is about safety, and Apple is about user experience”

Wir identifizieren Blackberry und Apple als Wörter von Bedeutung, die auf Einheiten in Wikipedia hinweisen. Als Mensch geben „Safety“ und „User Experience“ Hinweise über den Kontexts des Statements.

Ähnlich extrahiert unsere KI-basierte Disambiguation Engine automatisch die Bedeutung, die sich hinter einem Text verbirgt. Unsere KI erkennt, dass „slam dunk“ mit „Michael Jordan“ zu tun hat, auch wenn beide Begriffe nicht im selben Post auftauchen.

Wenn Sie nach Apple, dem Unternehmen, oder Apple Phone suchen, werden gespeicherte Einheiten und eingegebene Texteigenschaften greifen und die oben erwähnte Erwähnung wird als Ergebnis geliefert.

Man könnte sagen, es ist eine Verbesserung zum normalen Query Schreiben?

Beim normalen Query Schreiben versuchen wir häufig, mit zusätzlichen Begriffen (z. B. Phone OR iPhone OR Mac OR…), der Suche Kontext zu verleihen. Es ist ein schwieriger, unvollständiger und manchmal unmöglicher Prozess.

Zum Beispiel kann die Präposition „to“ oder ein Possessivpronom „my“ zwischen einem Ort und Autobegriffen einen entscheidenden Unterschied ausmachen, z. B.: „I like to drive to Malibu“ und „I like to drive my Malibu“. Viele von uns stossen auf Schwierigkeiten beim Query Schreiben, aber mit Search übernimmt eine clevere KI die schwere Arbeit.

In vielen Fällen wird es das normale Query Schreiben massiv verbessern, da die Suche mehr relevante und genauere Ergebnisse liefert, als eine Suchanfrage, die nur von einem Menschen geschrieben wurde.

Worauf sollten Nutzer achten, wenn sie Search anwenden?

Es gibt einige Dinge, worauf Nutzer achten sollten. Search ist eine ganz neue Innovation von Brandwatch und an ihr wird immer noch gearbeitet. Das bedeutet, dass es in Zukunft einige Updates geben wird, und die Funktion ist jetzt wahrscheinlich noch nicht perfekt. Search funktioniert für einige Fälle besser als für andere.

Wenn z. B. zwei sehr ähnliche Marken auf das gleiche Wort zutreffen könnten, dann macht das System vielleicht mehr Fehler. Wenn der Kontext von verschiedenen Bedeutungen sich nicht so sehr ähnelt, dann sind die Ergebnisse akkurater. Es ist außerdem wichtig zu wissen, dass die Entity Disambiguation von Search bisher nur auf der englischen Sprache basiert.

Was steht als nächstes für Search an?

Wir arbeiten eifrig dran, Updates zu liefern. Eines der großen Projekte, an dem wir arbeiten, ist mehr Sprachen als Englisch abzudecken.

Vielen Dank an Aykut, dass er sich Zeit für das Interview genommen hat.

Wenn Sie an Search interessiert sind, klicken Sie hier, um eine Demo anzufragen. Wenn Sie bereits Kunde sind, können Sie Search ohne Zusatzkosten ab sofort nutzen.