Q&A: Peter Fairfax, Data Science Manager
Wir sprachen mit Brandwatch Data Science Manager Peter Fairfax, um mehr über ChatGPT und Large Language Models (LLMs) zu erfahren, die hinter diesen neuen Entwicklungen stehen und was Brandwatch und unsere Branche in Zukunft erwarten können.
Hallo Peter, diese Neuentwicklungen, die mit ChatGPT realisiert werden, sind wirklich spannend! Kannst du uns mehr über ChatGPT erzählen und wie es funktioniert?
"ChatGPT ist ein Sprachmodell, und es gibt noch viele andere auf dem Markt. Vereinfacht gesagt, analysiert ein Sprachmodell die Wahrscheinlichkeit von Wörtern, die geschrieben werden, basierend auf vorhandenen Texten, die dem Modell gezeigt wurden. Stellen wir uns zum Beispiel den Satz vor: Will Smith isst gerne [BLANK].
Ein Sprachmodell kann die Wahrscheinlichkeit vergleichen, dass es sich bei [BLANK] um viele Wörter handelt, z. B. um Spaghetti oder Katzen. Will Smith ist kein katzenfressender Psychopath, und im Internet gibt es seit kurzem eine Faszination für krude, KI-generierte Videos, in denen er Spaghetti isst. Ein Modell, das auf diese Daten trainiert wurde, wird wahrscheinlich denken, dass Spaghetti wahrscheinlicher sind als Katzen.
Die Textvorhersage auf Ihrem Telefon wird von einem einfachen Sprachmodell unterstützt. Größere Modelle können komplizierter sein, aber das Wichtigste ist, dass Sprachmodelle durch Wortwahrscheinlichkeiten angetrieben werden."
Warum ist ChatGPT so ein großes Ding, wenn es doch nur ein weiteres Sprachmodell ist?
"Aus mehreren Gründen. Erstens ist es ein besonders großes und anspruchsvolles System. Je größer LLMs werden und mit mehr Daten gefüttert werden, desto komplexere Aufgaben können sie lösen. ChatGPT und GPT-4 können zum Beispiel Code schreiben und komplexe Fragen beantworten. Größere Modelle mit mehr Training können abstraktere und kompliziertere Aufgaben lösen und uns dabei helfen, weitere Funktionen freizuschalten, wie die, die wir bald einführen werden.
Für mich zeigt die Leistungsfähigkeit der jüngsten LLMs, dass wir an der Schwelle zu einer KI stehen, die den Menschen bei bestimmten sprachbasierten Aufgaben überholt - sozusagen das sprachliche Äquivalent zum Sieg von Deep Blue über den besten menschlichen Schachmeister im Jahr 1997.
Leider bedeutet dies für die Maschinen, dass sie von nun an wahrscheinlich mehr Zeit mit der Beantwortung von Fragen zu verlorenen Paketen verbringen werden, als mit dem Spielen von Brettspielen, aber damit habe ich kein Problem."
Der Hype ist groß, aber wo sind die Grenzen?
"ChatGPT ist in vielen Dingen erstaunlich gut, aber auch die beste Technik hat Schwächen. Im Fall von ChatGPT ist das Wissen nicht auf dem neuesten Stand, und manchmal hat es Probleme mit der Rechenleistung.
Darüber hinaus kann das Internet manchmal ein dunkler und seltsamer Ort sein, an dem Menschen alle möglichen Ansichten teilen. Dieses Material kann in die Ausbildungsdaten von LLMs einfließen, so dass sie manchmal Ansichten nachplappern, die wir für unappetitlich oder falsch halten."
Wie kann die Brandwatch-Technologie in Zukunft mit anspruchsvolleren LLMs zusammenarbeiten?
"Wie ich schon sagte, sind diese Modelle nicht perfekt, aber sie ergänzen unsere Technologie.
ChatGPT hat keine Ahnung, was im Moment passiert - seine Trainingsdaten sind ab September 2021 gesperrt. BCR nimmt bis zu 50.000 neue Dokumente pro Sekunde auf und reichert sie innerhalb weniger Minuten mit Sentiment, Standort, GPT-gestützten Entitäten und allen anderen Metadaten an.
ChatGPT kann mit arithmetischen Problemen zu kämpfen haben und selbstbewusst plausible, aber falsche Antworten geben. Im Gegensatz dazu ist Brandwatch darauf ausgelegt, Daten in großem Umfang zu analysieren und mithilfe von KI, Statistiken und komplexen Aggregationen Erkenntnisse zu gewinnen.
Unsere neuen Funktionen vereinen das Beste von ChatGPT und Brandwatch, so dass Sie verlässliche quantitative Live-Einblicke erhalten, die für den Nutzer noch einfacher zu verstehen sind. Ein Beispiel sind die KI-gestützten Konversationseinblicke. Damit können Sie auf jeden beliebigen Datenpunkt in unserem Dashboard klicken, z. B. auf Peaks oder Segmente innerhalb Ihrer Daten, und jetzt erhalten Sie dank der Fähigkeit von ChatGPT, große Textmengen zusammenzufassen, einen prägnanten, natürlichsprachlichen Überblick darüber, was den Trend verursacht.
Generell erwarte ich, dass wir eine Entwicklung hin zu mehr Chatbot-ähnlichen Funktionen für Nicht-Experten sehen werden, die es den Menschen ermöglichen, mit all unseren Daten zu interagieren, ohne dass sie alle Tricks kennen müssen, um Erkenntnisse aus dem Rauschen zu ziehen. Hinter den Kulissen wird dies bedeuten, dass mehr Informationen in Textform erklärt werden müssen, und ich hoffe wirklich, dass ein Nebeneffekt davon die Verbesserung der Zugänglichkeit für blinde und sehbehinderte Menschen sein wird."
Wie werden sich LLMs auf die Zukunft unserer Branche auswirken?
"Es ist unmöglich, das wirklich vorauszusehen, aber aus dem Stehgreif würde ich sagen: mehr Interaktionsmöglichkeiten, nahtlose Kombination von numerischer KI mit Sprachmodellen und Förderung der menschlichen Kreativität.
Wir sollten in der Lage sein, Social Listening für mehr Menschen zugänglich zu machen und auf Technologien wie KI-gestützte Suche aufzubauen. Es ist großartig, dass man kein Experte in Boolescher Sprache mehr sein muss, um Abfragen zu schreiben, aber neue LLMs werden auch die Synthese von Erkenntnissen und das Erzählen von Geschichten schneller und einfacher machen.
Die Statistik wird immer eine Schlüsselrolle spielen, und die Welt der KI wird über Sprachmodelle hinausgehen. Sie werden weiterhin das Rückgrat für Echtzeitanalysen und -überwachung sowie für langfristige Vorhersagen bilden, und diese werden enger mit Sprachmodellen verzahnt sein. ChatGPT und andere LLMs sind in der Lage, extrem gut klingende Inhalte zu produzieren, und werden sich weiter verbessern. Die Unternehmen mit der besten langfristigen Zukunft sind diejenigen, die ihren Nutzern genau zuhören und kreativ über die Kernprobleme nachdenken, die durch KI gelöst werden können, sowie darüber, welche Teile der Arbeit die Nutzer weniger Zeit aufwenden möchten.
Auf dem Weg dorthin wird es Risiken geben, und wir sollten uns nicht so sehr von dem Hype anstecken lassen, dass wir unsere ethischen und wissenschaftlichen Standards vergessen.
Als Datenwissenschaftler haben wir eine ethische Verpflichtung zu Genauigkeit und Robustheit. Aber es wird auch viel Glück dabei sein, und ich bin wirklich gespannt, was für coole Sachen wir jetzt bauen können und wem wir dabei helfen können."