Q&A: Peter Fairfax, Data Science Manager
Nous nous sommes entretenus avec Peter Fairfax, Data Science Manager chez Brandwatch, pour en savoir plus sur ChatGPT et les grands modèles de langage (LLM) qui sont à l'origine de ces nouveaux développements, ainsi que sur ce que Brandwatch et notre industrie peuvent attendre à l'avenir.
Bonjour Peter, ces développements réalisés à l'aide de ChatGPT sont vraiment passionnants ! Pouvez-vous nous en dire plus sur ChatGPT et son fonctionnement ?
"ChatGPT est un modèle de langage, comme il en existe beaucoup d'autres. En termes simples, un modèle de langage analyse la probabilité que des mots soient écrits, en se basant sur des textes existants qui ont été montrés au modèle. Par exemple, imaginons que nous ayons la phrase suivante : Will Smith aime manger [EXEMPLE].
Un modèle de langage peut comparer la probabilité que [EXEMPLE] soit composé de nombreux mots, tels que spaghettis ou chats. Will Smith n'est pas un psychopathe mangeur de chats, et il y a eu récemment une fascination en ligne pour des vidéos grossières, générées par l'IA, le montrant en train de manger des spaghettis. Un modèle formé à partir de ces données pensera probablement que les spaghettis ont plus de chances d'être mangés que les chats.
Le texte prédictif sur votre téléphone est alimenté par un modèle linguistique simple. Les modèles plus importants peuvent être plus compliqués, mais ce qu'il faut retenir, c'est que les modèles de langage sont alimentés par des probabilités de mots".
Pourquoi ChatGPT est-il si important s'il s'agit simplement d'un autre modèle de langage ?
"Pour plusieurs raisons. Tout d'abord, il s'agit d'un modèle particulièrement grand et sophistiqué. À mesure que les modèles linguistiques deviennent plus grands et sont alimentés par davantage de données, ils tendent à être capables de résoudre des tâches plus complexes. Par exemple, ChatGPT et GPT-4 peuvent écrire du code et répondre à des questions complexes. Des modèles plus grands et plus entraînés peuvent accomplir des tâches plus abstraites et plus compliquées, et nous aider à débloquer d'autres fonctionnalités comme celles que nous lancerons bientôt. Pour moi, la capacité des LLM la plus récente montre que nous sommes sur le point de voir l'IA dépasser l'homme dans certaines tâches linguistiques - comme l'équivalent linguistique de Deep Blue battant le meilleur champion d'échecs humain en 1997.
Unfortunately for machines, this means from now on they’ll probably spend more time answering questions about lost parcels than having fun playing board games, but I’m fine with that.”
Il y a beaucoup de battage médiatique, mais quelles sont les limites ?
"ChatGPT est incroyablement bon dans beaucoup de domaines, mais même la meilleure technologie a des faiblesses. Dans le cas de ChatGPT, il ne dispose pas de connaissances actualisées et a parfois des difficultés avec le calcul.
En outre, l'internet est parfois un endroit sombre et étrange, où les gens partagent toutes sortes d'opinions. Ce matériel peut se retrouver dans les données de formation des LLM, de sorte qu'ils répètent parfois des points de vue que nous trouvons peu recommandables ou erronés.
Comment la technologie de Brandwatch peut-elle travailler avec des LLM plus sophistiqués à l'avenir ?
"Comme je l'ai dit, ces modèles ne sont pas parfaits, mais ils complètent notre technologie.
ChatGPT n'a aucune idée de ce qui se passe en ce moment - ses données de formation s'arrêtent en septembre 2021. Brandwatch Consumer Research (BCR) reçoit jusqu'à 50 000 nouveaux documents par seconde et enrichit chacun d'entre eux avec le sentiment, la localisation, les entités alimentées par GPT et toutes les autres métadonnées en l'espace de quelques minutes.
ChatGPT peut avoir des difficultés avec l'arithmétique, donnant en toute confiance des réponses plausibles mais erronées. En revanche, Brandwatch est conçu pour analyser les données à grande échelle et créer des informations à l'aide de l'IA, de statistiques et d'agrégations complexes. Nos nouvelles fonctionnalités combinent le meilleur de ChatGPT et de Brandwatch, de sorte que vous obtenez des informations quantitatives fiables en direct qui sont encore plus faciles à comprendre pour l'utilisateur.
Un exemple est celui des insights de conversation alimentés par l'IA. Cela vous permet de cliquer sur n'importe quel point de données dans notre tableau de bord, comme des pics ou des segments dans vos données, et maintenant avec le pouvoir de ChatGPT de résumer de grandes quantités de texte, vous obtiendrez une vue d'ensemble succincte, en langage naturel, de ce qui est à l'origine de la tendance.
De manière plus générale, je m'attends à ce que nous assistions à une évolution vers des fonctionnalités de type chatbot pour les utilisateurs non experts, permettant aux gens d'interagir avec toutes nos données sans avoir besoin de connaître toutes les astuces pour tirer des enseignements du bruit. En coulisses, cela nécessitera d'expliquer davantage d'informations sous forme de texte, et j'espère vraiment que cela aura pour effet secondaire d'améliorer l'accessibilité pour les personnes aveugles et malvoyantes".
Quel sera l'impact des LLMs sur l'avenir de notre secteur ?
"Il est impossible d'anticiper, mais je dirais d'emblée : davantage de modes d'interaction, une combinaison transparente de l'IA numérique et des modèles de langage, et la promotion de la créativité humaine.
Nous devrions être en mesure de mettre l'écoute sociale à la disposition d'un plus grand nombre de personnes et de nous appuyer sur des technologies telles que la recherche alimentée par l'IA. C'est une bonne chose qu'il ne soit plus nécessaire d'être un expert en booléen pour écrire des requêtes, mais les nouveaux LLM permettront également de synthétiser des informations et de raconter des histoires plus rapidement et plus facilement.
Les statistiques auront toujours un rôle clé à jouer, et le monde de l'IA au-delà des modèles de langage. Ils continueront à être l'épine dorsale de l'analyse et de la surveillance en temps réel, ainsi que des prédictions à long terme, et ils s'articuleront plus étroitement avec les modèles de langage.
ChatGPT et d'autres LLM sont capables de produire des contenus à consonance humaine de manière extrêmement efficace et continueront à s'améliorer. Les entreprises qui ont le plus bel avenir à long terme sont celles qui écoutent attentivement leurs utilisateurs et réfléchissent de manière créative aux problèmes fondamentaux qui peuvent être résolus par l'IA, ainsi qu'aux parties du travail que les utilisateurs veulent passer moins de temps à faire.
Il y aura des risques en cours de route, et nous ne devrions pas nous laisser emporter par le battage médiatique au point d'oublier nos normes éthiques et scientifiques. En tant que scientifiques des données, nous avons des obligations éthiques en matière d'exactitude et de robustesse. Mais il y aura aussi beaucoup de sérendipité, et je suis vraiment excité à l'idée de voir quels trucs géniaux nous sommes maintenant capables de construire, et qui nous pouvons aider en cours de route".