Hablamos con Peter Fairfax, Data Science Manager en Brandwatch
Hemos hablado con Peter Fairfax, Data Science Manager de Brandwatch, para saber más sobre ChatGPT y los grandes modelos de lenguaje (LLM) que están detrás de estos nuevos desarrollos, y sobre lo que Brandwatch y nuestro sector pueden esperar en el futuro.
Hola, Peter, estos desarrollos que se están llevando a cabo utilizando ChatGPT son realmente fascinantes ¿Puedes darnos más información sobre ChatGPT y cómo funciona?
“ChatGPT es un modelo de lenguaje, y hay otros muchos en el mercado. En pocas palabras, un modelo de lenguaje analiza la probabilidad de que se redacten palabras, basándose en los textos existentes que ya le han sido mostrados al modelo.
Por ejemplo, imagina que tenemos esta oración: A Will Smith le gusta comer [EN BLANCO].
Un modelo de lenguaje puede comparar la probabilidad de que [EN BLANCO] corresponda a muchas palabras, como espaguetis o gatos.
Will Smith no es un psicópata comegatos, y recientemente ha surgido en Internet una gran fascinación por vídeos grotescos generados con inteligencia artificial en los que aparece comiendo espaguetis.
Un modelo entrenado con esos datos probablemente pensará que los espaguetis tienen más probabilidades que los gatos.
El texto predictivo de tu móvil lo genera un modelo de lenguaje simple. Los modelos más grandes suelen ser más complicados, pero lo importante es recordar que los modelos de lenguaje se basan en las probabilidades de las palabras".
¿Por qué ChatGPT supone un gran problema si no es más que otro modelo de lenguaje?
“Por varias razones. En primer lugar, es especialmente grande y complejo. A medida que los LLM se amplían y reciben más datos, tienden a ser capaces de resolver tareas más complejas.
Por ejemplo, ChatGPT y GPT-4 pueden escribir código y responder a preguntas complejas. Los modelos más grandes y con más entrenamiento pueden llevar a cabo tareas más abstractas y complicadas, y ayudarnos a desbloquear más funciones como las que vamos a lanzar próximamente.
En mi opinión, la capacidad de los LLM más recientes demuestra que estamos a punto de que la IA supere a los humanos en determinadas tareas lingüísticas, algo así como el equivalente lingüístico de Deep Blue cuando venció al mejor campeón humano de ajedrez en 1997.
Por desgracia para las máquinas, esto significa que a partir de ahora pasarán, probablemente, más tiempo respondiendo preguntas sobre paquetes perdidos que divirtiéndose con juegos de mesa, pero me parece bien".
Se le ha dado mucho bombo, pero ¿cuáles son sus limitaciones?
"ChatGPT es increíblemente bueno en muchas cosas, pero incluso la mejor tecnología tiene puntos débiles.
En el caso de ChatGPT, no dispone de información actualizada, tiene dificultades con los números y a veces hace afirmaciones que suenan convincentes pero que son incorrectas.
Además, internet puede ser a veces un lugar sombrío y desconocido, en el que la gente comparte todo tipo de opiniones.
Este material puede acabar formando parte de los datos de entrenamiento de los LLM, por lo que a veces repiten como loros opiniones que nos resultan desacertadas o incorrectas".
¿Cómo podrá la tecnología de Brandwatch trabajar junto a LLM más sofisticados en el futuro?
“Como he dicho, estos modelos no son perfectos pero complementan nuestra tecnología.
ChatGPT no tiene ni idea de lo que está ocurriendo ahora mismo, está actualizado con datos de hasta septiembre de 2021. BCR recibe hasta 50 000 documentos nuevos por segundo y los enriquece con el sentimiento, la ubicación, las entidades potenciadas por GPT y el resto de metadatos en cuestión de minutos.
ChatGPT puede tener problemas con la aritmética y dar con confianza respuestas convincentes pero erróneas.
En cambio, Brandwatch está diseñado para analizar datos a gran escala y crear insights mediante IA, estadísticas y agregaciones complejas.
Con nuestras nuevas funciones integramos lo mejor de ChatGPT y Brandwatch, para que dispongas de insights cuantitativos en directo y fiables, aún más fáciles de entender para un usuario.
Un ejemplo son los insights de conversación potenciados por IA. Esto te permite hacer clic en cualquier punto de datos de nuestro dashboard, como picos o segmentos dentro de tus datos y ahora, gracias a la función de ChatGPT para resumir grandes cantidades de texto, obtendrás una visión general breve y en lenguaje natural de lo que está originando la tendencia.
En términos más generales, espero que veamos una tendencia hacia una funcionalidad más parecida a la de los chatbots para usuarios no expertos, que permita a la gente interactuar con todos nuestros datos sin necesidad de conocer todos los trucos para extraer insights del ruido.
En segundo plano, esto supondrá tener que explicar más información en forma de texto, y espero de verdad que uno de los efectos secundarios sea mejorar la accesibilidad para las personas ciegas y con baja visión".
¿Cómo afectarán los LLM al futuro de nuestro sector?
"Es imposible preverlo con exactitud, pero lo primero que se me ocurriría sería: más modos de interacción, combinar a la perfección la IA numérica con los modelos de lenguaje y fomentar la creatividad humana.
Deberíamos ser capaces de poner el social listening al alcance de más personas y basarnos en tecnologías como la búsqueda potenciada por IA.
Es genial que ya no necesites ser un experto en booleano para escribir consultas, pero los nuevos LLM también harán que sintetizar insights y contar historias sea más rápido y fácil.
La estadística y el mundo de la IA, más allá de los modelos de lenguaje, siempre tendrán un papel clave.
Estos seguirán siendo el eje central que impulse el análisis y el seguimiento en tiempo real, así como las predicciones a largo plazo, y se integrarán cada vez más en los modelos de lenguaje.
ChatGPT y otros LLM son capaces de producir extremadamente bien contenido que suene humano y seguirán mejorando.
Las empresas con mayor proyección de futuro a largo plazo son las que escuchan atentamente a sus usuarios y piensan de forma creativa en los problemas fundamentales que podría resolver la IA, además de las partes del trabajo a las que los usuarios quieren dedicar menos tiempo.
Correremos riesgos en el proceso y no tenemos que dejarnos llevar por el revuelo hasta el punto de olvidar nuestros principios éticos y científicos.
Como especialistas en datos, tenemos obligaciones éticas en cuanto a la precisión y la fiabilidad. Pero también dejaremos gran parte al azar, y me hace especial ilusión ver qué cosas interesantes podemos construir ahora y a quién podemos ayudar en el camino".