¿Qué es la IA generativa? ¿Cómo funciona?

Greg Pavlik | Vicepresidente sénior de Oracle Cloud Infrastructure | 15 de septiembre de 2023

La inteligencia artificial generativa es una forma relativamente nueva de IA que, a diferencia de sus predecesoras, puede crear contenido nuevo extrapolando sus datos de entrenamiento. Su extraordinaria capacidad para producir texto, imágenes, audio y vídeo similares a los creados por humanos ha llamado la atención del mundo desde que el primer chatbot de IA generativa fuera lanzado al público en otoño de 2022. Un informe de junio de 2023 de McKinsey & Company estimaba que la IA generativa podría suponer entre 6,1 y 7,9 billones de dólares adicionales al año para la economía global al incrementar la productividad de los trabajadores. Para poner este dato en contexto, el mismo estudio fija en 17,1 a 25,6 billones de dólares el potencial económico anual de este incremento de productividad gracias al conjunto de las tecnologías de IA. Así que, aunque a mediados de 2023 la IA generativa se lleve toda la atención, es solo una parte del pastel de la IA.

Pero cada acción genera una reacción igual y opuesta. Junto con sus notables perspectivas de productividad, la IA generativa conlleva nuevos riesgos comerciales potenciales, como inexactitudes, violaciones de la privacidad y exposición de la propiedad intelectual, así como capacidades de disrupción económica y social a gran escala. Por ejemplo, es poco probable que los beneficios de productividad de la IA generativa se puedan aprovechar sin esfuerzos sustanciales de formación de los trabajadores y, aun así, sin duda, se destruirán muchos empleos actuales. En consecuencia, legisladores de todo el mundo e incluso algunos ejecutivos de la industria tecnológica están abogando por la adopción rápida de regulaciones en materia de IA.

Este artículo es una exploración en profundidad de las promesas y los peligros de la IA generativa: cómo funciona, sus aplicaciones, casos de uso y ejemplos más inmediatos, sus limitaciones, sus beneficios y riesgos comerciales potenciales, buenas prácticas para su uso y una visión de su futuro.

¿Qué es la IA generativa?

La IA generativa (GAI, por sus siglas en inglés) es el nombre atribuido a un subconjunto de tecnologías de machine learning mediante IA que recientemente han desarrollado la capacidad de crear contenido rápidamente en respuesta a consultas de texto que pueden ir de cortas y simples a muy largas y complejas. Diferentes herramientas de IA generativa son capaces de producir nuevos contenidos de audio, imagen y vídeo, pero es la IA conversacional orientada al texto la que ha disparado la imaginación del público. De hecho, las personas pueden conversar y aprender de modelos de IA generativa entrenados con texto de la misma manera que lo hacen con humanos.

La IA generativa cautivó al mundo en los meses posteriores al lanzamiento el 30 de noviembre de 2022 de ChatGPT, un chatbot basado en el modelo de red neuronal GPT-3.5 de OpenAI. GPT significa transformer preentrenado generativo, palabras que describen principalmente la arquitectura de red neuronal subyacente del modelo.

Existen muchos ejemplos anteriores de chatbots conversacionales, comenzando por ELIZA, del Instituto de Tecnología de Massachusetts, a mediados de la década de 1960. Pero la mayoría de los bots conversacionales previos, incluido ELIZA, funcionaban total o ampliamente mediante reglas, por lo que carecían de comprensión del contexto. Sus respuestas se limitaban a un juego de reglas y plantillas predefinidas. Por el contrario, los modelos de IA generativa que emergen ahora no cuentan con reglas ni plantillas predefinidas. Metafóricamente hablando, son cerebros primitivos y en blanco (redes neuronales) expuestos al mundo a través del entrenamiento con datos del mundo real. Luego desarrollan de forma independiente una inteligencia, esto es, un modelo representativo de cómo funciona ese mundo, que utilizan para generar contenido novedoso en respuesta a consultas. Ni los expertos en IA saben exactamente cómo lo hacen, ya que los algoritmos se desarrollan y ajustan a medida que se entrena el sistema.

Empresas de todos los tamaños deberían estar entusiasmadas con el potencial de la IA generativa para llevar los beneficios de la automatización tecnológica al trabajo del conocimiento, que hasta ahora se había resistido en gran medida a esta tendencia. Las herramientas de IA generativa cambian las perspectivas de automatización del trabajo del conocimiento; su capacidad para producir texto, imágenes, audio o vídeo similares a los que crean los humanos en respuesta a consultas de texto en lenguaje simple significa que pueden colaborar con las personas para generar contenido equivalente a trabajo práctico.

"En los próximos años, muchas empresas van a entrenar sus propios grandes modelos de lenguaje especializados", afirmó Larry Ellison, presidente y director de tecnología de Oracle, durante la presentación de resultados de la compañía en junio de 2023.

IA generativa frente a IA

La inteligencia artificial es un área muy amplia de la informática, de la cual la IA generativa es una pequeña parte, al menos en la actualidad. Naturalmente, la IA generativa comparte muchos atributos con la IA tradicional. Pero también hay algunas distinciones clave.

  • Atributos comunes: ambas requieren grandes cantidades de datos para el entrenamiento y la toma de decisiones (aunque los volúmenes de datos necesarios para el entrenamiento de la IA generativa pueden ser órdenes de magnitud mayores). Ambas aprenden patrones de los datos y utilizan ese "conocimiento" para realizar predicciones y adaptar su propio comportamiento. Asimismo, ambas se pueden mejorar con el tiempo ajustando sus parámetros en función de la retroalimentación o de información nueva.
  • Diferencias: los sistemas de IA tradicionales suelen estar diseñados para llevar a cabo una tarea específica de forma más adecuada o a un coste menor que un ser humano, como detectar el fraude con tarjetas de crédito, determinar rutas de conducción o, dentro de poco, conducir. La IA generativa es más amplia: crea contenido nuevo y original que se asemeja a sus datos de entrenamiento, pero no se puede encontrar en ellos. Además, los sistemas de IA tradicionales, como los de machine learning, se entrenan principalmente con datos específicos ligados a su función prevista, mientras que los modelos de IA generativa se entrenan con conjuntos de datos grandes y variados (y a veces se ajustan con volúmenes de datos mucho más pequeños vinculados a una función específica). Por último, la IA tradicional casi siempre se entrena con datos etiquetados/categorizados utilizando técnicas de aprendizaje supervisado, mientras que la IA generativa siempre debe entrenarse, al menos inicialmente, utilizando aprendizaje no supervisado (en el que los datos no están etiquetados y el software de IA no tiene una guía explícita).

Otra diferencia que vale la pena señalar es que el entrenamiento de modelos fundamentales para la IA generativa es "obscenamente caro", citando a un estudioso de la IA. Digamos, 100 millones de dólares solo por el hardware necesario para comenzar, así como los costes equivalentes de servicios en la nube, ya que ahí es donde se realiza la mayor parte del desarrollo de la IA. A ello se añade el coste de los volúmenes de datos monumentalmente grandes que se requieren.

Conclusiones clave

  • La IA generativa se convirtió en una sensación viral en noviembre de 2022 y se espera que pronto agregue billones de dólares a la economía global anualmente.
  • La IA es una forma de machine learning basada en redes neuronales y entrenada con grandes conjuntos de datos que pueden crear contenido novedoso de texto, imagen, vídeo o audio en respuesta a las solicitudes en lenguaje natural de los usuarios.
  • Los investigadores de mercado predicen que esta tecnología generará un impulso económico al acelerar drásticamente el incremento de productividad de los trabajadores del conocimiento, cuyas tareas se resistían antes a la automatización.
  • La IA generativa conlleva riesgos y limitaciones que las empresas deben mitigar, como producir información incorrecta o falsa o violar inadvertidamente derechos de autor.
  • También se espera que cause cambios significativos en la naturaleza del trabajo, con posibles pérdidas de empleo y reestructuraciones de funciones.

¿En qué consiste la IA generativa?

Tanto para empresas grandes como pequeñas, la promesa aparentemente mágica de la IA generativa es llevar los beneficios de la automatización mediante tecnología al trabajo del conocimiento. O, como señala un informe de McKinsey, "[a las] actividades que implican toma de decisiones y colaboración, que anteriormente tenían el menor potencial de automatización".

Históricamente, la tecnología ha sido más eficaz automatizando tareas rutinarias o repetitivas en las que las decisiones ya se conocían o podían determinarse con un alto nivel de confianza mediante reglas específicas y comúnmente aceptadas. Pensemos en la fabricación, con su repetición precisa en la cadena de montaje, o la contabilidad, con sus principios regulados establecidos por las asociaciones del sector. Pero la IA generativa tiene capacidad para llevar a cabo tareas cognitivas mucho más sofisticadas. Por citar un ejemplo ciertamente extremo, durante un periodo de disrupción en la industria, la IA generativa podría ayudar a definir la estrategia de una organización respondiendo a las solicitudes de ideas y escenarios alternativos de sus responsables.

En su informe, McKinsey evaluó 63 casos de uso en 16 funciones empresariales y concluyó que el 75 % de los billones de dólares de valor potencial que podrían obtenerse de la IA generativa provendrán de un subconjunto de casos de uso en solo cuatro de esas funciones: operaciones de clientela, marketing y ventas, ingeniería de software e investigación y desarrollo. En todos los sectores, las perspectivas de incremento de los ingresos se distribuyeron de manera más uniforme, aunque algunos se destacaron: la alta tecnología encabezó la lista en términos de impulso potencial en porcentaje de los ingresos de la industria, seguida por la banca, las industrias farmacéutica y de productos médicos, la educación, las telecomunicaciones y la atención médica.

Por otra parte, un análisis de Gartner coincidió con las predicciones de McKinsey: afirmaba, por ejemplo, que para 2025 más del 30 % de los nuevos fármacos y materiales se descubrirán utilizando técnicas de IA generativa, frente a cero hoy en día, y que, del mismo modo, en 2025 el 30 % de los mensajes de marketing saliente de las grandes organizaciones se generarán sintéticamente, frente al 2 % en 2022. Asimismo, en una encuesta en línea, Gartner descubrió que la experiencia del cliente y la retención eran la respuesta mayoritaria (un 38 %) de los 2500 ejecutivos a los que se les preguntó en qué áreas estaban invirtiendo en IA generativa sus organizaciones.

Lo que hace posible que todo esto suceda tan rápido es que, a diferencia de la IA tradicional, que lleva décadas automatizando silenciosamente y agregando valor a procesos comerciales, la IA generativa se dio a conocer al mundo gracias al talento conversacional similar al humano de ChatGPT. Esto también ha arrojado luz y puesto la atención de la gente en la tecnología de IA generativa dedicada a otras áreas: todo el mundo parece estar experimentando en la creación de texto, música, imágenes y vídeos utilizando uno o más de los diversos modelos que se especializan en cada uno de estos ámbitos. Por lo tanto, como muchas organizaciones ya están experimentando con la IA generativa, es probable que su impacto en los negocios y la sociedad sea inmenso y se produzca extraordinariamente rápido.

La desventaja obvia es que el trabajo del conocimiento cambiará. Los roles específicos cambiarán, a veces significativamente, por lo que los trabajadores tendrán que aprender nuevas competencias. Algunos trabajos desaparecerán. Sin embardo, históricamente, los grandes cambios tecnológicos como la IA generativa siempre han creado más empleo (y de mayor valor) del que destruyen. Pero esto es poco reconfortante para aquellos cuyo trabajo se elimina.

¿Cómo funciona la IA generativa?

Hay dos respuestas a la pregunta de cómo funcionan los modelos de IA generativa. Empíricamente, sabemos cómo funcionan en detalle porque los humanos diseñaron sus diversas implementaciones de red neuronal para hacer exactamente lo que hacen, iterando esos diseños durante décadas para hacerlos cada vez mejores. Los desarrolladores de IA saben exactamente cómo están conectadas las neuronas, ya que diseñaron el proceso de entrenamiento de cada modelo. Sin embargo, en la práctica, nadie sabe exactamente cómo los modelos de IA generativa hacen lo que hacen, esa es la incómoda verdad.

"No sabemos cómo hacen la tarea creativa real porque lo que sucede dentro de las capas de la red neuronal es demasiado complejo para que lo podamos descifrar, al menos hoy por hoy", indica Dean Thompson, exdirector de tecnología de múltiples startups de IA que han sido adquiridas por grandes empresas a lo largo de los años, como LinkedIn y Yelp, donde sigue trabajando como ingeniero de software sénior, centrando su labor en los grandes modelos de lenguaje (LLM). La capacidad de la IA generativa para producir nuevos contenidos originales parece ser una propiedad emergente de lo que se conoce, es decir, su estructura y su entrenamiento. Por lo tanto, si bien hay mucho que explicar frente a lo que sabemos, lo que un modelo como GPT-3.5 está haciendo internamente, lo que está pensando, si se quiere, aún queda por descubrir. Algunos investigadores de IA confían en que esto se dará a conocer en los próximos 5 a 10 años, otros no están seguros de que se llegue a entender completamente nunca.

A continuación se muestra una visión general de lo que sabemos sobre cómo funciona la IA generativa:

  • Todo empieza por el cerebro. Un buen lugar para comenzar a comprender los modelos de IA generativa es el cerebro humano, dice Jeff Hawkins en su libro de 2004, Sobre la inteligencia. Hawkins, ingeniero informático, neurobiólogo y empresario, presentó su trabajo en una sesión de 2005 en PC Forum, una conferencia anual de ejecutivos de tecnología líderes patrocinada por la inversora tecnológica Esther Dyson. Hawkins planteó la hipótesis de que, a nivel neuronal, el cerebro funciona mediante la predicción continua de lo que va a suceder a continuación y luego aprende de las diferencias entre sus predicciones y la realidad posterior. Para mejorar su capacidad predictiva, el cerebro construye una representación interna del mundo. En su teoría, la inteligencia humana emerge de ese proceso. Ya sea bajo la influencia de Hawkins o no, la IA generativa funciona exactamente de esta manera. Y, sorprendentemente, actúa como si fuera inteligente.

  • Construir una red neuronal artificial. Todos los modelos de IA generativa comienzan con una red neuronal artificial codificada en software. Thompson afirma que una buena metáfora visual de una red neuronal es imaginar una hoja de cálculo familiar, pero en tres dimensiones porque las neuronas artificiales se apilan en capas, de la misma forma que las neuronas reales se apilan en el cerebro. Los investigadores de IA llaman incluso a cada neurona "célula", señala Thompson, y cada célula contiene una fórmula que la relaciona con otras células de la red, imitando la forma en que las conexiones entre las neuronas cerebrales presentan diferentes fortalezas.

    Cada capa puede albergar decenas, cientos o miles de neuronas artificiales, pero el número de neuronas no es en lo que se centran los investigadores de IA. En cambio, miden los modelos por el número de conexiones entre las neuronas. Las fortalezas de estas conexiones varían en función de los coeficientes de sus ecuaciones celulares, que generalmente se llaman "ponderaciones" o "parámetros". Estos coeficientes que definen la conexión son a lo que se hace referencia cuando se lee, por ejemplo, que el modelo GPT-3 tiene 175 000 millones de parámetros. Se rumorea que la última versión, GPT-4, suma billones de parámetros, aunque esto queda por confirmar. Existe un puñado de arquitecturas de redes neuronales con características diferentes que se prestan a producir contenido en una modalidad particular; la arquitectura del transformer parece ser la mejor para los grandes modelos de lenguaje, por ejemplo.

  • Enseñar al modelo de red neuronal recién creado. Los grandes modelos de lenguaje reciben enormes volúmenes de texto que deben procesar y se les encomienda la tarea de hacer predicciones simples, como la siguiente palabra de una secuencia o el orden correcto de un conjunto de oraciones. En la práctica, sin embargo, los modelos de red neuronal funcionan en unidades llamadas tokens, no palabras.

    "Una palabra común puede tener su propio token, palabras poco comunes ciertamente estarían compuestas de múltiples tokens, y algunos tokens pueden ser un solo espacio seguido de 'de' porque esa secuencia de tres caracteres es muy común", explica Thompson. Para hacer cada predicción, el modelo introduce un token en la capa inferior de una pila particular de neuronas artificiales; esa capa lo procesa y pasa su resultado a la siguiente capa, que lo procesa y pasa su resultado, y así sucesivamente hasta que el resultado final emerge de la parte superior de la pila. El tamaño de las pilas puede variar significativamente, pero generalmente suele ser del orden de decenas de capas, no miles o millones.

    En las primeras etapas del entrenamiento, las predicciones del modelo no son muy buenas. Pero cada vez que el modelo predice un token, comprueba si los datos de entrenamiento son correctos. Ya sea correcto o incorrecto, un algoritmo de retropropagación ajusta los parámetros, es decir, los coeficientes de las fórmulas, en cada celda de la pila que hizo esa predicción. El objetivo de los ajustes es hacer que la predicción correcta sea la más probable.

    "Esto también lo hace para las respuestas correctas, porque esa predicción correcta puede haber tenido, digamos, una certeza del 30 %, pero ese 30 % fue el porcentaje mayor frente a las otras respuestas posibles", explica Thompson. "Entonces, la retropropagación busca convertir ese 30 % en un 30,001 %, o algo similar".

    Cuando el modelo ha repetido este proceso con billones de tokens de texto, se vuelve muy bueno prediciendo el siguiente token o palabra. Tras el entrenamiento inicial, los modelos de IA generativa se pueden ajustar mediante una técnica de aprendizaje supervisado, como el aprendizaje de refuerzo a partir de retroalimentación humana (RLHF, por sus siglas en inglés). En el RLHF, la producción del modelo se entrega a revisores humanos, que hacen una evaluación binaria positiva o negativa (correcto o incorrecto) que se devuelve al modelo. El RLHF se utilizó para ajustar el modelo GPT-3.5 de OpenAI, con el fin de ayudar a crear el chatbot ChatGPT que se volvió viral.

  • Pero, ¿cómo respondió el modelo a mi pregunta? Es un misterio. Así es como explica Thompson el estado actual de comprensión: "Hay un enorme 'simplemente no sabemos' en mi explicación. Lo que sabemos es que toma toda tu pregunta como una secuencia de tokens, y en la primera capa los procesa todos ellos simultáneamente. Y sabemos que luego procesa los resultados de esa primera capa en la siguiente capa, y así sucesivamente en la pila. Y entonces sabemos que utiliza esa capa superior para predecir, es decir, producir un primer token, y ese primer token se da por hecho en todo ese sistema para producir el siguiente token, y así sucesivamente.

    La siguiente pregunta lógica es, ¿en qué pensó y cómo, durante todo ese procesamiento? ¿Qué hicieron todas esas capas? Y la respuesta más contundente es que no lo sabemos. No... lo... sabemos. Podemos estudiarlo. Podemos observarlo. Pero su complejidad supera nuestra capacidad de análisis. Es como la resonancia magnética funcional del cerebro de las personas. Es el esbozo más rudimentario de lo que el modelo realmente hizo. No lo sabemos".

    Aunque existe cierta controversia en torno a esto, un grupo de más de una decena de investigadores que obtuvieron acceso anticipado a GPT-4 en el otoño de 2022 concluyeron que la inteligencia con la que el modelo respondió a los desafíos complejos que le plantearon y la amplia gama de conocimientos que exhibe indican que GPT-4 ha desarrollado una forma de inteligencia general. En otras palabras, ha generado un modelo interno de cómo funciona el mundo, tal como podría hacerlo un cerebro humano, y utiliza ese modelo para responder a las preguntas que se le plantean. Uno de los investigadores contó en el pódcast This American Life que tuvo un momento incredulidad cuando le pidió a GPT-4 que le diera una receta de galletas con pepitas de chocolate, pero escrita al estilo de una persona muy deprimida, y el modelo respondió: "Ingredientes: 1 taza de mantequilla a temperatura ambiente, si es que puedes encontrar la energía para sacar la mantequilla de la nevera. 1 cucharadita de extracto de vainilla, el sabor artificial de la felicidad. 1 taza de pepitas de chocolate negro 50 %, pequeñas alegrías que al final se derretirán".

¿Por qué es importante la IA generativa?

Una forma útil de entender la importancia de la IA generativa es concebirla como una calculadora de contenido creativo. Al igual que una calculadora automatiza los cálculos matemáticos rutinarios y tediosos, permitiendo a la persona centrarse en tareas de nivel superior, la IA generativa tiene el potencial de automatizar las tareas secundarias más rutinarias y tediosas que conforman gran parte del trabajo del conocimiento, liberando a los profesionales para que se concentren en los aspectos más importantes de su labor.

Tomemos los desafíos a los que se enfrentan los responsables de marketing para obtener información procesable a partir de los datos no estructurados, incoherentes e inconexos a los que se enfrentan a menudo. Tradicionalmente, consolidar esos datos sería el primer paso, que requiere un poco de ingeniería de software personalizada para dar una estructura común a fuentes de datos dispares, como redes sociales, noticias y comentarios de los clientes.

"Pero con los LLM, simplemente se puede incorporar información de diferentes fuentes directamente en la consulta y luego solicitar la información clave o preguntar qué comentarios se deben priorizar, o solicitar análisis del sentimiento, y simplemente funcionará", apunta Basim Baig, responsable sénior de ingeniería, especializado en IA y seguridad, de Duolingo. "En este caso, el poder del LLM es que te permite saltarte ese paso de ingeniería ingente y costoso".

Yendo más allá, Thompson sugiere que los profesionales de marketing de productos podrían usar LLM para etiquetar texto en formato libre para su análisis. Por ejemplo, imagina que dispones de una enorme base de datos de menciones de tu producto en redes sociales. Podrías escribir software que utilice un LLM y otras tecnologías para:

  • Extraer los temas principales de cada publicación en redes sociales.
  • Agrupar los temas recurrentes que se desprenden de publicaciones individuales.
  • Identificar qué publicaciones abordan cada tema recurrente.

A continuación, los resultados pueden servir para:

  • Estudiar los temas recurrentes más frecuentes, con posibilidad de consultar ejemplos.
  • Realizar un seguimiento de la evolución de los temas recurrentes.
  • Pedir a un LLM que profundice en un tema recurrente para encontrar menciones repetidas a características de producto.

Modelos de IA generativa

La IA generativa engloba una amplia categoría de aplicaciones basadas en un conjunto cada vez más extenso de variaciones de red neuronal. Aunque toda la IA generativa se ajusta a la descripción general de la sección ¿Cómo funciona la IA generativa?, las técnicas de implementación varían para admitir diferentes medios, como imágenes frente a texto, e incorporar los avances de la investigación y la industria a medida que surgen.

Los modelos de red neuronal utilizan patrones repetitivos de neuronas artificiales y sus interconexiones. Frecuentemente, un diseño de red neuronal (para cualquier aplicación, incluida la IA generativa) repite el mismo patrón de neuronas cientos o miles de veces, generalmente reutilizando los mismos parámetros. Esta es una parte esencial de lo que se denomina "arquitectura de red neuronal". El descubrimiento de nuevas arquitecturas ha sido un área importante de innovación en el ámbito de la IA desde la década de 1980, a menudo impulsado por el objetivo de respaldar un nuevo medio. Pero, una vez que se ha inventado una nueva arquitectura, a menudo se progresa más empleándola de maneras inesperadas. La innovación adicional proviene de la combinación de elementos de diferentes arquitecturas.

Dos de las arquitecturas más antiguas y aún más comunes son:

  • Las redes neuronales recurrentes (RNN) surgieron a mediados de la década de 1980 y permanecen en uso. Las RNN demostraron cómo la IA podía aprender y utilizarse para automatizar tareas que dependen de datos secuenciales, es decir, información cuya secuencia tiene un significado, como el lenguaje, el comportamiento del mercado de valores y los flujos de clics en la web. Las RNN son la base de muchos modelos de IA de audio, como los de las aplicaciones que generan música, dada la naturaleza secuencial de la música y su dependencia del tiempo. Pero también son buenas en procesamiento del lenguaje natural (NLP). Las RNN también se emplean en usos tradicionales de la IA, como el reconocimiento de voz, el análisis de escritura manuscrita, la previsión financiera y meteorológica, así como para predecir variaciones en la demanda de energía, entre muchas otras aplicaciones.
  • Las redes neuronales convolucionales (CNN) llegaron unos 10 años después. Trabajan con los datos en un sistema similar a una cuadrícula y, por lo tanto, son excelentes en las representaciones de datos espaciales y pueden generar imágenes. Aplicaciones de IA generativa de síntesis texto a imagen populares, como Midjourney y DALL-E, utilizan la CNN para generar la imagen final.

Aunque las RNN todavía se utilizan con frecuencia, los esfuerzos sucesivos para mejorar las RNN llevaron a un gran avance:

  • Los modelos transformer se han convertido en una forma mucho más flexible y potente de representar secuencias que las RNN. Presentan varias características que les permiten procesar datos secuenciales, como texto, de forma masiva paralela sin perder su comprensión de las secuencias. Ese procesamiento paralelo de datos secuenciales es una de las características clave que hacen que ChatGPT sea capaz de responder tan rápido y correctamente a las consultas conversacionales directas.

La investigación, el sector privado e iniciativas de código abierto han creado modelos impactantes que han impulsado todavía más la innovación en arquitectura y aplicaciones de las redes neuronales. Por ejemplo, se han producido innovaciones cruciales en el proceso de entrenamiento, en cómo se incorpora la retroalimentación del entrenamiento para mejorar los modelos y cómo se pueden combinar varios modelos para aplicaciones de IA generativa. A continuación ofrecemos un resumen de algunas de las innovaciones más importantes en lo que respecta a los modelos de IA generativa:

  • Los codificadores automáticos variacionales (VAE, por sus siglas en inglés) aprovechan las innovaciones en la arquitectura de las redes neuronales y los procesos de entrenamiento, y a menudo se incorporan a aplicaciones generadoras de imágenes. Consisten en redes de codificador y decodificador, cada una de las cuales puede utilizar una arquitectura subyacente diferente, como una RNN, una CNN o un transformer. El codificador aprende las características importantes de una imagen, comprime esa información y la almacena en forma de representación en la memoria. A continuación, el descodificador utiliza esa información comprimida para intentar recrear el original. En última instancia, el VAE aprende a generar nuevas imágenes similares a sus datos de entrenamiento.
  • Las redes generativas adversativas (GAN) se utilizan en una variedad de casos, pero parecen estar especialmente adaptadas a usos de vídeo y otras aplicaciones relacionadas con la imagen. Lo que diferencia a las GAN de otros modelos es que consisten en dos redes neuronales que compiten entre sí mientras se entrenan. En el caso de las imágenes, por ejemplo, el "generador" crea una imagen y el "discriminador" decide si la imagen es real o generada. El generador trata constantemente de engañar al discriminador, que a su vez intenta pillarlo in fraganti. En la mayoría de los casos, las dos redes neuronales competidoras se basan en arquitecturas de CNN, pero también pueden ser variantes de RNN o transformers.
  • Los modelos de difusión incorporan varias redes neuronales en un marco general, a veces integrando diferentes arquitecturas como CNN, transformers y VAE. Los modelos de difusión aprenden comprimiendo datos, agregando ruido, eliminando el ruido e intentando regenerar el original. La popular herramienta Stable Diffusion utiliza un codificador y decodificador VAE para los pasos iniciales y finales, respectivamente, y dos variaciones de CNN a la hora de añadir/eliminar ruido.

¿Cuáles son las aplicaciones de la IA generativa?

Si bien el mundo apenas acaba de empezar a descubrir los usos posibles de la IA generativa, es fácil ver cómo las empresas podrían beneficiarse al aplicarla a sus operaciones. Imagina cómo la IA generativa podría cambiar las áreas clave de interacción con los clientes, ventas y marketing, ingeniería de software y e investigación y el desarrollo.

En el servicio al cliente, la tecnología de IA anterior automatizó procesos e introdujo el autoservicio del cliente, pero también generó nuevas causas de frustración para este último. La IA generativa promete ofrecer beneficios tanto a los clientes como a los representantes de servicio al cliente, con bots conversacionales que se adaptan a diferentes idiomas y regiones, creando una experiencia más personalizada y accesible para los consumidores. Cuando la intervención humana es necesaria para resolver el problema de un cliente, los representantes de servicio al cliente pueden colaborar con herramientas de IA generativa en tiempo real para encontrar estrategias útiles, lo que mejora la velocidad y la precisión de las interacciones. La velocidad con la que la IA generativa puede aprovechar toda la base de conocimientos de una gran empresa y encontrar nuevas soluciones a las quejas de los clientes brinda al personal de servicio una mayor capacidad para resolver eficazmente problemas específicos de los clientes, en lugar tener que recurrir a cadenas telefónicas obsoletas y transferencias de llamadas hasta que se encuentre una respuesta o se le agote la paciencia al cliente.

En marketing, la IA generativa puede automatizar la integración y el análisis de datos de fuentes dispares, lo que debería acelerar drásticamente el tiempo de obtención de la información y contribuir directamente a una toma de decisiones más fundamentada y un desarrollo más rápido de estrategias de comercialización. Los responsables de marketing pueden utilizar estos datos, junto con otra información valiosa conseguida mediante IA, para crear nuevas campañas publicitarias más personalizadas. Esto reduce el tiempo que el personal debe dedicar a recopilar datos demográficos y de comportamientos de compra y le brinda más tiempo para analizar los resultados y compartir ideas nuevas.

Tom Stein, presidente y director de marca de la agencia de marketing B2B Stein IAS, afirma que todas las agencias de marketing, incluida la suya, están analizando estas oportunidades a paso acelerado. Pero, señala Stein, también existen beneficios más sencillos e inmediatos para los procesos de backend de una agencia.

"Cuando nos llega una RFI [solicitud de información], por lo general, entre el 70 % y el 80 % de la RFI pedirá la misma información que cualquier otra RFI, tal vez con algunas diferencias contextuales específicas de la situación de esa compañía", indica Stein, quien también fue presidente del jurado de los Cannes Lions Creative B2B Awards en 2023. "No es tan complicado crear las condiciones para que una serie de herramientas de IA realicen ese trabajo por nosotros. Así que, si recuperamos ese 80 % de nuestro tiempo y podemos pasarlo agregando valor a la RFI y sacándole el máximo partido, será una victoria de todas formas. Y, al igual que este, hay muchos otros procesos".

Los desarrolladores de software que recurren a la IA generativa pueden agilizar y acelerar procesos en cada faceta de su trabajo, desde la planificación hasta el mantenimiento. Durante la fase de creación inicial, las herramientas de IA generativa pueden analizar y organizar grandes cantidades de datos y sugerir múltiples configuraciones del software. Una vez que comienza la codificación, la IA puede probar y solucionar problemas en el código, identificar errores, ejecutar diagnósticos y sugerir correcciones, tanto antes como después del lanzamiento. Thompson señala que debido a que muchos proyectos de software empresarial incorporan múltiples lenguajes de programación y disciplinas, él y otros ingenieros de software han utilizado la IA para formarse en áreas que desconocían mucho más rápido de lo que antes podían. También ha utilizado herramientas de IA generativa para explicar código desconocido e identificar problemas específicos.

En I+D, la IA generativa puede aumentar la velocidad y el alcance de la investigación de mercado durante las fases iniciales del diseño de los productos. A continuación, los programas de IA, especialmente aquellos con funcionalidades de generación de imágenes, pueden crear diseños detallados de productos potenciales antes de simularlos y probarlos, brindando a los trabajadores las herramientas que necesitan para realizar ajustes rápidos y efectivos a lo largo del ciclo de I+D.

Larry Ellison, fundador de Oracle, señaló en la presentación de resultados de junio que "los LLM especializados acelerarán el descubrimiento de nuevos fármacos que salvarán vidas". El descubrimiento de fármacos es una aplicación de I+D que explota la tendencia de los modelos generativos a producir información incorrecta o no verificable, pero de forma positiva: identificar nuevas moléculas y secuencias de proteínas para apoyar la búsqueda de nuevos tratamientos médicos. Por otra parte, la filial de Oracle Cerner Enviza se ha asociado con la Food and Drug Administration (FDA) de los Estados Unidos y John Snow Labs para aplicar herramientas de IA al desafío de "comprender los efectos de los fármacos en grandes poblaciones". La estrategia de IA de Oracle es incorporar inteligencia artificial a sus aplicaciones y su infraestructura en la nube.

Casos de uso de la IA generativa

La IA generativa tiene un enorme potencial para acelerar o automatizar completamente una amplia gama de tareas. Las empresas deben definir formas concretas y específicas de maximizar los beneficios que la IA puede aportar a sus operaciones. Estos son algunos de sus casos de uso específicos:

  • Cerrar brechas de información: con sus interfaces de usuario sencillas, que permiten una interacción mediante chats, las herramientas de IA generativa pueden responder a preguntas generales o específicas de los trabajadores y brindarles la orientación adecuada cuando no saben cómo avanzar en cualquier aspecto, desde situaciones simples hasta operaciones complejas. Los comerciales, por ejemplo, pueden solicitar información sobre una cuenta específica, y los programadores pueden aprender nuevos lenguajes de programación.
  • Detectar errores: las herramientas de IA generativa pueden buscar errores en cualquier texto, desde correos electrónicos informales hasta ejemplos de escritura profesional. Y hacen más que corregirlos: pueden explicar el qué y el por qué para ayudar a los usuarios a aprender y mejorar su trabajo.
  • Mejorar la comunicación: las herramientas de IA generativa pueden traducir texto a diferentes idiomas, ajustar el tono, crear mensajes únicos basados en diferentes conjuntos de datos y mucho más. Los equipos de marketing pueden utilizar herramientas de IA generativa para crear campañas publicitarias más oportunas, mientras que el personal interno puede utilizarlas para buscar en comunicaciones anteriores y encontrar rápidamente información pertinente y respuestas a sus preguntas sin interrumpir a sus compañeros. Thompson cree que esta capacidad de sintetizar el conocimiento institucional sobre cualquier pregunta o idea que un trabajador pueda tener alterará fundamentalmente la forma en que las personas se comunican en las grandes organizaciones, impulsando la detección de información.
  • Aliviar la carga administrativa: las empresas con una importante carga de trabajo administrativo, como las de codificación/facturación médica, pueden utilizar la IA generativa para automatizar tareas complejas, incluido el archivado adecuado de documentos y el análisis de informes médicos. Esto libera al personal para que se centre en tareas más interactivas, como la atención al paciente o el servicio al cliente.
  • Explorar imágenes médicas en busca de anomalías: los proveedores médicos pueden utilizar la IA generativa para analizar historias clínicas e imágenes y señalar problemas notables, así como ofrecer recomendaciones a los profesionales médicos sobre fármacos, además de indicar los posibles efectos secundarios en función del historial del paciente.
  • Solucionar problemas de código: los ingenieros de software pueden utilizar modelos de IA generativa para solucionar problemas y ajustar su código de forma más rápida y fiable que el peinado línea por línea. A continuación, pueden pedir a la herramienta explicaciones más detalladas para optimizar su codificación en el futuro y mejorar sus procesos.

Beneficios de la IA generativa

Las ventajas que la IA generativa puede aportar a un negocio se derivan principalmente de tres atributos generales: síntesis de conocimientos, colaboración entre humanos e IA y rapidez. Si bien muchos de los beneficios señalados a continuación son similares a los prometidos en el pasado por los modelos de IA y las herramientas de automatización anteriores, la presencia simultánea de uno o más de estos tres atributos puede ayudar a las empresas a obtener ventajas de forma más rápida, fácil y efectiva.

Con la IA generativa, las organizaciones pueden crear modelos personalizados entrenados con su propia información institucional y su propiedad intelectual, tras lo cual los trabajadores del conocimiento pueden pedir al software que colabore en una tarea usando el mismo lenguaje que usarían con sus compañeros. Un modelo especializado de IA generativa puede responder sintetizando información de toda la base de conocimientos corporativos a una velocidad asombrosa. Este enfoque no solo reduce o elimina la necesidad de contar con conocimientos de ingeniería de software complejos, aunque a menudo menos efectivos y más caros, para crear programas específicos para estas tareas, sino que también es probable que surjan ideas y conexiones que los enfoques anteriores no ofrecían.

  • Incrementar la productividad: los trabajadores del conocimiento pueden utilizar la IA generativa para reducir el tiempo que dedican a tareas rutinarias en su día a día, como formarse en una nueva disciplina que se necesita repentinamente para un proyecto futuro, organizar o categorizar datos, buscar la investigación pertinente en Internet o redactar correos electrónicos. Al aprovechar la IA generativa, un número más reducido de empleados pueden realizar tareas que antes requerían grandes equipos o dedicarles una fracción de su tiempo en lugar de horas de trabajo. Un equipo de programadores, por ejemplo, puede pasar horas analizando código defectuoso para solucionar problemas, pero una herramienta de IA generativa encuentra los errores en minutos e informa de ellos, además de sugerir correcciones. Debido a que algunos modelos de IA generativa poseen competencias prácticamente iguales o superiores en un amplio abanico de actividades del conocimiento, colaborar con un sistema de IA generativa puede aumentar drásticamente la productividad de los colaboradores humanos. Por ejemplo, un responsable de producto júnior también podría ser un jefe de proyecto de nivel intermedio con un asistente de IA a su lado. Todas estas funcionalidades acelerarían drásticamente la capacidad de los trabajadores del conocimiento para completar proyectos.

  • Reducir costes: dada su velocidad, las herramientas de IA generativa disminuyen el coste de finalización de los procesos y, si se tarda la mitad del tiempo en realizar una tarea, la tarea cuesta la mitad de lo que costaría de lo contrario. Asimismo, la IA generativa puede reducir los errores, eliminar los tiempos de inactividad e identificar redundancias y otras ineficiencias costosas. Sin embargo, hay una contrapartida: debido a la tendencia de la IA generativa a alucinar, la supervisión humana y el control de calidad siguen siendo necesarios. Pero se espera que las colaboraciones entre personas e IA realicen mucho más trabajo en menos tiempo que los humanos solos, mejor y con más exactitud que las herramientas de IA por sí solas, reduciendo así los costes. Al probar nuevos productos, por ejemplo, la IA generativa puede ayudar a crear simulaciones más avanzadas y detalladas de lo que podrían hacerlo herramientas más antiguas. Esto, en última instancia, reduce el tiempo y el coste de probar nuevos productos.

  • Mejorar la satisfacción del cliente: los clientes pueden disfrutar de una experiencia mejor y más personalizada gracias a autoservicios con tecnología de IA generativa y herramientas de IA generativa que ayudan a los representantes de servicio al cliente, proporcionándoles información en tiempo real. Si bien los chatbots de servicio al cliente basados en IA que existen hoy en día a veces pueden generar frustración debido a sus limitaciones, resulta fácil imaginar una experiencia del cliente mucho más satisfactoria gracias a modelos de IA generativa especialmente entrenados para empresas específicas, si tomamos en cuenta el calibre de las conversaciones actuales de ChatGPT.

  • Tomar decisiones más fundamentadas: los modelos de IA generativa específicos de una empresa con entrenamiento especial pueden proporcionar información detallada a través del modelado de escenarios, la evaluación de riesgos y otros enfoques sofisticados para el análisis predictivo. Los responsables de la toma de decisiones pueden aprovechar estas herramientas para obtener una comprensión más profunda de su industria y la posición de la empresa en ella a través de recomendaciones personalizadas y estrategias útiles, basadas en datos de mayor alcance y análisis más rápidos de lo que los analistas humanos o la tecnología anterior podrían generar por sí mismos.

    Por ejemplo, los responsables de la toma de decisiones pueden planificar mejor la asignación de inventario antes de una temporada ajetreada mediante previsiones de la demanda lo más precisas posible gracias a una combinación de datos internos recopilados por su sistema de planificación de recursos empresariales (ERP) y una investigación de mercado externa exhaustiva, que luego se analiza con un modelo especializado de IA generativa. En este caso, la mejora de las decisiones de asignación reduce las compras en exceso y los agotamientos de stock, al tiempo que impulsa las ventas potenciales.

  • Lanzar productos más rápido: la IA generativa puede producir rápidamente prototipos de productos y primeros borradores, ayudar a ajustar las tareas en curso y probar/resolver problemas de proyectos existentes para encontrar mejoras mucho más rápido de lo que antes era posible.

  • Control de calidad: es probable que un modelo de IA generativa especializado y específico para una empresa exponga brechas e inconsistencias en los manuales de usuario, los vídeos y otros contenidos que la organización presenta al público.

Una muestra de los beneficios concretos de la IA generativa
  Síntesis de conocimientos Colaboración entre humanos e IA Velocidad
Mayor productividad Organiza datos, acelera la investigación y los primeros borradores de productos. Forma a los trabajadores en nuevas disciplinas, sugiere formas novedosas de resolver problemas. Acelera la capacidad de los trabajadores del conocimiento para completar nuevos proyectos.
Menores costes Identifica redundancias y deficiencias para mejorar flujos de trabajo. Minimiza los errores humanos y reduce los tiempos de inactividad mediante una supervisión colaborativa. Realiza las tareas más rápido (si una tarea tarda la mitad del tiempo, cuesta la mitad).
Mayor satisfacción de los clientes Organiza y recupera rápidamente la información de la cuenta del cliente para acelerar la resolución de problemas. Chatbots mejorados para automatizar las interacciones simples e información más idónea para los representantes cuando se necesita ayuda humana. Proporciona información y novedades sobre las cuentas en tiempo real, tanto a los clientes como a los representantes de servicio al cliente.
Toma de decisiones más fundamentada Consigue información valiosa más rápido aprovechando herramientas de análisis predictivo como el modelado de escenarios y la evaluación de riesgos. Ofrece recomendaciones personalizadas y estrategias útiles a los responsables de la toma de decisiones. Genera análisis más rápidamente y con más datos que con analistas humanos o tecnologías anteriores.
Lanzamiento de productos más rápido Crea prototipos y productos mínimos viables (MVP). Prueba y soluciona problemas en proyectos existentes para mejorar tus productos. Incrementa la velocidad de los ajustes.

Limitaciones de la IA generativa

Cualquiera que haya utilizado herramientas de IA generativa para la educación o la investigación probablemente se haya enfrentado a su limitación más conocida: se inventa cosas. Dado que el modelo solo predice la siguiente palabra, puede extrapolar sus datos de entrenamiento para declarar falsedades con tanta autoridad como las verdades que produce. Esto es a lo que los investigadores de IA denominan alucinaciones, y es una razón clave por la que la actual cosecha de herramientas de IA generativa requiere colaboradores humanos. Las empresas deben prepararse y abordar esta y otras limitaciones a medida que implementan la IA generativa. Si una empresa establece expectativas poco realistas o no gestiona eficazmente la tecnología, las consecuencias pueden socavar su rendimiento y su reputación.

  • Requiere supervisión: los modelos de IA generativa pueden introducir información falsa o engañosa, a menudo con tanto detalle y un tono tan seguro que incluso puede engañar a los expertos. Del mismo modo, sus resultados pueden contener un lenguaje sesgado u ofensivo aprendido del conjunto de datos con el que se entrenó el modelo. Los seres humanos siguen siendo una parte fundamental del flujo de trabajo para evitar que estos resultados defectuosos se difundan y lleguen a los clientes o influyan en la política de la empresa.
  • Potencia informática e inversión inicial: los modelos de IA generativa requieren grandes cantidades de potencia informática tanto para su entrenamiento como para su funcionamiento. Muchas empresas carecen de los recursos y la experiencia necesarios para crear y mantener estos sistemas por su cuenta. Esta es una de las razones por las que gran parte del desarrollo de IA generativa se realiza en infraestructura en la nube.
  • Potencial para converger, no divergir: las organizaciones que no desarrollen sus propios modelos especializados, sino que en su lugar confíen en herramientas públicas de IA generativa podrían estar condenadas a la mediocridad. A menudo se encontrarán con que sus conclusiones son idénticas a las de otros porque se basan en los mismos datos de entrenamiento. Si estas empresas no respaldan su trabajo con innovación humana, tal vez serán capaces de adoptar las buenas prácticas actuales, pero se enfrentarán a dificultades para encontrar un diferenciador competitivo.
  • Resistencia del personal y los clientes: los empleados, especialmente aquellos que siguen los mismos protocolos y métodos desde hace mucho tiempo, pueden tener dificultades para adaptarse a la IA generativa, lo que conllevará una disminución de su productividad durante el periodo de ajuste. Del mismo modo, el personal puede oponer resistencia a la tecnología por temor a perder su trabajo. Los gerentes y líderes empresariales deben mitigar estos miedos y ser abiertos y transparentes sobre cómo la tecnología cambiará (o no) la estructura del negocio.

Riesgos y preocupaciones ligados a la IA generativa

La IA generativa ha provocado reacciones marcadas en ambos extremos del espectro de riesgo. A algunos grupos les preocupa que conduzca a la extinción humana, mientras que otros insisten en que salvará el mundo. Esos extremos quedan fuera del alcance de este artículo. Sin embargo, detallamos aquí algunos riesgos e inquietudes importantes que los líderes empresariales que implementan la tecnología de IA deben comprender con el fin de poder tomar medidas para mitigar cualquier posible consecuencia negativa.

  • Confianza y fiabilidad: los modelos de IA generativa hacen afirmaciones inexactas, a veces alucinando información completamente inventada. Del mismo modo, muchos modelos se entrenan con datos antiguos, esto es, utilizan únicamente la información publicada hasta una fecha determinada. Sin embargo, lo que funcionaba en el mercado del año pasado puede no ser pertinente o útil en la actualidad. Por ejemplo, las empresas que buscan mejorar sus operaciones de cadena de suministro podrían descubrir que las sugerencias de sus modelos están obsoletas y no son pertinentes en una economía global en constante cambio. Antes de actuar en función de cualquier recomendación, los usuarios deben verificarla, asegurándose de su exactitud y pertinencia.

  • Privacidad/propiedad intelectual: los modelos de IA generativa suelen seguir aprendiendo de los datos introducidos como parte de las consultas. Las empresas, especialmente aquellas que recopilan información personal confidencial de sus clientes, como las consultas médicas, deben tener cuidado de no exponer IP protegidas o datos confidenciales. Si el modelo accede a esta información, la probabilidad de exposición podría incrementarse.

  • Ingeniería social más sofisticada: los ciberdelincuentes ya están recurriendo a la IA generativa para personalizar mejor la ingeniería social y otros ciberataques con el fin de que parezcan más auténticos.

    "Ya es muy difícil distinguir si estás hablando con un bot o un humano en línea", afirma Basim Baig, ingeniero de IA y seguridad de Duolingo. "Se ha vuelto mucho más fácil para los criminales que buscan ganar dinero generar contenido que puede engañar a la gente".

  • Disminución de la calidad y originalidad de los resultados: la IA generativa puede hacer que la creación de productos y contenido sea más fácil y rápida, pero no garantiza un resultado de mayor calidad. Confiar en modelos de IA sin una colaboración humana significativa puede traducirse en productos estandarizados y carentes de creatividad.

  • Sesgos: si un modelo de IA generativa se entrena con datos sesgados, con lagunas en cuanto a puntos de vista o incluso contenido dañino y perjudicial, esos sesgos se reflejarán en sus resultados. Por ejemplo, si tradicionalmente una empresa ha contratado un solo tipo de empleado, el modelo puede hacer una referencia cruzada de los solicitantes con la contratación "ideal" y eliminar candidatos cualificados porque no se ajustan al molde, incluso si la organización tenía la intención de dejar atrás dicho patrón.

  • Inteligencia artificial en la sombra: el uso de IA generativa por parte de los empleados sin la autorización o el conocimiento oficial de la organización puede llevar a una empresa a publicar información incorrecta o a violar los derechos de autor de otra organización.

  • Colapso de modelos: los investigadores de IA han identificado un fenómeno llamado colapso de modelos que podría causar una reducción de la utilidad de los modelos con el tiempo. Esencialmente, a medida que proliferan los contenidos generados por IA, los modelos entrenados con esos datos sintéticos, que inevitablemente contienen errores, en última instancia "olvidarán" las características de los datos generados por humanos con los que fueron entrenados originalmente. Este problema puede alcanzar un punto crítico a medida que Internet va albergando más contenido generado mediante IA, lo que crea un bucle de retroalimentación que degrada los modelos.

  • Regulación de la IA: dado que la IA generativa es tan nueva, no existen muchas legislaciones aplicables. Sin embargo, gobiernos de todo el mundo están investigando cómo regularla. Algunos países, como China, ya han propuesto medidas legislativas sobre el modo de entrenar los modelos y aquello que se les permite producir. A medida que el número de países que imponen regulaciones aumenta, las empresas, especialmente las multinacionales, necesitan realizar un seguimiento de leyes nuevas y cambiantes para garantizar su cumplimiento normativo y evitar multas o penas por mal uso de la tecnología.

Ética e IA generativa

El auge del análisis de big data hace más de una década planteó nuevas cuestiones éticas y debates porque las herramientas emergentes permitieron inferir información privada o sensible sobre las personas que estas no habían revelado o no querrían revelar. ¿Cómo deben las empresas gestionar su capacidad para poseer dicha información?

Dado su potencial para potenciar el análisis de datos, la IA generativa está planteando nuevas cuestiones éticas y volviendo a poner de actualidad otras más antiguas.

  • ¿Cómo afectará la IA generativa a los trabajadores? La IA generativa ya está haciendo que muchos trabajadores sientan inquietud sobre sus perspectivas de empleo a largo plazo, y con razón. Si bien la historia muestra que los avances tecnológicos siempre han creado más empleo del que destruyen, los roles que la IA podría dejar obsoletos pagan las facturas de las personas hoy en día.
  • ¿Cómo podemos eliminar los sesgos potenciales? Sabemos que todos los modelos de IA tienen la capacidad de producir resultados sesgados. Las organizaciones deben elegir de forma proactiva cómo abordar este desafío, tanto desde el punto de vista de la ética como del riesgo empresarial.
  • ¿Cómo podrían los delincuentes usar modelos de IA generativa para causar daño y caos en el ámbito público? Desafortunadamente, los innumerables usos potenciales de la IA generativa incluyen actos delictivos y perjudiciales, especialmente a medida que los modelos generativos se vuelven más accesibles al público. Vídeos falsos que utilizan la voz y la apariencia de una persona, herramientas de piratería informática para mejorar los ciberataques, desinformación generalizada y campañas de ingeniería social son solo algunos de los usos potenciales de la IA generativa por parte de los delincuentes. Actualmente, muchos modelos cuentan con protecciones, pero esas barreras no se consideran perfectas. Las empresas que implementan sus propios modelos deben entender de qué son capaces sus sistemas y tomar medidas para garantizar su uso responsable.
  • ¿Quién es propietario del trabajo generado por la IA? Incluso si una empresa ajusta un modelo con sus propios datos, los modelos de IA generativa se entrenan con grandes cantidades de datos externos. Así pues, los resultados de un modelo puede incluir elementos del trabajo de otras organizaciones, lo que conduce a posibles problemas éticos y legales, como el plagio y la infracción de derechos de autor. Esto es especialmente cierto en el caso de los modelos de IA que generan imágenes: artistas de todos los campos creativos están explorando formas de evitar que su trabajo sea incorporado a estos programas. Los entes reguladores podrían establecer nuevas reglas con el tiempo, por lo que cualquier persona que use IA generativa debe considerar de dónde proviene el contenido y cómo se usará antes de publicarlo como propio.

Ejemplos de IA generativa

Empresas de todos los tamaños e industrias, desde el ejército de los Estados Unidos hasta Coca-Cola, están experimentando con la IA generativa y obteniendo resultados prodigiosos. A continuación presentamos un pequeño conjunto de ejemplos que demuestran el amplio potencial de la tecnología y su rápida adopción.

Snap Inc., la compañía matriz de Snapchat, ha lanzado un chatbot llamado My AI que utiliza una versión de la tecnología GPT de OpenAI. Personalizado para adaptarse al tono y al estilo de Snapchat, My AI está programado para ser amistoso y agradable. Los usuarios pueden personalizar su apariencia con avatares, fondos de pantalla y nombres, y pueden usarlo para chatear con uno o varios usuarios, del mismo modo que utilizarían Snapchat para comunicarse con sus amigos. Los usuarios pueden solicitar consejos personalizados o participar en una conversación informal sobre temas como comida, pasatiempos o música. El bot incluso puede contar chistes. Snapchat ha marcado como objetivo para My AI ayudar a los usuarios a explorar las características de la aplicación, como las lentes de realidad aumentada, y ofrecer a los usuarios información para la que normalmente no recurrirían a Snapchat, como recomendaciones de lugares en un mapa local.

Bloomberg ha presentado BloombergGPT, un chatbot entrenado aproximadamente con una mitad de datos generales sobre el mundo y otra mitad de datos propiedad de Bloomberg o datos financieros limpios. Puede realizar tareas simples, como escribir buenos titulares de artículos, y trucos personalizados, como convertir consultas en inglés en Bloomberg Query Language, requerido por las terminales de datos de la compañía, que son imprescindibles en muchas empresas de la industria financiera.

Oracle se ha asociado con el desarrollador de IA Cohere para ayudar a empresas a crear modelos internos afinados con datos corporativos privados, con el objetivo de difundir el uso de herramientas de IA generativa especializadas específicas para cada organización.

"Cohere y Oracle están trabajando juntas para que resulte muy, muy fácil para los clientes empresariales entrenar sus propios grandes modelos de lenguaje especializados, protegiendo al mismo tiempo la privacidad de sus datos de entrenamiento", señaló Larry Ellison, de Oracle, a los analistas financieros durante la presentación de resultados de junio de 2023. Oracle planea integrar servicios de IA generativa en plataformas empresariales para impulsar la productividad y la eficiencia en los procesos existentes de las empresas, sin necesidad para estas de entrenar sus propios modelos desde cero. Con ese fin, la empresa también anunció recientemente la incorporación de funcionalidades de IA generativa en su software de recursos humanos, Oracle Fusion Cloud Human Capital Management (HCM).

Asimismo:

  • Coca-Cola utiliza generadores de texto e imágenes para personalizar la copia de anuncios y crear experiencias de cliente altamente personalizadas.
  • American Express, que ha estado durante mucho tiempo a la vanguardia del uso de IA en la detección de fraudes con tarjetas de crédito, está desarrollando funcionalidades de consumidor y B2B por medio de su filial Amex Digital Labs.
  • La oficina digital y de IA del Pentágono está experimentando con cinco modelos de IA generativa, alimentándolos con datos clasificados y probándolos para analizar cómo podrían usarse para sugerir opciones creativas que los líderes militares humanos nunca contemplarían.
  • Duolingo utiliza un bot con tecnología ChatGPT para ayudar a sus alumnos de idiomas. Proporciona explicaciones detalladas sobre las razones por las que sus respuestas en las pruebas de práctica son correctas o erróneas, imitando la forma en que los usuarios interactuarían con un tutor humano.
  • Slack ha lanzado un chatbot que tiene como objetivo ayudar a los empleados a obtener información valiosa y asesoramiento a partir del corpus de conocimiento institucional existente en los canales de Slack de cada cliente.

Herramientas de IA generativa

ChatGPT es la herramienta que se ha convertido en sensación viral, pero hay multitud de herramientas de IA generativa disponibles para cada uso. Por ejemplo, solo en el ámbito de la redacción nos encontramos con Jasper, Lex, AI-Writer, Writer y muchas otras. En generación de imágenes, Midjourney, Stable Diffusion y Dall-E parecen ser las más populares hoy en día.

Entre las decenas de generadores de música se encuentran AIVA, Soundful, Boomy, Amper, Dadabots y MuseNet. Aunque se sabe que los programadores de software colaboran con ChatGPT, también hay muchas herramientas especializadas de generación de código, como Codex, codeStarter, Tabnine, PolyCoder, Cogram y CodeT5.

Historia de la IA generativa

Aunque pueda parecer sorprendente, la primera etapa en el camino hacia los modelos de IA generativa en uso hoy en día llegó en 1943, el mismo año en que se presentó el primer ordenador programable eléctrico, Colossus, que luego fue utilizado por Gran Bretaña para descodificar mensajes cifrados durante la Segunda Guerra Mundial. La piedra fundacional de la IA fue un documento de investigación, A Logical Calculus of Ideas Immanent in Nervous Activity ("Un cálculo lógico de las ideas inherentes a la actividad nerviosa"), de Warren McCulloch, psiquiatra y profesor de la Facultad de Medicina de la Universidad de Illinois, y Walter Pitts, un neurocientífico computacional autodidacta.

Pitts, un claro prodigio matemático, huyó de casa a los 15 años y se encontraba sin hogar cuando conoció a McCulloch, quien llevó a Pitts a vivir con su familia. La única titulación de Pitts fue un diploma de Artes otorgado por la Universidad de Chicago tras la publicación del documento fundador que estableció las bases matemáticas según las cuales una neurona artificial "decide" si producir un uno o un cero.

El segundo paso se dio más al noroeste, en Buffalo, Nueva York, y fue obra del investigador en psicología del Instituto Aeronáutico de Cornell llamado Frank Rosenblatt. Con una beca otorgada en julio de 1957 por la Oficina de Investigación Naval del Departamento de la Marina de los Estados Unidos como parte del Proyecto PARA (Perceiving and Recognizing Automaton) de Cornell, Rosenblatt se basó en los cálculos de McCulloch y Pitts para desarrollar el perceptrón, una red neuronal con una sola capa "oculta" entre las capas de entrada y salida. Antes de construir el perceptrón Mark I, que hoy se encuentra en el Instituto Smithsonian, Rosenblatt y la Marina de los Estados Unidos lo simularon en un ordenador central IBM 704 para una demostración pública en julio de 1958. Pero el perceptrón era una red neuronal tan simple que recibió críticas del ingeniero informático Marvin Minsky, cofundador del laboratorio de IA del MIT. Minsky y Rosenblatt debatieron las perspectivas a largo plazo del perceptrón en foros públicos, lo que provocó que la comunidad de IA abandonara en gran medida la investigación de redes neuronales desde la década de 1960 hasta la década de 1980.

Este periodo llegó a conocerse como el "invierno de la IA".

El panorama para la investigación con redes neuronales se despejó en la década de 1980 gracias a las contribuciones de varios investigadores, en particular Paul Werbos, que en su trabajo inicial redescubrió el perceptrón, Geoffrey Hinton, Yoshua Bengio y Yann LeCun. La labor de todos ellos demostró la viabilidad de redes neuronales amplias y multicapa y demostró cómo estas redes podían aprender de sus respuestas correctas o erróneas mediante la asignación de puntuaciones a través de un algoritmo de retropropagación. Fue entonces cuando surgieron las RNN y las CNN. Sin embargo, las limitaciones de estas redes neuronales iniciales, sumadas a unas expectativas en un principio exageradas que no pudieron cumplirse debido a dichas restricciones y a la baja capacidad computacional disponible en aquel momento, llevaron a un segundo invierno de la IA en la década de 1990 y a inicios de los 2000.

Esta vez, sin embargo, muchos investigadores de redes neuronales mantuvieron el rumbo, incluidos Hinton, Bengio y LeCun. El trío, a veces llamado "los padrinos de la IA", compartió el Premio Turing 2018 por su trabajo en la década de 1980, su perseverancia posterior y sus contribuciones continuas. A mediados de la década de 2010, nuevas y diversas variantes de redes neuronales emergieron rápidamente, como se describe en la sección Modelos de IA generativa.

El futuro de la IA generativa

Queda por ver qué impacto tendrá la IA generativa en las empresas y en la forma de trabajar de las personas. Pero algo está claro: se están realizando extraordinarias inversiones en IA generativa en múltiples facetas del trabajo humano. Inversores de capital de riesgo, corporaciones con una larga trayectoria y prácticamente cualquier negocio intermedio están invirtiendo en startups de IA generativa a una velocidad vertiginosa. La magia universal de los LLM es su habilidad sin precedentes para aplicar big data a las interacciones humanas, para ayudar a las personas a dar sentido a la información explicándosela de manera simple, clara y sorprendentemente rápida. Esto sugiere que la IA generativa se integrará en multitud de aplicaciones existentes e impulsara el advenimiento de una segunda ola de aplicaciones nuevas.

Gartner, por ejemplo, predice que el 40 % de las aplicaciones empresariales incorporarán IA conversacional para 2024, el 30 % de las empresas contarán con estrategias de desarrollo y pruebas aumentadas con IA para 2025, y más de 100 millones de trabajadores colaborarán con una IA para 2026.

Por supuesto, es posible que los riesgos y limitaciones de la IA generativa socaven esta tendencia imparable. Ajustar los modelos generativos de modo que entiendan los matices que hacen que un negocio sea único puede resultar demasiado difícil; ejecutar modelos que requieren tanta potencia computacional puede resultar demasiado costoso, y la exposición involuntaria de secretos comerciales puede asustar a las empresas.

O tal vez suceda, pero a un ritmo más lento de lo que muchos esperan actualmente. Como recordatorio, las esperanzas depositadas en Internet terminaron por cumplirse, aunque tomó una década más de lo previsto por la primera generación de entusiastas, durante la cual se construyó o inventó la infraestructura necesaria y las personas adaptaron su comportamiento a las posibilidades del nuevo medio. En muchos sentidos, la IA generativa es otro medio nuevo.

Los expertos están sugiriendo orientaciones amplias para el futuro de la IA generativa en los negocios.

"Puede significar que crearemos empresas de manera diferente en el futuro", señala Sean Ammirati, un inversor de capital de riesgo que también es profesor emérito de Ciencias Empresariales en la Tepper School of Business de la Universidad Carnegie Mellon y cofundador del Corporate Startup Lab de CMU. De la misma manera que las empresas nativas digitales contaron con ventaja tras el auge de Internet, Ammirati prevé que, en el futuro, las empresas creadas a partir de cero con automatización impulsada por IA generativa serán las que dominen el mercado.

"Estas empresas tendrán la automatización como pilar, por lo que no necesitarán aprender cómo dejar de hacer manualmente cosas que deberían hacer de manera automatizada", afirma. "Podríamos ver aparecer un tipo de empresa muy diferente".

Adopta fácilmente la IA generativa con Oracle

Oracle no solo cuenta con un amplio historial de trabajo con funcionalidades de inteligencia artificial que además incorpora a sus productos, sino que también se sitúa a la vanguardia en cuanto a desarrollo y actividades de IA generativa. Compañías líderes en IA generativa utilizan Oracle Cloud Infrastructure. Esta nube de última generación proporciona a las empresas la plataforma perfecta para crear e implementar modelos de IA generativa especializados y tallados a medida para sus organizaciones y líneas de negocio específicas. Como explica Larry Ellison, de Oracle, "todos los centros de datos en la nube de Oracle cuentan con una red RDMA (acceso remoto directo a memoria) de alto ancho de banda y baja latencia perfectamente optimizada para crear los clústeres de GPU a gran escala que se utilizan para entrenar grandes modelos de lenguaje generativos. El rendimiento extremo y el ahorro de costes que supone ejecutar cargas de trabajo de IA generativa en nuestra nube Gen 2 han convertido a Oracle en la mejor opción para las empresas de desarrollo de IA de vanguardia".

La colaboración de Oracle con Cohere ha dado lugar a un nuevo conjunto de ofertas de servicios de IA generativa en la nube. "Este nuevo servicio protege la privacidad de los datos de entrenamiento de nuestros clientes empresariales, lo que permite a estos últimos utilizar de forma segura sus datos privados para entrenar sus propios grandes modelos de lenguaje especializados privados", explica Ellison.

La historia de la IA generativa comenzó hace 80 años con los cálculos de un adolescente a la fuga y se convirtió en una sensación viral a finales del año pasado con el lanzamiento de ChatGPT. En IA generativa, la innovación se está acelerando rápidamente, a medida que empresas de todos los tamaños e industrias experimentan e invierten en sus funcionalidades. Pero junto con su capacidad para mejorar en gran medida el trabajo y la vida, la IA generativa conlleva grandes riesgos, que van desde la destrucción de empleos hasta el potencial para acabar con la especie humana, si creemos a sus detractores. Lo que sabemos con seguridad es que el genio ha salido de la lámpara, y no volverá a entrar.

¿Por qué Oracle es la mejor opción en cuanto a IA generativa?

Oracle ofrece una plataforma de datos moderna e infraestructura de IA de bajo coste y alto rendimiento. Factores adicionales, como modelos potentes y de alto rendimiento, seguridad de datos sin igual y servicios de IA integrados, demuestran por qué la oferta de IA de Oracle está realmente diseñada para las empresas.

Preguntas frecuentes sobre IA generativa

¿Qué es la tecnología de IA generativa?

La tecnología de IA generativa se basa en arquitecturas de software de redes neuronales que imitan la forma en que se cree que funciona el cerebro humano. Estas redes neuronales se entrenan introduciendo grandes cantidades de datos en muestras relativamente pequeñas y luego pidiendo a la IA que realice predicciones simples, como la siguiente palabra de una secuencia o el orden correcto de una serie de oraciones. La red neuronal recibe retroalimentación positiva o negativa por cada respuesta correcta o incorrecta, por lo que aprende del proceso hasta que es capaz de pronosticar con éxito. En última instancia, la tecnología se basa en sus datos de entrenamiento y su aprendizaje para responder de manera humana a preguntas y otras solicitudes.

Ejemplos de IA generativa

A día de hoy, el ejemplo más conocido de IA generativa es ChatGPT, que es capaz de entablar conversaciones similares a las de los humanos y escribir sobre una amplia gama de temas. Otros ejemplos incluyen Midjourney y Dall-E, que crean imágenes, y un amplio abanico de herramientas que pueden generar texto, imágenes, vídeo y sonido.

¿Cuál es la diferencia entre la IA generativa y la IA?

Es importante tener en cuenta que la IA generativa no es una tecnología fundamentalmente diferente de la IA tradicional, solo se sitúan en diferentes puntos de un mismo espectro. Los sistemas de IA tradicionales suelen realizar una tarea específica, como la detección de fraudes con tarjetas de crédito. La IA generativa suele ser más polifacética y puede crear nuevo contenido. Esto se debe en parte a que las herramientas de IA generativa se entrenan con conjuntos de datos más amplios y diversos que la IA tradicional. Además, por lo general, la IA tradicional se entrena utilizando técnicas de aprendizaje supervisado, mientras que la IA generativa se entrena mediante aprendizaje no supervisado.

¿Cuál es el peligro de la IA generativa?

Se ha generado un gran debate social sobre los posibles riesgos de la IA generativa. En los polos opuestos de este debate, según unos, la tecnología puede conducir a la extinción humana, mientras que para otros salvará el mundo. Lo más probable es que la IA lleve a la eliminación de muchos puestos de trabajo existentes. Las empresas deben preocuparse por los cambios que la IA generativa provocará en sus procesos de trabajo y sus distintos roles, así como por la posibilidad de que exponga inadvertidamente información privada o confidencial o infrinja los derechos de autor.

¿Para qué sirve la IA generativa?

La IA generativa puede funcionar perfectamente en asociación con colaboradores humanos para ayudar, por ejemplo, aportando ideas y formando a los trabajadores en nuevas disciplinas. También es una gran herramienta para ayudar a las personas a analizar más rápidamente datos no estructurados. En general, puede beneficiar a las empresas al impulsar la productividad, reducir los costes, mejorar la satisfacción del cliente, proporcionar información más adecuada para la toma de decisiones y acelerar el ritmo de desarrollo de los productos.

¿Qué no puede hacer la IA generativa?

La IA generativa no puede tener ideas realmente nuevas que no se hayan expresado previamente en sus datos de entrenamiento o que no hayan sido extrapoladas a partir de esos datos. Tampoco debe se le debe dejar autonomía total. La IA generativa requiere supervisión humana y solo da lo mejor de sí en la colaboración con humanos.

¿Qué industrias utilizan IA generativa?

Dado su amplio abanico de posibilidades, es probable que la IA generativa resulte útil en prácticamente todas las industrias.

¿Cómo afectará la IA generativa al futuro del trabajo?

Es probable que la IA generativa tenga un impacto importante en el trabajo del conocimiento, actividades en las que los humanos trabajan en colaboración o toman decisiones comerciales. Como mínimo, los roles de los trabajadores del conocimiento deberán adaptarse al trabajo con herramientas de IA generativa, y algunos puestos de trabajo desaparecerán. La historia demuestra, sin embargo, que un cambio tecnológico como el que se espera de la IA generativa siempre conduce a la creación de más puestos de trabajo de los que destruye.