¿Qué es la IA generativa? ¿Cómo funciona?

Greg Pavlik | Vicepresidente sénior de Oracle Cloud Infrastructure | 15 de septiembre de 2023

que-es-la-IA-generativa

La inteligencia artificial generativa es una forma relativamente nueva de IA que, a diferencia de sus predecesoras, puede crear nuevo contenido a partir de sus datos de entrenamiento. Su extraordinaria capacidad para producir escritura, imágenes, audio y video similares a los humanos ha capturado la imaginación del mundo desde que se lanzó el primer chatbot de inteligencia artificial generativa para consumidores en otoño de 2022. Un informe de junio de 2023 de McKinsey & Company estimó que la inteligencia artificial generativa tiene el potencial de agregar entre 6,1 y 7,9 billones de dólares al año a la economía global mediante el aumento de la productividad laboral. Para ponerlo en contexto, la misma investigación sitúa el potencial económico anual del aumento de la productividad de todas las tecnologías de inteligencia artificial en entre 17,1 y 25,6 billones de dólares. Así que, aunque la IA generativa tiene la atención en 2023, todavía es solo una parte de todo el potencial de la IA.

Pero cada acción tiene una reacción igual y opuesta. Entonces, junto con sus perspectivas de productividad notables, la inteligencia artificial generativa trae nuevos riesgos empresariales potenciales, como la inexactitud, las violaciones de la privacidad y la exposición de la propiedad intelectual, así como la capacidad de causar trastornos económicos y sociales a gran escala. Por ejemplo, es poco probable que se materialicen los beneficios de productividad de la inteligencia artificial generativa sin esfuerzos sustanciales de reciclaje de trabajadores y, aun así, sin duda desplazarán a muchas personas de sus empleos actuales. En consecuencia, los responsables de la formulación de políticas gubernamentales en todo el mundo, e incluso algunos ejecutivos de la industria tecnológica, están abogando por la rápida adopción de regulaciones en cuanto a la inteligencia artificial.

Este artículo explora en profundidad la promesa y el peligro de la inteligencia artificial generativa: cómo funciona; sus aplicaciones, casos de uso y ejemplos más inmediatos; sus limitaciones; sus posibles beneficios y riesgos comerciales; mejores prácticas para su uso; y una perspectiva de su futuro.

¿Qué es la IA generativa?

La inteligencia artificial generativa (GAI, por sus iniciales en inglés) es el nombre dado a un subconjunto de tecnologías de machine learning de inteligencia artificial que han desarrollado recientemente la capacidad de crear rápidamente contenido en respuesta a indicaciones de texto, que pueden ser cortas y simples o muy largas y complejas. Diferentes herramientas de inteligencia artificial generativa pueden producir contenido nuevo de audio, imagen y video, pero es la inteligencia artificial conversacional orientada al texto la que ha estimulado la imaginación. En efecto, las personas pueden conversar con modelos de inteligencia artificial generativa entrenados en texto de la misma manera que lo hacen con los humanos.

La inteligencia artificial generativa tomó al mundo por sorpresa en los meses posteriores al lanzamiento de ChatGPT, un chatbot basado en el modelo de red neuronal GPT-3.5 de OpenAI, el 30 de noviembre de 2022. GPT significa "generative pretrained transformer" (transformador preentrenado generativo), palabras que describen principalmente la arquitectura subyacente de la red neuronal del modelo.

Hay muchas instancias anteriores de chatbots conversacionales, comenzando con ELIZA, del Massachusetts Institute of Technology (MIT) a mediados de la década de 1960. Pero la mayoría de los chatbots anteriores, incluido ELIZA, eran completamente o en su mayoría basados en reglas, por lo que carecían de comprensión contextual. Sus respuestas se limitaban a un conjunto de reglas y plantillas predefinidas. En contraste, los modelos de IA generativa que están surgiendo ahora no tienen reglas o plantillas predefinidas de ese tipo. Metafóricamente hablando, son cerebros primitivos en blanco (redes neuronales) que están expuestos al mundo a través del entrenamiento con información del mundo real. Luego desarrollan independientemente inteligencia, un modelo representativo de cómo funciona ese mundo, que utilizan para generar contenido novedoso en respuesta a indicaciones. Incluso los expertos en IA no saben exactamente cómo lo hacen, ya que los algoritmos se desarrollan y ajustan por sí mismos a medida que se entrena el sistema.

Las empresas grandes y pequeñas deberían estar emocionadas con el potencial de la IA generativa para llevar los beneficios de la automatización tecnológica al trabajo de conocimiento, que hasta ahora ha resistido en gran medida la automatización. Las herramientas de IA generativa cambian el cálculo de la automatización del trabajo de conocimiento; su capacidad para producir escritura, imágenes, audio o video similares a los humanos en respuesta a indicaciones en inglés sencillo significa que pueden colaborar con socios humanos para generar contenido que represente un trabajo práctico.

"En los próximos años, muchas empresas van a entrenar sus propios grandes modelos de lenguaje especializados", dijo Larry Ellison, presidente y director de tecnología de Oracle, durante la conferencia de ganancias de la compañía en junio de 2023.

IA generativa vs. IA

La inteligencia artificial es una vasta área de la informática, de la cual la IA generativa es solo una pequeña parte, al menos en la actualidad. Naturalmente, la IA generativa comparte muchas características con la IA tradicional. Pero también hay algunas diferencias importantes.

  • Atributos comunes: ambos dependen de grandes cantidades de información para el entrenamiento y la toma de decisiones (aunque los datos de entrenamiento para la IA generativa pueden ser órdenes mayores en magnitud). Ambos aprenden patrones de los datos y utilizan ese "conocimiento" para hacer predicciones y adaptar su propio comportamiento. Opcionalmente, ambos pueden mejorarse con el tiempo ajustando sus parámetros en función de comentarios o nueva información.
  • Diferencias: los sistemas de IA tradicionales generalmente están diseñados para realizar una tarea específica mejor o a un costo menor que un humano, como detectar fraudes con tarjetas de crédito, guiar en la conducción o, probablemente pronto, conducir el automóvil. La IA generativa es más amplia; crea contenido nuevo y original que se asemeja, pero no se encuentra en sus datos de entrenamiento. Además, los sistemas de IA tradicionales, como los sistemas de machine learning, se entrenan principalmente con datos específicos de su función prevista, mientras que los modelos de IA generativa se entrenan con conjuntos de datos grandes y diversos (y luego, a veces, se ajustan finamente con volúmenes de datos mucho más pequeños relacionados con una función específica). Por último, la IA tradicional casi siempre se entrena con datos etiquetados/categorizados utilizando técnicas de aprendizaje supervisado, mientras que la IA generativa siempre debe entrenarse, al menos inicialmente, utilizando aprendizaje no supervisado (donde los datos no están etiquetados y el software de IA no recibe orientación explícita).

Otra diferencia que vale la pena señalar es que el entrenamiento de modelos fundamentales para la IA generativa es "obscenamente costoso", para citar a un investigador en IA. Imagina, 100 millones de dólares solo para el hardware necesario para comenzar, más los costos equivalentes de servicios en la nube, ya que es ahí donde se realiza la mayor parte del desarrollo de la IA. Luego está el costo de los enormes volúmenes de datos que se requieren.

Conclusiones clave

  • La IA generativa se convirtió en una sensación viral en noviembre de 2022 y se espera que pronto añada billones de dólares a la economía global cada año.
  • La IA es una forma de machine learning basado en redes neuronales entrenado en vastos conjuntos de datos que puede crear contenido novedoso en texto, imágenes, video o audio en respuesta a indicaciones en lenguaje natural de los usuarios.
  • Los investigadores de mercado predicen que la tecnología impulsará un aumento económico al acelerar drásticamente el crecimiento de la productividad de los trabajadores del conocimiento, cuyas tareas han resistido la automatización hasta ahora.
  • La IA generativa conlleva riesgos y limitaciones que las empresas deben mitigar, como la "alucinar" información incorrecta o falsa y la violación inadvertida de derechos de autor.
  • También se espera que cause cambios significativos en la naturaleza del trabajo, incluyendo posibles pérdidas de empleo y reestructuración de roles.

La Inteligencia Artifical generativa en detalle

Para empresas grandes y pequeñas, la promesa aparentemente mágica de la IA generativa es que puede llevar los beneficios de la automatización tecnológica al trabajo del conocimiento. O, como lo dijo un informe de McKinsey, "actividades que involucran la toma de decisiones y la colaboración, que anteriormente tenían el menor potencial de automatización".

Históricamente, la tecnología ha sido más efectiva en la automatización de tareas rutinarias o repetitivas, para las cuales las decisiones ya eran conocidas o podían determinarse con un alto nivel de confianza, basado en reglas específicas y muy claras. Piensa en la fabricación, con su precisa repetición en la línea de montaje, o en la contabilidad, con sus principios regulados establecidos por asociaciones industriales. Pero la IA generativa tiene el potencial de realizar trabajos cognitivos mucho más sofisticados. Para sugerir un ejemplo sin duda extremo, la IA generativa podría ayudar en la formación de estrategias de una organización, respondiendo a indicaciones que soliciten ideas y escenarios alternativos de parte de los gerentes de un negocio en medio de un cambio en el sector.

En su informe, McKinsey evaluó 63 casos de uso en 16 funciones comerciales, concluyendo que el 75 % del trillón de dólares de valor potencial que podría lograrse con la IA generativa provendrá de un subconjunto de casos de uso en solo cuatro de esas funciones: operaciones con clientes, marketing y ventas, ingeniería de software e investigación y desarrollo. Las perspectivas de aumento de ingresos en todas las industrias estaban distribuidas de manera más uniforme, aunque hubo destacados: la alta tecnología encabezó la lista en cuanto al posible impulso, en términos de porcentaje de los ingresos del sector, seguida de la banca, productos farmacéuticos y médicos, educación, telecomunicaciones y atención sanitaria.

Por separado, un análisis de Gartner concuerda con las predicciones de McKinsey: por ejemplo, en cuanto a que más del 30 % de los nuevos medicamentos y materiales se descubrirán mediante técnicas de IA generativa para 2025, frente a cero hoy, y que el 30 % de los mensajes de marketing salientes de las grandes organizaciones serán generados de manera sintética en 2025, frente al 2 % en 2022. Y en una encuesta en línea, Gartner encontró que la experiencia y retención del cliente fue la respuesta principal (con un 38 %) de 2500 ejecutivos a quienes se les preguntó dónde estaban invirtiendo sus organizaciones en IA generativa.

Lo que hace posible que todo esto suceda tan rápido es que, a diferencia de la IA tradicional, que ha estado automatizando y agregando valor silenciosamente a los procesos comerciales durante décadas, la IA generativa llegó a la conciencia del mundo gracias a la habilidad conversacional humana de ChatGPT. Eso también ha atraído a las personas y ha arrojado luz sobre la tecnología de la IA generativa, que se enfoca en otras modalidades. Parece que todos están experimentando con la escritura de texto o creando música, imágenes y videos utilizando uno o más de los diversos modelos que se especializan en cada área. Entonces, con muchas organizaciones ya experimentando con la IA generativa, es probable que su impacto en los negocios y la sociedad sea colosal, y ocurrirá asombrosamente rápido.

La desventaja obvia es que el trabajo de conocimiento cambiará. Los roles individuales cambiarán, a veces de manera significativa, por lo que los trabajadores deberán aprender nuevas habilidades. Algunos trabajos se perderán. Sin embargo, históricamente los grandes cambios tecnológicos, como la IA generativa, siempre han agregado más empleos (y de mayor valor) a la economía que los que eliminan. Pero esto es de poco consuelo para aquellos cuyos empleos son eliminados.

¿Cómo funciona?

Hay dos respuestas a la pregunta de cómo funcionan los modelos de IA generativa. Empíricamente, sabemos cómo funcionan en detalle porque los humanos diseñaron sus diversas implementaciones de redes neuronales para hacer exactamente lo que hacen, iterando esos diseños durante décadas para mejorarlos cada vez más. Los desarrolladores de IA saben exactamente cómo están conectadas las neuronas; ellos diseñaron el proceso de entrenamiento de cada modelo. Sin embargo, en la práctica, nadie sabe exactamente cómo hacen lo que hacen los modelos de IA generativa, esa es una verdad vergonzosa.

"No sabemos cómo realizan la tarea creativa real porque lo que sucede dentro de las capas de la red neuronal es demasiado complejo para que lo descifremos, al menos hoy en día", dijo Dean Thompson, antiguo director de tecnología de múltiples startups de IA que han sido adquiridas a lo largo de los años por empresas como LinkedIn y Yelp, donde todavía trabaja como ingeniero de software sénior en grandes modelos de lenguaje (LLM). La capacidad de la IA generativa para producir contenido nuevo y original parece ser una propiedad emergente de lo que se conoce, es decir, su estructura y entrenamiento. Entonces, si bien hay mucho que explicar en lo que sabemos, lo que un modelo como GPT-3.5 realmente está haciendo internamente, lo que está pensando, por así decirlo, todavía no se ha descubierto. Algunos investigadores de IA están seguros de que esto se sabrá en los próximos 5 a 10 años; otros no están seguros de que se llegue a comprender completamente.

Aquí hay una descripción general de lo que sabemos sobre cómo funciona la IA generativa:

  • Comencemos por el cerebro. Un buen lugar para comenzar a entender los modelos de IA generativa es con el cerebro humano, según Jeff Hawkins en su libro de 2004, "On Intelligence". Hawkins, científico informático y neurocientífico, presentó su trabajo en una sesión de 2005 en PC Forum, que fue una conferencia anual de ejecutivos de tecnología líderes liderados por la inversora tecnológica Esther Dyson. Hawkins hipotetizó que, a nivel neuronal, el cerebro funciona mediante la predicción continua de lo que va a suceder y luego aprende de las diferencias entre sus predicciones y la realidad posterior. Para mejorar su capacidad predictiva, el cerebro construye una representación interna del mundo. En su teoría, la inteligencia humana surge de ese proceso. Ya sea influenciada por Hawkins o no, la IA generativa funciona exactamente de esta manera. Y, sorprendentemente, actúa como si fuera inteligente.

  • Construir una red neuronal artificial. Todos los modelos de IA generativa comienzan con una red neuronal artificial codificada en software. Thompson dice que una buena metáfora visual para una red neuronal es imaginar la conocida hoja de cálculo, pero en tres dimensiones, porque las neuronas artificiales están apiladas en capas, similar a cómo las neuronas reales están apiladas en el cerebro. Los investigadores de IA incluso llaman a cada neurona una "célula", señala Thompson, y cada célula contiene una fórmula que la relaciona con otras células en la red, imitando la forma en que las conexiones entre las neuronas del cerebro tienen diferentes intensidades.

    Cada capa puede tener decenas, cientos o miles de neuronas artificiales, pero la cantidad de neuronas no es en lo que se centran los investigadores de IA. En su lugar, miden los modelos por la cantidad de conexiones entre las neuronas. Las intensidades de estas conexiones varían según los coeficientes de las ecuaciones de sus células, que se conocen más generalmente como "pesos" o "parámetros". Estos coeficientes que definen las conexiones son a los que se hace referencia cuando lees, por ejemplo, que el modelo GPT-3 tiene 175 mil millones de parámetros. Se dice que la última versión, GPT-4, tiene billones de parámetros, aunque esto no está confirmado. Hay un puñado de arquitecturas de redes neuronales con características diferentes que se prestan a la producción de contenido en una modalidad particular; la arquitectura de transformadores parece ser la mejor para modelos de lenguaje grandes, por ejemplo.

  • Educar al recién nacido modelo de red neuronal. A los grandes modelos de lenguaje se les proporcionan volúmenes enormes de texto para procesar y se les encarga hacer predicciones simples, como la siguiente palabra en una secuencia o el orden correcto de un conjunto de oraciones. Sin embargo, en la práctica, los modelos de red neuronal trabajan en unidades llamadas tokens, no palabras.

    "Una palabra común puede tener su propio token, palabras inusuales seguramente estarían compuestas por múltiples tokens y algunos tokens pueden ser simplemente un espacio seguido de 'th' porque esa secuencia de tres caracteres es muy común", dijo Thompson. Para hacer cada predicción, el modelo ingresa un token en la capa inferior de una pila particular de neuronas artificiales; esa capa lo procesa y pasa su salida a la siguiente capa, que la procesa y la pasa a su salida, y así sucesivamente hasta que la salida final emerge en la parte superior de la pila. Los tamaños de las pilas pueden variar significativamente, pero generalmente son del orden de decenas de capas, no miles o millones.

    En las primeras etapas de entrenamiento, las predicciones del modelo no son muy buenas. Pero cada vez que el modelo predice un token, verifica si es correcto con respecto a los datos de entrenamiento. Ya sea correcta o incorrecta, un algoritmo de "retropropagación" ajusta los parámetros, es decir, los coeficientes de las fórmulas, en cada celda de la pila que hizo esa predicción. El objetivo de los ajustes es hacer que la predicción correcta sea más probable.

    "Hace esto incluso para respuestas correctas, porque esa predicción correcta puede haber tenido, digamos, un 30 % de certeza, pero ese 30 % fue el más alto entre todas las otras respuestas posibles", dijo Thompson. "Entonces, la retropropagación busca convertir ese 30 % en un 30,001 % o algo así".

    Después de que el modelo haya repetido este proceso para billones de tokens de texto, se vuelve muy bueno para predecir el siguiente token o palabra. Después del entrenamiento inicial, los modelos de IA generativa se pueden ajustar mediante una técnica de aprendizaje supervisado, como el aprendizaje de refuerzo a partir de retroalimentación humana (RLHF, reinforcement learning from human feedback). En el RLHF, la producción del modelo se presenta a revisores humanos que hacen una evaluación binaria positiva o negativa, "pulgar arriba" o "pulgar abajo", que se retroalimenta al modelo. El RLHF se utilizó para ajustar el modelo GPT 3.5 de OpenAI y ayudar a crear el chatbot ChatGPT que se volvió viral.

  • Pero ¿cómo respondió el modelo a mi pregunta? Es un misterio. Así es como Thompson explica el estado actual de la comprensión: "Hay un gran 'simplemente no sabemos' en medio de mi explicación. Lo que sabemos es que toma toda tu pregunta como una secuencia de tokens y en la primera capa los procesa todos simultáneamente. Y sabemos que luego procesa las salidas de esa primera capa en la siguiente capa, y así sucesivamente en la pila. Y luego sabemos que utiliza esa capa superior para predecir, es decir, producir un primer token, y ese primer token se representa como un dato en todo ese sistema para producir el siguiente token, y así sucesivamente.

    La pregunta lógica siguiente es, ¿en qué pensó y cómo, en todo ese procesamiento? ¿Qué hicieron todas esas capas? Y la respuesta más contundente es que no lo sabemos. No... sabemos. Puedes estudiarlo. Puedes observarlo. Pero es demasiado complejo para que lo analicemos. Es como la F-MRI [imagen por resonancia magnética funcional] en el cerebro humano. Es el boceto más rudimentario de lo que el modelo realmente hizo. No lo sabemos".

    Aunque es controvertido, un grupo de más de una docena de investigadores que tuvieron acceso temprano a GPT-4 en otoño de 2022 concluyó que la inteligencia con la que el modelo responde a desafíos complejos que le plantearon y la amplia gama de conocimientos que exhibe indican que GPT-4 ha alcanzado una forma de inteligencia general. En otras palabras, ha construido un modelo interno de cómo funciona el mundo, al igual que podría hacerlo un cerebro humano, y utiliza ese modelo para razonar las preguntas que se le plantean. Uno de los investigadores le dijo al podcast "This American Life" que tuvo un momento de "¡santo cielo!" cuando le pidió a GPT-4 que le diera "una receta de galletas con chispas de chocolate, pero escrita en el estilo de una persona muy deprimida", y el modelo respondió: "Ingredientes: 1 taza de mantequilla ablandada, si es que puedes encontrar la energía para ablandarla. 1 cucharadita de extracto de vainilla, el sabor artificial y falso de la felicidad. 1 taza de chispas de chocolate semidulces, pequeñas alegrías que eventualmente se derretirán por completo".

¿Por qué es importante?

Una forma útil de entender la importancia de la IA generativa es pensar en ella como una calculadora para contenido creativo y de final abierto. Al igual que una calculadora automatiza matemáticas rutinarias y mundanas, liberando a una persona para enfocarse en tareas de nivel superior, la IA generativa tiene el potencial de automatizar las tareas más rutinarias y mundanas que componen gran parte del trabajo de conocimiento, permitiendo que las personas se centren en las partes de nivel superior del trabajo.

Consideremos los desafíos a los que se enfrentan los profesionales del marketing al obtener conocimientos accionables a partir de datos no estructurados, inconsistentes y desconectados que a menudo encuentran. Tradicionalmente, necesitarían consolidar esos datos como primer paso, lo que requiere una cantidad considerable de ingeniería de software personalizado para dar una estructura común a fuentes de datos dispares, como redes sociales, noticias y comentarios de clientes.

"Pero con los LLM, puedes simplemente ingresar información de diferentes fuentes directamente en la solicitud y luego pedir conocimientos clave, o qué retroalimentación priorizar, o solicitar un análisis de sentimiento, y simplemente funcionará", dijo Basim Baig, un gerente de ingeniería sénior especializado en IA y seguridad en Duolingo. "El poder de LLM aquí es que te permite omitir ese paso de ingeniería enorme y costoso".

Pensando más allá, Thompson sugiere que los profesionales de marketing de productos podrían usar los LLM para etiquetar texto libre para su análisis. Por ejemplo, imagina que tienes una gran base de datos de menciones en redes sociales de tu producto. Podrías escribir software que aplique un LLM y otras tecnologías para:

  • Extraer los temas principales de cada publicación en redes sociales.
  • Agrupar los temas idiosincráticos que surgen de publicaciones individuales en temas recurrentes.
  • Identificar qué publicaciones respaldan cada tema recurrente.

Luego podrías aplicar los resultados para:

  • Estudiar los temas recurrentes más frecuentes, haciendo clic en ejemplos.
  • Seguir el aumento y la disminución de temas recurrentes.
  • Pedir a un LLM que profundice en un tema recurrente para menciones frecuentes de las características del producto.

Modelos de IA generativa

La IA generativa representa una amplia categoría de aplicaciones basadas en una creciente gama de variaciones de redes neuronales. Aunque toda la IA generativa se ajusta a la descripción general en la sección ¿Cómo funciona la IA generativa?, las técnicas de implementación varían para admitir diferentes medios, como imágenes frente a texto, y para incorporar avances de la investigación y la industria a medida que surgen.

Los modelos de redes neuronales utilizan patrones repetitivos de neuronas artificiales y sus interconexiones. Un diseño de red neuronal, para cualquier aplicación, incluida la IA generativa, a menudo repite el mismo patrón de neuronas cientos o miles de veces, generalmente reutilizando los mismos parámetros. Esto es una parte esencial de lo que se llama "arquitectura de red neuronal". El descubrimiento de nuevas arquitecturas ha sido una parte importante de la innovación en IA desde la década de 1980, a menudo impulsado por el objetivo de apoyar un nuevo medio. Pero luego, una vez que se ha inventado una nueva arquitectura, a menudo se logra un progreso adicional al utilizarla de formas inesperadas. La innovación adicional proviene de combinar elementos de diferentes arquitecturas.

Dos de las arquitecturas más antiguas y comunes son:

  • Las redes neuronales recurrentes (RNN) surgieron a mediados de la década de 1980 y siguen en uso. Las RNN demostraron cómo la IA podía aprender y ser utilizada para automatizar tareas que dependen de datos secuenciales, es decir, información cuya secuencia contiene significado, como el lenguaje, el comportamiento del mercado de valores y las secuencias de clics en la web. Las RNN son la base de muchos modelos de IA de audio, como aplicaciones generadoras de música; piensa en la naturaleza secuencial de la música y las dependencias basadas en el tiempo. Pero también son eficaces en el procesamiento de lenguaje natural (NLP). Las RNN también se utilizan en funciones tradicionales de IA, como el reconocimiento de voz, el análisis de escritura a mano, las previsiones financieras y meteorológicas, y para predecir variaciones en la demanda de energía, entre muchas otras aplicaciones.
  • Las redes neuronales convolucionales (CNN) surgieron aproximadamente 10 años después. Se centran en datos en forma de cuadrícula y, por lo tanto, son excelentes para representaciones de datos espaciales y pueden generar imágenes. Aplicaciones populares de IA generativa de texto a imagen, como Midjourney y DALL-E, utilizan CNN para generar la imagen final.

Aunque las RNN todavía se utilizan con frecuencia, los esfuerzos sucesivos para mejorar las RNN llevaron a un avance:

  • Los modelos transformadores han evolucionado en una forma mucho más flexible y poderosa de representar secuencias que las RNN. Tienen varias características que les permiten procesar datos secuenciales, como texto, en cantidades enormes y en paralelo sin perder su comprensión de las secuencias. Ese procesamiento paralelo de datos secuenciales es una de las características clave que permite que ChatGPT responda tan rápido y bien a los prompts en lenguaje natural.

La investigación, la industria privada y los esfuerzos de código abierto han creado modelos impactantes que innovan en niveles más altos de arquitectura de redes neuronales y aplicación. Por ejemplo, ha habido innovaciones cruciales en el proceso de entrenamiento, en cómo se incorpora la retroalimentación del entrenamiento para mejorar el modelo y en cómo se pueden combinar múltiples modelos en aplicaciones de IA generativa. Aquí hay un resumen de algunas de las innovaciones más importantes en modelos de IA generativa:

  • Los autoencoders variacionales (VAE) utilizan innovaciones en la arquitectura de redes neuronales y en los procesos de entrenamiento y a menudo se incorporan en aplicaciones generadoras de imágenes. Consisten en redes de codificación y decodificación, cada una de las cuales puede utilizar una arquitectura subyacente diferente, como RNN, CNN o transformador. El codificador aprende las características importantes y las características de una imagen, comprime esa información y la almacena como una representación en memoria. Luego, el decodificador utiliza esa información comprimida para intentar recrear la original. En última instancia, los VAE aprenden a generar nuevas imágenes similares a sus datos de entrenamiento.
  • Las redes generativas antagónicas (GAN) se utilizan en diversas modalidades, pero parecen tener una afinidad especial por el video y otras aplicaciones relacionadas con imágenes. Lo que distingue a las GAN de otros modelos es que consisten en dos redes neuronales que compiten entre sí mientras se entrenan. En el caso de las imágenes, por ejemplo, el "generador" crea una imagen y el "discriminador" decide si la imagen es real o generada. El generador está constantemente tratando de engañar al discriminador, que siempre intenta atrapar al generador en el acto. En la mayoría de los casos, las dos redes neuronales en competencia se basan en arquitecturas CNN, pero también pueden ser variantes de RNN o transformadores.
  • Los modelos de difusión incorporan múltiples redes neuronales en un marco general, a veces integrando diferentes arquitecturas como CNN, transformadores y VAE. Los modelos de difusión aprenden comprimiendo datos, agregando ruido, desenfocando y tratando de regenerar el original. La popular herramienta Stable Diffusion utiliza un codificador y un decodificador VAE para los primeros y últimos pasos, respectivamente, y dos variantes de CNN en los pasos de ruido/desenfoque.

¿Cuáles son las aplicaciones de la IA generativa?

Si bien el mundo apenas ha comenzado a explorar el potencial de las aplicaciones de la IA generativa, es fácil ver cómo las empresas pueden beneficiarse al aplicarla en sus operaciones. Considera cómo la IA generativa podría cambiar las áreas clave de interacciones con los clientes, ventas y marketing, ingeniería de software e investigación y desarrollo.

En el servicio al cliente, la tecnología de la IA anterior automatizó procesos e introdujo la autoatención, pero también generó nuevas frustraciones para los clientes. La IA generativa promete brindar beneficios tanto a los clientes como a los representantes de servicio, con chatbots que pueden adaptarse a diferentes idiomas y regiones, creando una experiencia de cliente más personalizada y accesible. Cuando se necesita la intervención humana para resolver un problema del cliente, los representantes de servicio pueden colaborar en tiempo real con herramientas de IA generativa para encontrar estrategias eficaces, mejorando la velocidad y precisión de las interacciones. La velocidad con la que la IA generativa puede acceder a la base de conocimientos completa de una empresa y sintetizar nuevas soluciones para las quejas de los clientes brinda al personal de servicio una mayor capacidad para resolver eficazmente problemas específicos de los clientes, en lugar de depender de sistemas telefónicos obsoletos y transferencias de llamadas hasta encontrar una respuesta, o hasta que el cliente pierda la paciencia.

En marketing, la IA generativa puede automatizar la integración y el análisis de datos de fuentes diversas, lo que debería acelerar drásticamente el tiempo necesario para obtener ideas e impulsar la toma de decisiones mejor informadas y el desarrollo más rápido de estrategias de entrada al mercado. Los profesionales del marketing pueden utilizar esta información junto con otras ideas generadas por IA para crear nuevas campañas publicitarias más específicas. Esto reduce el tiempo que el personal debe gastar recopilando datos demográficos y de comportamiento de compra y brinda más tiempo para analizar resultados y generar nuevas ideas.

Tom Stein, presidente y director de marca de la agencia de marketing B2B Stein IAS, señala que cada agencia de marketing, incluida la suya, está explorando estas oportunidades a gran velocidad. Stein también señala que existen victorias más simples y rápidas para los procesos internos de una agencia.

"Si obtenemos una RFI [solicitud de información], por lo general, del 70 al 80 % de la RFI pedirá la misma información que cualquier otra RFI, tal vez con algunas diferencias contextuales específicas según la situación de esa compañía", dice Stein, quien también fue presidente del jurado de los Cannes Lions Creative B2B Awards 2023. "No es tan complicado ponernos en una posición para que cualquier número de herramientas de IA hagan ese trabajo por nosotros ... Así que, si recuperamos ese 80 % de nuestro tiempo y podemos pasarlo agregando valor a la RFI y simplemente haciéndola cantar, eso es una victoria de todas maneras. Y hay una serie de procesos como ese".

En desarrollo de software, la colaboración con la IA generativa puede simplificar y acelerar los procesos en cada paso, desde la planificación hasta el mantenimiento. Durante la fase inicial de creación, las herramientas de IA generativa pueden analizar y organizar grandes cantidades de datos y sugerir múltiples configuraciones de programas. Una vez que comienza la codificación, la IA puede probar y solucionar problemas, identificar errores, ejecutar diagnósticos y sugerir soluciones, tanto antes como después del lanzamiento. Thompson señala que debido a que muchos proyectos de software empresarial incorporan múltiples lenguajes de programación y disciplinas, él y otros ingenieros de software han utilizado la IA para capacitarse en áreas desconocidas mucho más rápido de lo que podían hacerlo anteriormente. También ha utilizado herramientas de IA generativa para explicar código desconocido e identificar problemas específicos.

En investigación y desarrollo (I+D), la IA generativa puede aumentar la velocidad y la profundidad de la investigación de mercado durante las fases iniciales del diseño de productos. Luego, los programas de IA, especialmente aquellos con capacidades de generación de imágenes, pueden crear diseños detallados de posibles productos antes de simularlos y probarlos, brindando a los trabajadores las herramientas que necesitan para realizar ajustes rápidos y efectivos a lo largo del ciclo de I+D.

Larry Ellison, fundador de Oracle, señaló en la conferencia de ganancias de junio que "los LLM especializados acelerarán el descubrimiento de nuevos medicamentos que salvan vidas". El descubrimiento en cuanto a medicamentos es una aplicación de I+D que explota la tendencia de los modelos generativos a "alucinar" información incorrecta o no verificable, pero de manera positiva: identificar nuevas moléculas y secuencias de proteínas en busca de tratamientos de salud novedosos. Por separado, la subsidiaria de Oracle Cerner Enviza se ha asociado con U.S. Food and Drug Administration (FDA) y John Snow Labs para aplicar herramientas de IA al desafío de "comprender los efectos de los medicamentos en grandes poblaciones". La estrategia de IA de Oracle es hacer que la inteligencia artificial esté presente en sus aplicaciones en la nube y su infraestructura en la nube.

Casos de uso

La IA generativa tiene el potencial de acelerar o automatizar completamente una amplia variedad de tareas. Las empresas deben planificar formas deliberadas y específicas para maximizar los beneficios que puede aportar a sus operaciones. Aquí tienes algunos casos de uso específicos:

  • Cubrir lagunas de conocimiento: con sus interfaces de usuario sencillas basadas en chat, las herramientas de IA generativa pueden responder a preguntas generales o específicas de los trabajadores para orientarlos en la dirección correcta cuando se quedan atascados en cualquier cosa, desde las consultas más simples hasta operaciones complejas. Por ejemplo, los vendedores pueden solicitar información sobre una cuenta específica; los programadores pueden aprender nuevos lenguajes de programación.
  • Comprobar errores: las herramientas de IA generativa pueden buscar errores en cualquier texto, desde correos electrónicos informales hasta muestras de escritura profesional. Y pueden hacer más que corregir errores: pueden explicar el qué y el por qué para ayudar a los usuarios a aprender y mejorar su trabajo.
  • Mejorar la comunicación: las herramientas de IA generativa pueden traducir texto a diferentes idiomas, ajustar el tono, crear mensajes únicos basados en diferentes conjuntos de datos, entre otras cosas. Los equipos de marketing pueden utilizar herramientas de IA generativa para crear campañas publicitarias más relevantes, mientras que el personal interno puede utilizarla para buscar comunicaciones anteriores y encontrar rápidamente información relevante y respuestas a preguntas sin interrumpir a otros empleados. Thompson cree que esta capacidad de sintetizar el conocimiento institucional en cualquier pregunta o idea que un trabajador pueda tener cambiará fundamentalmente la forma en que las personas se comunican dentro de las grandes organizaciones, potenciando el descubrimiento de conocimiento.
  • Aliviar la carga administrativa: las empresas con cargas administrativas pesadas, como la codificación y facturación médica, pueden utilizar la IA generativa para automatizar tareas complejas, como archivar documentos de manera adecuada y analizar notas de médicos. Esto libera al personal para centrarse en trabajos más prácticos, como la atención al paciente o el servicio al cliente.
  • Analizar imágenes médicas en busca de anomalías: los proveedores de atención médica pueden utilizar la IA generativa para examinar registros e imágenes médicas y señalar problemas destacados, además de proporcionar recomendaciones de medicamentos contextualizadas con el historial del paciente.
  • Solucionar problemas de código: los ingenieros de software pueden utilizar modelos de IA generativa para solucionar problemas y ajustar su código de forma más rápida y fiable que el peinado, línea por línea. Luego, pueden pedirle a la herramienta explicaciones más detalladas para informar la codificación futura y mejorar sus procesos.

¿Cuáles son los beneficios de la Inteligencia Artifical Generativa?

Los beneficios que la IA generativa puede aportar a un negocio se derivan principalmente de tres atributos generales: síntesis de conocimientos, colaboración humano-IA y velocidad. Si bien muchos de los beneficios señalados a continuación son similares a los prometidos en el pasado por los modelos de IA y las herramientas de automatización, la presencia de uno o más de estos tres atributos puede ayudar a las empresas a darse cuenta de las ventajas de forma más rápida, fácil y efectiva.

Con la IA generativa, las organizaciones pueden construir modelos personalizados entrenados en su propio conocimiento institucional y propiedad intelectual (PI), después de lo cual los trabajadores del conocimiento pueden pedir al software que colabore en una tarea en el mismo idioma que podrían usar con un colega. Un modelo de IA generativa especializado puede responder sintetizando información de toda la base de conocimientos corporativos a una velocidad asombrosa. Este enfoque no solo reduce o elimina la necesidad de experiencia en ingeniería de software compleja y, a menudo, menos efectiva y más costosa para crear programas específicos para estas tareas, sino que también es probable que descubra ideas y conexiones que enfoques anteriores no pudieron.

  • Aumentar la productividad: los trabajadores del conocimiento pueden utilizar la IA generativa para reducir el tiempo que dedican a tareas diarias rutinarias, como educarse sobre una nueva disciplina necesaria repentinamente para un proyecto próximo, organizar o categorizar datos, buscar en internet investigaciones aplicables o redactar correos electrónicos. Al aprovechar la IA generativa, menos empleados pueden realizar tareas que antes requerían equipos grandes u horas de trabajo en una fracción del tiempo. Por ejemplo, un equipo de programadores podría pasar horas revisando código defectuoso para solucionar los problemas, pero una herramienta de IA generativa podría encontrar los errores en cuestión de segundos y mostrarlos junto con soluciones sugeridas. Debido a que algunos modelos de IA generativa poseen habilidades que son aproximadamente promedio o mejores en un amplio espectro de competencias de trabajo del conocimiento, colaborar con un sistema de IA generativa puede aumentar drásticamente la productividad de su socio humano. Por ejemplo, un gerente de producto junior podría desempeñar también la función de un gerente de proyectos intermedio con un asistente de IA a su lado. Todas estas capacidades acelerarían de manera significativa la capacidad de los trabajadores del conocimiento para completar un proyecto.

  • Reducir costos: debido a su velocidad, las herramientas de IA generativa reducen el costo de completar procesos y, si se tarda la mitad del tiempo en realizar una tarea, la tarea cuesta la mitad de lo que costaría de otra manera. Además, la IA generativa puede minimizar errores, eliminar tiempos de inactividad e identificar redundancias y otras ineficiencias costosas. Sin embargo, existe un equilibrio: debido a la tendencia de la IA generativa a "alucinar", la supervisión humana y el control de calidad aún son necesarios. Pero se espera que las colaboraciones entre humanos y AI hagan mucho más trabajo en menos tiempo que los humanos solos, y mejor y más precisamente que las herramientas de IA por sí mismas, reduciendo así los costos. Mientras se prueban nuevos productos, por ejemplo, la IA generativa puede ayudar a crear simulaciones más avanzadas y detalladas que las herramientas antiguas podrían. Esto, en última instancia, reduce el tiempo y el costo de las pruebas de nuevos productos.

  • Mejorar la satisfacción del cliente: los clientes pueden obtener una experiencia superior y más personalizada a través del autoservicio basado en la IA generativa y las herramientas de IA generativa que "susurran" a los representantes de servicio al cliente, proporcionándoles conocimiento en tiempo real. Si bien los chatbots de servicio al cliente impulsados por IA que encontramos hoy en día pueden parecer a veces limitados, es fácil imaginar una experiencia de cliente de mucha mayor calidad impulsada por un modelo de IA generativa especialmente entrenado por una empresa, basado en la calidad de las conversaciones de ChatGPT de hoy en día.

  • Toma de decisiones mejor informadas: los modelos de IA generativa específicos de la empresa y especialmente entrenados pueden proporcionar información detallada a través de la modelización de escenarios, la evaluación de riesgos y otros enfoques sofisticados de análisis predictivo. Los tomadores de decisiones pueden aprovechar estas herramientas para obtener una comprensión más profunda de su industria y la posición de su negocio en ella a través de recomendaciones personalizadas y estrategias accionables, basadas en datos más completos y un análisis más rápido de lo que los analistas humanos o la tecnología más antigua podrían generar por sí solos.

    Por ejemplo, los tomadores de decisiones pueden planificar mejor la asignación de inventario antes de una época ocupada mediante pronósticos de demanda más precisos posibles, gracias a una combinación de datos internos recopilados por su sistema de planificación de recursos empresariales (ERP) y una investigación de mercado externa integral, que luego es analizada por un modelo de IA generativa especializado. En este caso, una mejor toma de decisiones de asignación minimiza la compra excesiva y las carencias de stock mientras maximiza las ventas potenciales.

  • Lanzar productos más rápido: la IA generativa puede producir rápidamente prototipos de productos y primeros borradores, ayudar a perfeccionar trabajos en curso y probar/solucionar problemas de proyectos existentes para encontrar mejoras mucho más rápido que lo que era posible anteriormente.

  • Controlar la calidad: un modelo de IA generativa especializado en la empresa probablemente expondrá vacíos e inconsistencias en los manuales de usuario, videos y otros contenidos que una empresa presenta al público.

Una muestra de los beneficios específicos de la IA generativa
  Síntesis de conocimientos Colaboración humano-IA Velocidad
Incremento de la productividad Organizar datos, acelerar investigaciones, primeros borradores de productos. Educar a los trabajadores en nuevas disciplinas, sugerir formas novedosas de resolver problemas. Acelerar la capacidad de los trabajadores del conocimiento para completar un nuevo proyecto.
Costos reducidos Identificar redundancias e ineficiencias para mejorar flujos de trabajo. Minimizar errores humanos, reducir el tiempo de inactividad mediante supervisión colaborativa. Completar tareas más rápido (si una tarea lleva la mitad del tiempo, cuesta la mitad).
Mejora de la satisfacción del cliente Organizar y recuperar rápidamente información de cuentas de clientes para acelerar la resolución de problemas. Mejorar los chatbots para automatizar interacciones simples y proporcionar mejor información a los representantes cuando se necesita ayuda humana. Proporcionar actualizaciones e información en tiempo real tanto a los clientes como a los representantes de servicio.
Toma de decisiones mejor informadas Realizar un seguimiento rápido de los insights mediante el análisis predictivo, como el modelado de escenarios y la evaluación de riesgos. Ofrecer recomendaciones personalizadas y estrategias accionables para los tomadores de decisiones. Generar análisis más rápidos a partir de datos más amplios que los analistas humanos o la tecnología más antigua.
Lanzar productos más rápido Producir prototipos y "productos mínimos viables" (MVP). Probar y solucionar problemas en proyectos existentes para encontrar mejoras mucho más rápido que antes. Incrementar la velocidad a la que se pueden implementar ajustes.

¿Cuáles son las limitaciones?

Cualquier persona que haya utilizado herramientas de IA generativa para la educación y/o investigación probablemente ha experimentado su limitación más conocida: inventan cosas. Dado que el modelo solo predice la siguiente palabra, puede extrapolar de sus datos de entrenamiento para afirmar falsedades con la misma autoridad que las verdades que informa. Esto es a lo que se refieren los investigadores de IA con la "alucinación", y es una de las razones clave por las que la actual generación de herramientas de IA generativa requiere colaboradores humanos. Las empresas deben tener cuidado de prepararse y gestionar esta y otras limitaciones mientras implementan la IA generativa. Si una empresa establece expectativas poco realistas o no gestiona eficazmente la tecnología, las consecuencias pueden perjudicar el rendimiento y la reputación de la empresa.

  • Requiere supervisión: los modelos de IA generativa pueden introducir información falsa o engañosa, a menudo con tanto detalle y tono autoritario que incluso los expertos pueden ser engañados. Del mismo modo, sus resultados pueden contener lenguaje sesgado u ofensivo aprendido del conjunto de datos en el que se entrenó el modelo. Los humanos siguen siendo una parte fundamental del flujo de trabajo para evitar que estos resultados defectuosos se propaguen y lleguen a los clientes o influyan en la política de la empresa.
  • Potencia informática e inversión inicial: los modelos de IA generativa requieren cantidades masivas de potencia informática tanto para el entrenamiento como para el funcionamiento. Muchas empresas carecen de los recursos y la experiencia necesarios para construir y mantener estos sistemas por sí mismas. Esta es una de las razones por las que gran parte del desarrollo de IA generativa se realiza utilizando infraestructura en la nube.
  • Potencial para converger, no divergir: las organizaciones que no construyen sus propios modelos especializados pueden depender en cambio de herramientas públicas de IA generativa y pueden estar condenadas a la mediocridad. A menudo, descubrirán que sus conclusiones son idénticas a las de otros porque se basan en los mismos datos de entrenamiento. A menos que estas empresas infundan su trabajo con innovación humana, pueden encontrarse adaptándose efectivamente a las mejores prácticas actuales, pero luchando por encontrar un diferenciador competitivo.
  • Resistencia del personal y los clientes: el personal, especialmente los empleados de larga data con protocolos y métodos arraigados, puede tener dificultades para adaptarse a la IA generativa, lo que lleva a una disminución de la productividad mientras se adaptan. Del mismo modo, el personal puede resistirse a la tecnología por miedo a perder sus empleos. Los gerentes y líderes empresariales deben calmar estos temores y ser abiertos y transparentes acerca de cómo la tecnología cambiará o no cambiará la estructura de la empresa.

Riesgos y preocupaciones de la IA generativa

La IA generativa ha suscitado reacciones extremas en ambos extremos del espectro de riesgo. Algunos grupos están preocupados de que lleve a la extinción humana, mientras que otros insisten en que salvará al mundo. Estos extremos están fuera del alcance de este artículo. Sin embargo, aquí hay algunos riesgos y preocupaciones importantes que los líderes empresariales que implementan la tecnología de IA deben comprender para que puedan tomar medidas para mitigar posibles consecuencias negativas.

  • Confianza y fiabilidad: los modelos de IA generativa hacen afirmaciones inexactas, a veces alucinan información completamente fabricada. De manera similar, muchos modelos se entrenan con datos antiguos, generalmente examinando solo información publicada hasta una fecha determinada, por lo que lo que funcionaba en el mercado del año pasado puede que ya no sea relevante o útil. Por ejemplo, las empresas que buscan mejorar sus operaciones de cadena de suministro pueden descubrir que las sugerencias de sus modelos están desactualizadas y no son relevantes en la cambiante economía global. Los usuarios deben verificar todas las afirmaciones antes de actuar sobre ellas para garantizar precisión y relevancia.

  • Privacidad/propiedad intelectual: los modelos de IA generativa a menudo continúan aprendiendo a partir de la información proporcionada como parte de los estímulos. Las empresas, especialmente aquellas que recopilan información personal sensible de sus clientes, como las prácticas médicas, deben tener cuidado de no exponer propiedad protegida o datos confidenciales. Si el modelo accede a esta información, puede aumentar la probabilidad de exposición.

  • Ingeniería social supercargada: los actores amenazantes ya están utilizando la IA generativa para ayudarles a personalizar mejor la ingeniería social y otros ciberataques, haciéndolos parecer más auténticos.

    "Actualmente, es muy difícil distinguir si estás hablando con un bot o un humano en línea", dijo Baig, el ingeniero de IA y seguridad de Duolingo. "Se ha vuelto mucho más fácil para los criminales que buscan ganar dinero generar una gran cantidad de contenido que pueda engañar a las personas".

  • Disminución en la calidad y originalidad de los resultados: la IA generativa puede hacer que la construcción de productos y contenido sea más fácil y rápida, pero no garantiza un resultado de mayor calidad. Confiar en modelos de IA sin una colaboración significativa de humanos puede dar como resultado productos estandarizados y carentes de creatividad.

  • Sesgo: si un modelo de IA generativa se entrena con datos sesgados, que van desde lagunas en perspectivas hasta contenido perjudicial y prejuicioso, esos sesgos se reflejarán en su producción. Por ejemplo, si una empresa históricamente ha contratado solo un tipo de empleado, el modelo puede cotejar a los nuevos solicitantes con el "candidato ideal" y eliminar candidatos calificados porque no se ajustan, incluso si la organización tenía la intención de descartar el molde.

  • Inteligencia artificial en la sombra: el uso de la IA generativa por parte de los empleados sin el conocimiento o la aprobación oficial de la organización puede llevar a que la empresa divulgue información incorrecta o viole los derechos de autor de otra organización.

  • Colapso del modelo: los investigadores de IA han identificado un fenómeno llamado colapso del modelo que podría hacer que los modelos de IA generativa sean menos útiles con el tiempo. Básicamente, a medida que el contenido generado por IA se propaga, los modelos entrenados con esos datos sintéticos, que inevitablemente contienen errores, eventualmente "olvidarán" las características de los datos generados por humanos en los que se entrenaron originalmente. Esta preocupación puede llegar a un punto crítico a medida que Internet se llene cada vez más de contenido de IA, creando un ciclo de retroalimentación que degrada el modelo.

  • Regulación de la IA: debido a que la IA generativa es tan nueva, no existe mucha regulación aplicable. Sin embargo, gobiernos de todo el mundo están investigando cómo regularla. Algunos países, como China, ya han propuesto medidas regulatorias sobre cómo se pueden entrenar los modelos y qué se les permite producir. A medida que más países impongan regulaciones, las empresas, especialmente las compañías internacionales, deben monitorear las nuevas leyes cambiantes para garantizar el cumplimiento y evitar multas o cargos penales por un uso indebido de la tecnología.

Ética e IA generativa

El surgimiento de la analítica de big data hace más de una década planteó preguntas éticas y debates novedosos, porque las herramientas emergentes hicieron posible inferir información privada o sensible sobre las personas que no habrían querido revelar. ¿Cómo deben las empresas manejar su capacidad para poseer dicha información?

Dado su potencial para potenciar el análisis de datos, la IA generativa está planteando nuevas preguntas éticas y resucitando algunas antiguas.

  • ¿Cómo afectará la IA generativa a los trabajadores? La IA generativa ya está haciendo que muchos trabajadores se sientan inquietos acerca de sus perspectivas de empleo a largo plazo, y con razón. Si bien la historia muestra que los avances tecnológicos siempre han llevado a la creación de más empleos, y de mayor valor, de los que eliminan, los roles que la IA podría volver obsoletos son los que actualmente están proporcionando ingresos a las personas.
  • ¿Cómo podemos eliminar el sesgo potencial? Sabemos que todos los modelos de IA tienen el potencial de producir resultados sesgados. Las organizaciones deben elegir proactivamente cómo abordar este desafío desde las perspectivas de riesgo empresarial y ética.
  • ¿Cómo podrían los actores maliciosos utilizar los modelos de IA generativa para causar daño al público? Las innumerables posibles aplicaciones de la IA generativa lamentablemente incluyen actos criminales y dañinos, especialmente a medida que los modelos generativos se vuelven más accesibles para el público. Los videos falsos que utilizan la voz y la apariencia de alguien, herramientas de piratería para mejorar los ciberataques, desinformación generalizada y campañas de ingeniería social son solo algunas de las formas potenciales en que los actores maliciosos pueden utilizar la IA generativa. Actualmente, muchos modelos tienen salvaguardias, pero esas restricciones no se consideran perfectas. Las empresas que implementan sus propios modelos deben comprender lo que sus sistemas son capaces de hacer y tomar medidas para garantizar su uso responsable.
  • ¿Quién es dueño del trabajo generado por la IA? Incluso si una empresa ajusta un modelo con sus propios datos, los modelos de IA generativa se entrenan con vastas cantidades de datos externos. Por lo tanto, la salida de un modelo puede incluir elementos del trabajo de otras organizaciones, lo que puede llevar a problemas éticos y legales, como el plagio y la infracción de derechos de autor. Esto es especialmente cierto para los modelos de IA generativos que generan imágenes; artistas de todos los campos creativos están explorando formas de evitar que su trabajo se alimente en estos programas. Los organismos reguladores pueden crear nuevas reglas con el tiempo, por lo que cualquier persona que use IA generativa debe considerar de dónde proviene el contenido y cómo se utilizará antes de publicarlo como propio.

Ejemplos de IA generativa

Empresas de todos los tamaños y sectores, desde el ejército de Estados Unidos hasta Coca-Cola, están experimentando ampliamente con la IA generativa. Aquí tienes un pequeño conjunto de ejemplos que demuestran el amplio potencial y la rápida adopción de esta tecnología.

Snap Inc., la empresa detrás de Snapchat, lanzó un chatbot llamado "My AI", impulsado por una versión de la tecnología GPT de OpenAI. Personalizado para adaptarse al tono y al estilo de Snapchat, My AI está programado para ser amigable y personal. Los usuarios pueden personalizar su apariencia con avatares, fondos de pantalla y nombres, y pueden usarlo para chatear uno a uno o entre varios usuarios, simulando la forma típica en que los usuarios de Snapchat se comunican con sus amigos. Los usuarios pueden solicitar consejos personales o entablar conversaciones informales sobre temas como comida, pasatiempos o música, e incluso el bot puede contar chistes. Snapchat orienta a My AI para ayudar a los usuarios a explorar las características de la aplicación, como las lentes de realidad aumentada, y para ayudar a los usuarios a obtener información que normalmente no buscarían en Snapchat, como recomendaciones de lugares en un mapa local.

Bloomberg anunció BloombergGPT, un chatbot entrenado aproximadamente a la mitad con datos generales sobre el mundo y a la mitad con datos propietarios de Bloomberg o datos financieros depurados. Puede realizar tareas simples, como escribir buenos titulares de artículos, y algunos trucos propios, como convertir consultas en inglés simple a Bloomberg Query Language, que requieren los terminales de datos de la compañía, imprescindibles en muchas empresas financieras.

Oracle se ha asociado con el desarrollador de IA Cohere para ayudar a las empresas a construir modelos internos ajustados con datos corporativos privados, en un movimiento que tiene como objetivo difundir el uso de herramientas de IA generativa especializadas específicas de la compañía.

"Cohere y Oracle están trabajando juntos para que sea muy fácil para los clientes empresariales entrenar sus propios modelos especializados de lenguaje grandes mientras protegen la privacidad de sus datos de entrenamiento", dijo Ellison de Oracle a analistas financieros durante la llamada de ganancias de junio de 2023. Oracle planea incorporar servicios de IA generativa en plataformas empresariales para aumentar la productividad y eficiencia en los procesos existentes de una empresa, evitando así que muchas compañías construyan y entrenen sus propios modelos desde cero. Con ese fin, la compañía también anunció recientemente la incorporación de capacidades de IA generativa en su software de recursos humanos, Oracle Fusion Cloud Human Capital Management (HCM).

Además:

  • Coca-Cola utiliza generadores de texto e imágenes para personalizar los mensajes publicitarios y crear experiencias altamente adaptadas para los clientes.
  • American Express, que ha estado a la vanguardia del uso de la IA en la detección de fraudes con tarjetas de crédito, tiene su subsidiaria Amex Digital Labs desarrollando capacidades para consumidores y empresas.
  • La oficina digital y de IA del Pentágono está experimentando con cinco modelos de IA generativa, alimentándolos con datos clasificados y probándolos para explorar cómo podrían usarse para sugerir opciones creativas que los líderes militares humanos nunca consideraron.
  • Duolingo utiliza un bot impulsado por ChatGPT para ayudar a sus estudiantes de idiomas extranjeros. Ofrece explicaciones detalladas sobre por qué sus respuestas en las pruebas de práctica son correctas o incorrectas, imitando la forma en que los usuarios podrían interactuar con un tutor humano.
  • Slack lanzó un chatbot que tiene como objetivo ayudar a los trabajadores de los clientes a destilar conocimientos y consejos del corpus de conocimientos institucionales que reside en los canales de Slack de cada cliente.

Conozca algunas herramientas de inteligencia artificial generativa

ChatGPT es la herramienta que se convirtió en una sensación viral, pero existe una multitud de posibilidades de IA generativa disponibles para cada modalidad. Por ejemplo, solo para la escritura existen Jasper, Lex, AI-Writer, Writer y muchos otros. En cuanto a la generación de imágenes, Midjourney, Stable Diffusion y Dall-E parecen ser las más populares en la actualidad.

Entre las docenas de generadores de música se encuentran AIVA, Soundful, Boomy, Amper, Dadabots y MuseNet. Aunque los programadores de software han colaborado con ChatGPT, también existen muchas herramientas especializadas en la generación de código, como Codex, codeStarter, Tabnine, PolyCoder, Cogram y CodeT5.

¿Cómo empezó todo?a

Quizás sorprendentemente, el primer paso en el camino hacia los modelos de IA generativa que se utilizan hoy en día se dio en 1943, el mismo año en que se demostró la primera computadora programable eléctrica, el Colossus, que luego fue utilizada por Gran Bretaña para descifrar mensajes encriptados durante la Segunda Guerra Mundial. El paso en IA fue un artículo de investigación, titulado "A Logical Calculus of Ideas Immanent in Nervous Activity", escrito por Warren McCulloch, un psiquiatra y profesor de la Facultad de Medicina de la Universidad de Illinois, y Walter Pitts, un autodidacta en neurociencia computacional.

Pitts, un aparente prodigio matemático, se fugó de casa a los 15 años y estaba sin hogar cuando conoció a McCulloch, quien lo acogió en su familia. El único título de Pitts fue un Associate of Arts otorgado por la Universidad de Chicago después de que se publicara el artículo seminal que estableció las bases matemáticas por las cuales una neurona artificial "decide" si emitir un uno o un cero.

El segundo paso se traslada al norte y al este de Buffalo, Nueva York, y a un psicólogo investigador del Laboratorio Aeronáutico de Cornell llamado Frank Rosenblatt. Operando bajo una subvención de julio de 1957 de la Oficina de Investigación Naval del Departamento de la Marina de los Estados Unidos como parte del Proyecto PARA de Cornell (Percepción y Reconocimiento de Autómatas), Rosenblatt se basó en las matemáticas de McCulloch y Pitts para desarrollar el "perceptron", una red neuronal con una sola capa "oculta" entre las de entrada y salida. Antes de construir el Mark I Perceptron, que hoy descansa en el Instituto Smithsonian, Rosenblatt y la Marina lo simularon en una computadora IBM 704 para una demostración pública en julio de 1958. Pero el perceptron era una red neuronal tan simple que recibió críticas del científico informático Marvin Minsky, cofundador del laboratorio de IA del MIT. Según se informa, Minsky y Rosenblatt debatieron sobre las perspectivas a largo plazo del perceptron en foros públicos, lo que llevó a que la comunidad de IA abandonara en gran medida la investigación en redes neuronales desde la década de 1960 hasta la década de 1980.

Este periodo se conoció como el "invierno de la IA".

El panorama de la investigación en redes neuronales volvió a la vida en la década de 1980, gracias a las contribuciones de varios investigadores, en particular Paul Werbos, cuyo trabajo inicial redescubrió el perceptron, Geoffrey Hinton, Yoshua Bengio y Yann LeCun. Su trabajo conjunto demostró la viabilidad de redes neuronales grandes y multicapa, y mostró cómo estas redes podían aprender de sus respuestas correctas e incorrectas a través de la asignación de crédito mediante un algoritmo de retropropagación. Fue entonces cuando surgieron las redes neuronales recurrentes (RNN) y las redes neuronales convolucionales (CNN). Pero las limitaciones de estas redes neuronales tempranas, combinadas con las expectativas iniciales exageradas que no se podían cumplir debido a esas limitaciones y al estado de la potencia informática en ese momento, llevaron a un segundo "invierno de la IA" en la década de 1990 y principios de la década de 2000.

Esta vez, sin embargo, muchos investigadores en redes neuronales siguieron adelante, incluidos Hinton, Bengio y LeCun. El trío, a veces llamado "los padrinos de la IA", compartió el Premio Turing 2018 por su trabajo en la década de 1980, su perseverancia posterior y sus contribuciones continuas. A mediados de la década de 2010, comenzaron a surgir rápidamente nuevas y diversas variantes de redes neuronales, como se describe en la sección de Modelos de IA generativa.

El futuro de la Inteligencia Artificial generativa

Cómo afectará la IA generativa a las empresas y la forma en que las personas trabajan aún está por verse. Pero está claro que están llegando inversiones enormes en la IA generativa en múltiples dimensiones del esfuerzo humano. Capitalistas de riesgo, corporaciones establecidas y prácticamente todas las empresas intermedias están invirtiendo en startups de IA generativa a un ritmo frenético. La "magia" universal de los LLM (grandes modelos de lenguaje) es una asombrosa capacidad para mediar la interacción humana con grandes cantidades de datos, ayudando a las personas a comprender la información al explicarla de manera simple, clara y sorprendentemente rápida. Esto sugiere que la IA generativa se incorporará en una multitud de aplicaciones existentes y provocará la invención de una segunda ola de nuevas aplicaciones.

Gartner, por ejemplo, predice que para 2024, el 40 % de las aplicaciones empresariales incorporarán IA conversacional, el 30 % de las empresas tendrán estrategias de desarrollo y pruebas con IA para 2025, y más de 100 millones de trabajadores colaborarán con "robocolegas" para 2026.

Por supuesto, es posible que los riesgos y limitaciones de la IA generativa obstaculicen este avance. Afinar modelos generativos para comprender las sutilezas que hacen que un negocio sea único puede resultar demasiado difícil, ejecutar modelos computacionalmente intensivos puede ser demasiado costoso y una exposición involuntaria de secretos comerciales puede asustar a las empresas.

O todo esto puede suceder, pero a un ritmo más lento de lo que muchos esperan en la actualidad. Como recordatorio, la promesa de Internet se hizo realidad, eventualmente. Pero tomó una década más de lo que la primera generación de entusiastas anticipaba, durante la cual se construyó o inventó la infraestructura necesaria y las personas adaptaron su comportamiento a las posibilidades del nuevo medio. En muchos sentidos, la IA generativa es otro nuevo medio.

Los influencers están pensando ampliamente en el futuro de la IA generativa en los negocios.

"Puede significar que construyamos empresas de manera diferente en el futuro", dice Sean Ammirati, un capitalista de riesgo que también es profesor distinguido de emprendimiento en la Tepper School of Business de Carnegie Mellon University y cofundador del Corporate Startup Lab de CMU. De la misma manera que las empresas "nativas digitales" tuvieron ventajas después del auge de Internet, Ammirati imagina que las futuras empresas construidas desde cero con automatización impulsada por IA serán líderes.

"Estas empresas serán principalmente de automatización, por lo que no tendrán que volver a aprender cómo dejar de hacer cosas manualmente que deberían hacer de manera automatizada", dice. "Podría terminar con un tipo de empresa muy diferente".

Adopta fácilmente la IA generativa con Oracle

Oracle no solo tiene una larga historia de trabajo con capacidades de inteligencia artificial e incorporándolas en sus productos, sino que también está a la vanguardia del desarrollo y las actividades de la IA generativa. Las principales compañías de IA generativa utilizan Oracle Cloud Infrastructure. Esta nube de última generación puede proporcionar la plataforma perfecta para que las empresas construyan y desplieguen modelos especializados de IA generativa específicos para sus organizaciones y líneas de negocio individuales. Como explicó Larry Ellison de Oracle: "Todos los centros de datos en la nube de Oracle tienen una red RDMA (acceso remoto directo a memoria) de alta velocidad y baja latencia que está perfectamente optimizada para construir los grandes clústeres GPU que se utilizan para entrenar modelos de lenguaje generativo de gran tamaño. El rendimiento extremadamente alto y los ahorros de costos relacionados con la ejecución de cargas de trabajo de IA generativa en nuestra nube Gen 2 han convertido a Oracle en la opción número uno entre las empresas de desarrollo de IA de vanguardia".

La asociación de Oracle con Cohere ha dado lugar a un nuevo conjunto de ofertas de servicios en la nube de IA generativa. "Este nuevo servicio protege la privacidad de los datos de entrenamiento de nuestros clientes empresariales, lo que les permite utilizar de manera segura sus propios datos privados para entrenar sus propios modelos de lenguaje grandes especializados y privados", dijo Ellison.

La historia de la IA generativa comenzó hace 80 años con las matemáticas de un adolescente fugitivo y se convirtió en una sensación viral a finales del año pasado con el lanzamiento de ChatGPT. La innovación en la IA generativa está avanzando rápidamente, ya que empresas de todos los tamaños y sectores experimentan e invierten en sus capacidades. Pero junto con su capacidad para mejorar en gran medida el trabajo y la vida, la IA generativa conlleva grandes riesgos, que van desde la pérdida de empleo hasta, si se cree en los agoreros, la posibilidad de la extinción humana. Lo que sabemos con seguridad es que el genio está fuera de la botella y no va a volver atrás.

¿Qué hace que Oracle sea la mejor opción para la inteligencia artificial generativa?

Oracle ofrece una plataforma de datos moderna y una infraestructura de inteligencia artificial de alto rendimiento y bajo costo. Factores adicionales, como modelos potentes y de alto rendimiento, seguridad de datos incomparable y servicios de inteligencia artificial integrados, demuestran por qué la oferta de IA de Oracle está verdaderamente diseñada para las empresas.

Preguntas frecuentes

¿Qué es la tecnología de IA generativa?

La tecnología de IA generativa se basa en arquitecturas de software de redes neuronales que imitan la forma en que se cree que funciona el cerebro humano. Estas redes neuronales se entrenan introduciendo vastas cantidades de datos en muestras relativamente pequeñas y luego pidiéndole a la IA que haga predicciones simples, como la próxima palabra en una secuencia o el orden correcto de una serie de oraciones. La red neuronal recibe el mérito o la culpa por las respuestas correctas e incorrectas, por lo que aprende del proceso hasta que pueda hacer buenas predicciones. En última instancia, la tecnología se basa en sus datos de entrenamiento y su aprendizaje para responder de manera similar a los humanos a preguntas y otras indicaciones.

¿Cuál es un ejemplo de IA generativa?

El ejemplo más conocido de IA generativa hoy en día es ChatGPT, que es capaz de mantener conversaciones y escribir sobre una amplia variedad de temas de manera similar a un humano. Otros ejemplos incluyen a Midjourney y Dall-E, que crean imágenes, y una multitud de otras herramientas que pueden generar texto, imágenes, video y sonido.

¿Cuál es la diferencia entre la IA generativa y la IA?

Es importante señalar que la IA generativa no es una tecnología fundamentalmente diferente de la IA tradicional; existen en diferentes puntos de un espectro. Los sistemas de IA tradicionales suelen realizar una tarea específica, como detectar el fraude con tarjetas de crédito. La IA generativa suele ser más amplia y puede crear nuevo contenido. Esto se debe en parte a que las herramientas de IA generativa se entrenan con conjuntos de datos más grandes y diversos que la IA tradicional. Además, la IA tradicional suele entrenarse utilizando técnicas de aprendizaje supervisado, mientras que la IA generativa se entrena utilizando aprendizaje no supervisado.

¿Cuál es el peligro de la IA generativa?

Existe un gran debate en la sociedad sobre los posibles riesgos de la IA generativa. Extremistas en lados opuestos del debate han dicho que la tecnología podría llevar en última instancia a la extinción humana, por un lado, o salvar al mundo, por el otro. Lo más probable es que la IA lleve a la eliminación de muchos empleos existentes. Las empresas deben preocuparse por las formas en que la IA generativa impulsará cambios en los procesos de trabajo y roles laborales, así como por su potencial para exponer inadvertidamente información privada o sensible o infringir derechos de autor.

¿Para qué sirve la IA generativa?

La IA generativa puede utilizarse de manera excelente en colaboración con colaboradores humanos para ayudar, por ejemplo, a generar nuevas ideas y educar a los trabajadores sobre disciplinas adyacentes. También es una excelente herramienta para ayudar a las personas a analizar más rápidamente datos no estructurados. En general, puede beneficiar a las empresas mejorando la productividad, reduciendo costos, mejorando la satisfacción del cliente, proporcionando mejores datos para la toma de decisiones y acelerando el ritmo de desarrollo de productos.

¿Qué no puede hacer la IA generativa?

La IA generativa no puede tener ideas verdaderamente nuevas que no se hayan expresado previamente en sus datos de entrenamiento o al menos que se hayan extrapolado de esos datos. Tampoco debe dejarse sola. La IA generativa requiere supervisión humana y solo funciona mejor en colaboraciones con humanos.

¿En qué industrias se utiliza la IA generativa?

Debido a su amplitud, es probable que la IA generativa sea útil en prácticamente todas las industrias.

¿Cómo afectará la IA generativa al futuro del trabajo?

Es probable que la IA generativa tenga un gran impacto en el trabajo del conocimiento, en actividades en las que los humanos trabajan juntos y/o toman decisiones empresariales. Como mínimo, los roles de los trabajadores del conocimiento deberán adaptarse para trabajar en colaboración con herramientas de IA generativa, y algunos trabajos serán eliminados. La historia demuestra, sin embargo, que el cambio tecnológico como el esperado de la IA generativa siempre conduce a la creación de más empleos de los que destruye.