Funciones del servicio OCI Generative AI

 

Modelos

Los nuevos modelos disponibles de Cohere y Meta para OCI Generative AI incluyen

  • Cohere Command: Command es el modelo de generación de texto insignia de Cohere. Viene en dos tamaños: 6 mil millones de parámetros y 52 mil millones de parámetros. El primero presenta menor latencia y costos, mientras que el segundo proporciona mayor precisión.
  • Cohere Summarize: Summarize proporciona resúmenes de alta calidad que capturan con precisión la información más importante de tus documentos.
  • Cohere Embed: estos modelos de incrustación en inglés y multilingües (v3) convierten el texto en representación de incrustaciones vectoriales. Las versiones "ligeras" de Embed son de menor tamaño y más rápidas (solo en inglés).
  • Meta Llama 2: Llama 2 es una recopilación de modelos de generación de texto que incluyen hasta 70 mil millones de parámetros. Es el principal modelo grande de lenguaje (LLM por sus siglas en inglés) de código abierto y gratuito para la investigación y el uso comercial.

Clústeres de IA dedicados

Con los clústeres de IA dedicados, puedes alojar modelos básicos en GPU dedicadas privadas. Estos clústeres proporcionan un rendimiento estable de alto rendimiento necesario para los casos de uso de producción y pueden soportar cargas de trabajo de alojamiento y ajuste. OCI Generative AI te permite escalar horizontalmente tu clúster sin tiempo de inactividad para que puedas gestionar con eficacia las variaciones de volumen. Se pueden alojar hasta 50 modelos personalizados y ajustados en el mismo clúster de alojamiento dedicado siempre que estos compartan el mismo modelo fundacional.

Integración con LangChain

OCI Generative AI está integrado con LangChain, un marco de código abierto que se puede utilizar para desarrollar nuevas interfaces para aplicaciones de IA generativa basadas en modelos de lenguaje. LangChain facilita el intercambio de abstracciones y componentes necesarios para admitir modelos de lenguaje.

Operaciones de IA generativa

OCI Generative AI proporciona controles de moderación de contenidos, cambios de modelos de punto final sin tiempo de inactividad y capacidades de desactivación y activación de puntos finales. Para cada punto final de modelo, OCI Generative AI también reúne una serie de análisis, como estadísticas de llamadas, tokens procesados, recuentos de errores y mucho más.

OCI Generative AI para aplicaciones de Oracle Cloud

Al incorporar funciones creadas con OCI Generative AI directamente en sus aplicaciones empresariales, Oracle facilita a los clientes el acceso instantáneo a funciones basadas en IA sin necesidad de realizar integraciones complejas.

Obtén más información sobre las aplicaciones de Oracle Cloud