Oracle HeatWave GenAI предоставляет интегрированный и автоматизированный генеративный ИИ с большими языковыми моделями (LLM) в базах данных, автоматизированным векторным хранилищем в базах данных, горизонтально масштабируемой векторной обработкой и возможностью контекстных диалогов на естественном языке, позволяя использовать генеративный ИИ без опыта в сфере ИИ, перемещения данных или дополнительных затрат.
Не пропустите выступление главного корпоративного архитектора Oracle Эдварда Скревена на CloudWorld 11 сентября в 8:30 по тихоокеанскому времени: «Создание приложений на базе генеративного ИИ — интеграция и автоматизация с помощью HeatWave GenAI».
Используйте оптимизированные LLM в базах данных в облаках и регионах, чтобы извлекать данные и генерировать или обобщать контент — без проблем с выбором и интеграцией внешних LLM.
Позвольте LLM выполнять поиск по вашим собственным документам, чтобы получать более точные и контекстно релевантные ответы даже без опыта работы с ИИ и без перемещения данных в отдельную векторную базу данных. HeatWave GenAI автоматизирует создание встраиваний.
Быстро получайте аналитическую информацию из документов с помощью диалогов на естественном языке. Интерфейс чата HeatWave сохраняет контекст, помогая вести человекоподобный диалог при повторных обращениях.
Используйте встроенные оптимизированные LLM во всех регионах Oracle Cloud Infrastructure (OCI), выделенном регионе OCI и во всех облаках и получайте согласованные результаты с предсказуемой производительностью во всех развертываниях. Вы сможете сократить затраты на инфраструктуру за счет устранения необходимости обеспечивать наличие графических процессоров.
Используйте уже обученные базовые модели из Cohere и Meta через сервис OCI Generative AI.
Ведите контекстный диалог на естественном языке с учетом неструктурированных данных, хранящихся в HeatWave Vector Store. Используйте интегрированный навигатор озерных хранилищ, чтобы помочь LLM выполнять поиск по конкретным документам — это позволит сократить затраты и быстрее получать более точные результаты.
HeatWave Vector Store хранит ваши собственные документы в различных форматах, выступая в качестве базы знаний для генерации с расширенным извлечением (RAG), чтобы помогать вам получать более точные и контекстно релевантные ответы без перемещения данных в отдельную векторную базу данных.
Используйте автоматизированный конвейер для обнаружения и импорта собственных документов в HeatWave Vector Store, чтобы разработчикам и аналитикам было проще использовать векторное хранилище без опыта работы с ИИ.
Векторная обработка идет параллельно с использованием до 512 узлов кластера HeatWave и выполняется на пропускной способности памяти, что помогает обеспечить быстрые результаты при более низких рисках потери точности.
«HeatWave GenAI чрезвычайно упрощает использование генеративного ИИ. Поддержка LLM в базах данных и создание векторов в базе данных приводит к значительному снижению сложности приложений, предсказуемой задержке вывода и, прежде всего, к отсутствию дополнительных затрат на использование LLM или создание внедрений. Это действительно демократизация генеративного ИИ, и мы считаем, что это приведет к созданию более серьезных приложений с использованием HeatWave GenAI и значительному повышению производительности для наших клиентов».
– Виджей Сундхар (Vijay Sundhar), генеральный директор SmarterD
«Мы активно используем HeatWave AutoML в базах данных для составления различных рекомендаций для наших клиентов. Поддержка HeatWave для LLM в базах данных и векторного хранилища в базе данных дифференцирована, а возможность интеграции генеративного ИИ с AutoML обеспечивает дальнейшее дифференцирование для HeatWave в отрасли, позволяя нам предлагать нашим клиентам новые возможности. Взаимодействие с AutoML также улучшает производительность и качество результатов LLM».
– Сафарат Шафи (Safarath Shafi), генеральный директор EatEasy
«HeatWave LLM в базах данных, векторное хранилище в базе данных, горизонтальное масштабирование векторной обработки в памяти и HeatWave Chat — это очень дифференцированные возможности Oracle, которые демократизируют генеративный ИИ и делают его очень простым, безопасным и недорогим в использовании. Использование HeatWave и AutoML в корпоративных целях уже изменило наш бизнес несколькими способами, и внедрение этих инноваций от Oracle, вероятно, подстегнет рост нового класса приложений, позволяющих использовать генеративный ИИ в корпоративном контенте».
– Эрик Агилар (Eric Aguilar), основатель Aiwifi
Встроенные LLM и чат HeatWave помогают разработчикам создавать приложения, заранее настроенные для контекстных диалогов на естественном языке. Нет необходимости искать внешние LLM и графические процессоры.
HeatWave GenAI поможет легко взаимодействовать с вашими данными, выполнять поиск сходства между документами и извлекать информацию из собственных данных.
Предоставьте разработчикам и бизнес-командам интегрированные возможности и средства автоматизации для использования преимуществ генеративного ИИ. Легко поддерживайте диалоги на естественном языке и RAG.
LLM в базах данных можно использовать для создания или сведения контента на основе неструктурированных документов. Пользователи могут задавать вопросы на естественном языке через приложения, а LLM будет обрабатывать запрос и доставлять контент.
Вы можете объединить возможности генеративного ИИ с другими встроенными возможностями HeatWave, такими как машинное обучение, чтобы снизить затраты и быстрее получать более точные результаты. В данном примере производственная компания делает это для профилактического ремонта оборудования. Инженеры могут использовать Oracle HeatWave AutoML для автоматического создания отчетов об ошибках в производственных журналах, а HeatWave GenAI поможет быстро определить первопричину проблемы: для этого нужно просто задать вопрос на естественном языке, а не анализировать журналы вручную.
Чатботы могут использовать RAG, например, для ответа на вопросы сотрудников о внутренних политиках компании. Внутренние документы с подробными сведениями о политиках хранятся в виде внедрений в HeatWave Vector Store. Для заданного запроса пользователя векторное хранилище помогает идентифицировать наиболее похожие документы, выполняя поиск сходства между сохраненными встраиваниями и запросом. Эти документы используются для дополнения запроса, передаваемого в LLM, чтобы обеспечить точный ответ.
Разработчики могут создавать приложения, используя объединенные возможности встроенного машинного обучения, генеративного ИИ и векторного хранилища для предоставления персонализированных рекомендаций. В этом примере приложение использует систему рекомендаций HeatWave AutoML, чтобы рекомендовать рестораны на основе предпочтений пользователя или ранее заказанных блюд. С помощью HeatWave Vector Store приложение может дополнительно просматривать меню ресторанов в формате PDF, чтобы предлагать конкретные блюда, обеспечивая большую ценность для клиентов.
Основная задача поиска сходств — это поиск связанного контента на основе семантики. Поиск сходств выходит за рамки простого поиска по ключевым словам. Он опирается на базовый смысл, а не просто на примененные теги. В этом примере юрист хочет быстро определить потенциально проблемную оговорку в контрактах.
HeatWave позволяет организациям выполнять обработку транзакций, аналитику в хранилищах данных и озерах данных, а также машинное обучение в рамках единого полностью управляемого облачного сервиса. Сегодня мы объявляем об общей доступности HeatWave GenAI — с большими языковыми моделями (LLM) в базах данных, автоматизированным векторным хранилищем в базе данных, горизонтально масштабируемой обработкой векторов и возможностью вести контекстные диалоги на естественном языке.
Читать публикацию полностью«С готовыми LLM в базах данных и полностью автоматизированным векторным хранилищем, которое может сразу же приступить к векторной обработке, HeatWave GenAI поднимает простоту ИИ — и его выгодность — до уровня, к которому его конкуренты, такие как Snowflake, Google BigQuery и Databricks, даже не начали двигаться».
«Инженерные инновации HeatWave продолжают воплощать в жизнь концепцию универсальной облачной базы данных. Последнее нововведение — генеративный ИИ в стиле HeatWave, включающий интеграцию автоматизированного векторного хранилища и LLM в базах данных непосредственно в ядро HeatWave. Это позволяет разработчикам создавать новые классы приложений, комбинируя элементы HeatWave».
«HeatWave GenAI обеспечил производительность векторной обработки, которая в 30 раз опережает Snowflake, в 18 раз Google BigQuery, и в 15 раз Databricks — и при этом стоимость снизилась до 6 раз. Для любой организации, серьезно относящейся к высокопроизводительным рабочим нагрузкам генеративного ИИ, тратить ресурсы компании на любую из этих трех векторных баз или подобные им — это как сжигать деньги и пытаться убедить окружающих, что это хорошая идея».
«HeatWave предпринимает важный шаг к тому, чтобы сделать генеративный ИИ и генерацию с расширенным извлечением (RAG) более доступными, перемещая всю сложность создания векторных встраиваний за кулисы. Разработчики просто указывают на исходные файлы, находящиеся в облачном хранилище объектов, а HeatWave берет на себя всю тяжелую работу».
Читайте новые сообщения в нашем блоге, где вы найдете советы, технические объяснения и описания передового опыта.
Следуйте пошаговым инструкциям и используйте код, который мы предоставляем, чтобы быстро и легко создавать приложения на основе HeatWave GenAI.
Запросите бесплатную пробную версию HeatWave GenAI. Вы получите облачный бонус в размере 300 долларов США, чтобы опробовать возможности в течение 30 дней.
Хотите узнать больше о HeatWave GenAI? Позвольте одному из экспертов Oracle помочь.