Oracle HeatWave GenAI zapewnia zintegrowaną, zautomatyzowaną i bezpieczną generatywną sztuczną inteligencję z dużymi modelami językowymi (LLM) w bazie danych; zautomatyzowany magazyn danych wektorowych w bazie danych; skalowane rozszerzająco przetwarzanie wektorowe oraz możliwość prowadzenia kontekstowych konwersacji w języku naturalnym. W rezultacie można korzystać z generatywnej sztucznej inteligencji bez konieczności posiadania specjalistycznej wiedzy z zakresu sztucznej inteligencji, przenoszenia danych lub ponoszenia dodatkowych kosztów.
Kluczowe funkcje rozwiązania HeatWave GenAI:
W bazie danych HeatWave dostępne są obecnie poddane kwantyzacji wersje następujących modeli LLM:
Za pomocą jednego polecenia SQL można utworzyć magazyn danych wektorowych dla nieuporządkowanych danych przedsiębiorstwa. Wszystkie kroki niezbędne do utworzenia magazynu danych wektorowych i osadzania wektorów są zautomatyzowane i wykonywane wewnątrz bazy danych. Obejmuje to wykrywanie dokumentów w obiektowej pamięci masowej, analizowanie ich, generowanie wektorów w równoległy i zoptymalizowany sposób oraz wstawianie ich do magazynu danych wektorowych, dzięki czemu aplikacja HeatWave Vector Store jest wydajna i łatwa w użyciu.
HeatWave działa na standardowym sprzęcie. Model LLM w bazie danych nie korzystają z procesorów GPU, ale z procesorów CPU. W rezultacie można obniżyć koszty i nie trzeba się martwić o dostępność modelu LLM w różnych centrach przetwarzania danych.
Podczas korzystania z modeli LLM i magazynu danych wektorowych w bazie danych dane nie opuszczają bazy danych, co pomaga zwiększyć ich bezpieczeństwo.
Tak, HeatWave GenAI można uruchomić natywnie na platformie AWS wraz z innymi funkcjami HeatWave, w tym HeatWave MySQL, HeatWave Lakehouse, HeatWave AutoML i HeatWave Autopilot.
Tak, wektory mogą być generowane dla danych tekstowych w 27 językach.
Prompty można wysyłać w języku angielskim. Prompty wysyłane w innych językach, np. hiszpańskim i niemieckim, mogą zostać przetłumaczone na język angielski.
Nie. Wyszukiwanie wektorowe jest wykonywane w klastrze HeatWave.
HeatWave korzysta z węzła MySQL. Zalecamy utworzenie węzła MySQL w wariancie MySQL.32 oraz węzłów HeatWave w wariancie HeatWave.512GB dla środowiska produkcyjnego. W przypadku programowania/testowania można użyć mniejszego wariantu MySQL. Obsługiwane warianty MySQL można przejrzeć tutaj. W przypadku HeatWave GenAI wariant HeatWave.32GB nie jest obsługiwany.
Obsługiwane formaty to PDF, TXT, PowerPoint, Word i HTML.
Nie ma żadnych dodatkowych kosztów poza kosztem klastra HeatWave wymaganego przez usługę HeatWave GenAI. Możesz wywoływać modele LLM w bazie danych i modele wektorów udostępniane przez usługę HeatWave GenAI bez dodatkowych opłat. Możesz także wywoływać zewnętrzne modele LLM dostępne za pośrednictwem usługi OCI Generative AI w infrastrukturze OCI i usługi Amazon Bedrock na platformie AWS, a następnie za te usługi zostaną naliczone opłaty.
Nie. Modele LLM są wstępnie wytrenowane. Twoje dane nie są wykorzystywane do trenowania modeli LLM.
Nie. Nie można dostroić modeli LLM udostępnianych w bazie danych z usługą HeatWave.
Nie. Nie możesz korzystać z własnych modeli LLM ani modeli wektorów. Możesz jednak wywoływać zewnętrzne modele LLM lub modele wektorów dostępne za pośrednictwem usługi OCI Generative AI podczas uruchamiania usługi HeatWave GenAI w infrastrukturze OCI i za pośrednictwem usługi Amazon Bedrock podczas uruchamiania usługi HeatWave GenAI na platformie AWS.
Z naszych testów wynika, że wyniki są porównywalne do niepoddanych kwantyzacji modeli LLM w zastosowaniach opartych na magazynie HeatWave Vector Store. Możesz łatwo przetestować te modele, aby ocenić ich wydajność i jakość wyników.
Wektory trzeba wygenerować tylko raz i będą one przechowywane w magazynie HeatWave Vector Store. Zmiany w nieuporządkowanych dokumentach w obiektowej pamięci masowej będą automatycznie wyzwalać aktualizacje skojarzonych wektorów.
Tak. Dzięki funkcji optycznego rozpoznawania znaków magazyn HeatWave Vector Store może konwertować zeskanowane treści zapisane jako obrazy na dane tekstowe, które można poddać analizie, na przykład w celu wyszukiwania podobieństw.