ما المقصود بالموجه؟
المتجه هو تمثيل رياضي للنصوص أو الصور أو الصوتيات أو الفيديوهات يرمِّز الميزات أو المعاني الدلالية للبيانات، بدلاً من المحتوى الفعلي مثل الكلمات أو وحدات البكسل الأساسية. يتكون المتجه من قائمة بالقيم الرقمية، والمعروفة باسم الأبعاد، ويمكن استخدامه لعمليات الذكاء الاصطناعي (AI).
كيف يتم تكوين المتجهات؟
يتم إنشاء المتجهات من أنواع مختلفة من بيانات الإدخال (النص، والصور، والصوت، والفيديو، وبيانات أخرى) بواسطة نماذج التعلم العميق المعروفة باسم نماذج التضمين. يمكنك إنشاء متجهات خارج قاعدة البيانات باستخدام نماذج التضمين أو خدمة التضمين أو تكوينها داخل قاعدة البيانات باستخدام نماذج تضمين ONNX عبر دالة SQL VECTOR_EMBEDDING().
ما تنسيقات الأبعاد المدعومة للمتجهات؟
يدعم بحث متجهات الذكاء الاصطناعي من Oracle تنسيقات BINARY وINT8 وFLOAT32 وFLOAT64. كم عدد أبعاد المتجهات المدعومة؟ تدعم ميزة Oracle AI Vector Search المتجهات مع ما يصل إلى 65,535 بُعدًا.
ما حجم المتجهات؟
يُعد حجم المتجه نتاج عدد الأبعاد وحجم كل بُعد. على سبيل المثال، المتجه الذي يحتوي على 2048 بُعدًا وصيغة INT8 (بايت واحد) هو 2 كيلوبايت في الحجم، والمتجه الذي يحتوي على 1024 بُعدًا وصيغة FLOAT32 (4 بايت) هو 4 كيلوبايت في الحجم.
هل يدعم بحث متجهات الذكاء الاصطناعي المتجهات المتفرقة؟
يدعم بحص متجهات الذكاء الاصطناعي من Oracle المتجهات المتفرقة، والتي تحتوي عادةً على العديد من الأبعاد، لكن تحتوي بعض الأبعاد فحسب على قيم غير صفرية. بالنسبة إلى مستند معين، تتطابق قيم الأبعاد غير الصفرية في المتجه مع الكلمات الرئيسة (والتغيرات الخاصة بها) التي تظهر في هذا المستند.
ما نماذج التضمين التي يعمل بها بحث متجهات الذكاء الاصطناعي؟
يجب أن يعمل بحث متجهات الذكاء الاصطناعي مع أي نموذج تضمين صالح ينشئ متجهات باستخدام أحد تنسيقات الأبعاد المدعومة و65535 بُعدًا أو أقل.
ما نماذج التضمين التي يجب أن أفكر في استخدامها، وأين يمكنني الحصول عليها؟
يعتمد اختيار تضمين النماذج على العديد من العوامل، مثل طبيعة بياناتك ومقاييس الأداء التي تحددها حسب الأولوية والتكلفة التي ترغب في دفعها. يمكن العثور على نماذج تضمين مجانية ومفتوحة المصدر، بما في ذلك محولات الجملة المختلفة، على Hugging Face والمواقع المماثلة. يمكن تحويل هذه النماذج إلى ONNX لإنشاء تضمينات في قاعدة البيانات باستخدام ميزة بحث متجهات الذكاء الاصطناعي. تُعد (MTEB) Leaderboard التي يستضيفها Hugging Face مصدرًا شائعًا لأفضل نماذج تضمين النصوص. يمكنك أيضًا التوجه إلى مقدمي النماذج المعروفين مثل OpenAI وCohere.
هل يدعم بحث متجهات بالذكاء الاصطناعي نماذج تضمين الصور؟
يدعم بحث متجهات بالذكاء الاصطناعي المتجهات التي تم إنشاؤها من جميع نماذج التضمين، بغض النظر عما إذا كانت النماذج مُخصصة للنصوص أو الصور أو الصوت أو الفيديو أو البيانات الأخرى. تتضمن قاعدة البيانات Oracle AI Database أيضًا نماذج تضمين ONNX مُجمعة مُسبقًا لتنفيذ عمليات عن بُعد قائمة على الصور باستخدام AI Vector Search.
ما العمليات المدعومة على المتجهات؟
توجد عمليات رياضية متعددة مدعومة في المتجهات. تُعد العملية الأهم دالة SQL VECTOR_DISTANCE() التي تصل إلى المسافة الحسابية بين المتجهين على أساس معادلة المسافة المحددة. توجد العديد من معادلات المسافة التي يدعمها Oracle AI Vector Search، بما في ذلك Euclidean وEuclidean Squared وCosine Similarity وDot Product وManhattan وJaccard وHamming. يتم تشغيل اختيار دالة المسافة عادةً بواسطة نموذج التضمين المستخدم لإنشاء المتجهات، مع ذلك، فإن قياس المسافة الافتراضي في Oracle AI Database 26ai هو تشابه-جيب التمام.
كيف يتم استخدام المتجهات في البحث عن التشابه؟
تتشارك جميع المتجهات نفس الخاصية: فكلما زاد تشابه الكيانين، زادت المسافة الحسابية بينهما. على سبيل المثال، المتجهات "تفاحة" و"برتقالة" أقرب إلى بعضهما من المتجهات "تفاحة" و"كلب." تتيح خاصية المتجهات هذه استخدامها للبحث عن البيانات حسب التشابه الدلالي.
كيف يتم إجراء AI Vector Search (بحث عن المتجهات بالذكاء الاصطناعي) باستخدام SQL؟
هناك امتدادات SQL بسيطة وبديهية تسمح بدمج AI Vector Search بسهولة في تطبيقاتك. بما أن مسافة المتجه هي مقياس للتشابه، فإن ميزة AI Vector Search تتضمن ترتيب مجموعة المتجهات المحتملة بناءً على مسافتها من متجه بحث وإرجاع أفضل وأقرب تطابقات K. على سبيل المثال، يبحث الاستعلام أدناه عن أفضل 10 منتجات تتطابق صورها بشكل وثيق مع صورة بحث المستخدم:
SELECT product_name، product_photo
منتج FROM
ORDER BY VECTOR_DISTANCE(product_photo_vector، :search_photo_vector)
FETCH FIRST 10 ROWS ONLY؛
كيف يمكنني استخدام AI Vector Search في الاستعلامات المعقدة التي تتضمن بيانات العمل؟
يمكن استخدام بحث متجهات الذكاء الاصطناعي في استعلامات متطورة تتضمن عوامل التصفية والروابط والتجميعات والتجميع حسب العناصر الأخرى. على سبيل المثال، يمكن استخدام الاستعلام التالي للعثور على أفضل 10 منتجات مطابقة تم تصنيعها في كاليفورنيا بناءً على صورة تم تحميلها بواسطة مستخدم.
SELECT p.name, p.photo, m.name
FROM product p
JOIN manufacturer m ON (p.mfr_id = m.id)
WHERE m.state = 'CA'
ORDER BY VECTOR_DISTANCE(product_photo_vector, :search_photo_vector)
FETCH FIRST 10 ROWS ONLY;
ما فهارس المتجهات وكيف تختلف عن فهارس قواعد البيانات التقليدية؟
تُستخدم فهارس قواعد البيانات التقليدية لتسريع عمليات البحث استنادًا إلى القيم المطابقة. على سبيل المثال، يسرِّع فهرس B-tree من عمليات البحث القائمة على القيمة ومسح النطاق المستند إلى القيمة. من ناحية أخرى، تم تصميم فهارس المتجهات للعثور على أفضل K تطابقًا والأكثر تشابهًا بناءً على التشابه الدلالي بدلاً من مطابقة القيم بدقة. يمكن استخدام فهرس متجهات للعثور على أفضل كلمات بحرف ك الأكثر تشابهًا في المعنى مع "تفاحة" في مجموعة من الكلمات الموجودة. يؤدي استخدام فهرس متجهات إلى بحث تقريبي يضحي ببعض الدقة في البحث مقابل أداء يصل إلى 100 ضعف، إذ يتجنب فحص كل إدخال متجه داخل العمود.
ما المقصود بفهارس متجهات الرسم البياني المجاورة المُضمنة بالذاكرة؟
تمثل فهارس متجهات الرسم البياني المجاورة في الذاكرة فهارس متواجدة للذاكرة تستند إلى الرسم البياني. تمثل رؤوس الرسم البياني المتجهات، وتمثل الحواف بين الرؤوس التشابه بين المتجهات. يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس متجات الرسوم البيانية المجاورة القابلة للتنقل (HNSW) وهي من نوع عالمي صغيرة قابل للتنقل ومتدرجة (HNSW) بالذاكرة. يتم تنظيم فهارس HNSW باستخدام مبادئ من شبكات العالم الصغير والتنظيم الهرمي الطبقي، مما يجعلها سريعة ودقيقة للغاية للبحث عن التشابه.
ما هي فهارس المتجهات المقسمة المجاورة؟
يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس المتجهات المقسمة إلى مقاطع من نوع الملف غير المنسق (IVF). تمثل فهارس المتجهات المقسمة المجاورة فهارس متجهات قائمة على القرص، إذ يتم تجميع المتجهات في أقسام الجدول بناءً على التشابه. إنه فهرس فعَّال للتوسع مع دعم سريع وسلس للمعاملات، مما يسمح لك بموازنة البحث عالي الجودة مع سرعة معقولة. إنها مُصممة لاستيعاب أحجام بيانات غير محدودة، بحكم حقيقة أنها لا تعتمد على الذاكرة.
ما فهارس المتجهات المختلطة وكيف تختلف عن فهارس قواعد البيانات التقليدية؟
تمثل فهارس المتجهات المختلطة نوع جديد من فهارس المتجهات التي تسمح للمستخدمين بفهرسة مستنداتهم والاستعلام عنها بسهولة باستخدام مزيج من البحث بالنص الكامل والبحث المتجه الدلالي لتحقيق نتائج بحث ذات جودة أعلى. تدعم واجهة برمجة تطبيقات الاستعلام الموحدة التي تسمح للمستخدمين بتشغيل الاستعلامات النصية أو استعلامات تشابه المتجهات أو الاستعلامات المختلطة التي تستفيد من كلا النهجين.
ما لغات البرمجة التي يمكن استخدامها لتطوير تطبيقات بحث متجهات الذكاء الاصطناعي؟
بالإضافة إلى SQL وPL/SQL، يمكن إنشاء تطبيقات بحث متجهات الذكاء الاصطناعي بلغات برمجة مختلفة. تتضمن ميزة AI Vector Search دعم برامج التشغيل الأصلية للمتجهات بلغات شائعة، مثل Java وPython وJavaScript و#C.
ما الدور الذي تلعبه ميزة AI Vector Search في الذكاء الاصطناعي التوليدي؟
يكون بحث متجهات الذكاء الاصطناعي غالبًا جزءًا من سير عمل الإنشاء المعزز بالاسترجاع (RAG). إذ يوفر مدخلات إضافية مطلوبة لضبط الاستجابة من نموذج لغة كبير (LLM) من GenAI. عند الدمج مع سير العمل RAG، يتم تحويل سؤال المستخدم أولاً إلى متجه ومن ثم يُطابق مع المستندات الأكثر صلة داخل قاعدة البيانات عبر بحث متجهات الذكاء الاصطناعي. ثم يتم تمرير سؤال المستخدم والمستندات ذات الصلة الداعمة إلى نموذج LLM، الذي ينشئ إجابة مستنيرة بناءً على معرفته العامة والمعرفة المُتخصصة من قاعدة البيانات.
ما هي نماذج LLM التي يعمل بها AI Vector Search؟
يمكن استخدام بحث متجهات الذكاء الاصطناعي لـ RAG مع أي نموذج LLM، بما في ذلك النماذج مفتوحة المصدر، مثل Llama3 وMistral، بالإضافة إلى النماذج الخاصة من موفري الخدمات مثل OpenAI وCohere. بالإضافة إلى ذلك، تتوفر واجهات برمجة تطبيقات PL/SQL المُتخصصة للتكامل السلس بين بحث متجهات الذكاء الاصطناعي ونماذج LLM لـ RAG.
هل يدعم بحث متجهات الذكاء الاصطناعي أطر عمل تكامل الذكاء الاصطناعي وسلاسله؟
يتكامل بحث متجهات الذكاء الاصطناعي مع LangChain وLlamaIndex. يمكن أن تساعد أطر العمل هذه على دمج البيانات الخاصة والعامة لتطبيقات نماذج اللغات الكبيرة.
ما هي مزايا الإنشاء المعزز بالاسترجاع (RAG)؟
يلعب الإنشاء المعزز بالاسترجاع (RAG) دورًا محوريًا في الذكاء الاصطناعي التوليدي (GenAI)، مما يوفر مزايا كبيرة لتطبيقات GenAI. فيما يلي ثلاثة أسباب مقنعة فقط حول سبب ضرورة دمج RAG في إعداد GenAI:
كيف يمكنني توسيع نطاق بحث متجهات الذكاء الاصطناعي لتلبية الاحتياجات المتزايدة لتطبيقي؟
يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم ومجموعات التطبيقات الحقيقية (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا.
هل توجد أي مزايا في تشغيل بحث متجهات الذكاء الاصطناعي على Oracle Exadata؟
يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم وOracle Real Application Clusters (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا. تتضمن Oracle Exadata أيضًا المسح الذكي للذكاء الاصطناعي، الذي يفرغ عمليات استعلام بحث متجهات الذكاء الاصطناعي إلى خوادم تخزين Exadata للحصول على أداء استعلام لا مثيل له.
كيف توفر Oracle أمان البيانات للمتجهات؟
يتكامل بحث Oracle AI Vector بسلاسة مع ميزات أمان قاعدة البيانات الرائدة في المجال من Oracle لتقليل المخاطر وتبسيط الامتثال. يمكن للمؤسسات تأمين بيانات المتجهات الخاصة بها من خلال الاستفادة من الأدوات القوية، مثل التشفير وإخفاء البيانات الحساسة وعناصر التحكم في وصول المستخدم المتميزة ومراقبة النشاط والتدقيق مع الاستفادة الكاملة من إمكانات بحث الذكاء الاصطناعي المتقدمة. تساعد الميزات داخل قاعدة البيانات، مثل مخزن قاعدة البيانات وقاعدة البيانات الخاصة الافتراضية في تأمين بيانات المتجهات والتأكد من أن المستخدمين الذين يتمتعون بالامتيازات المناسبة فحسب هم الذين يمكنهم الوصول إليها.
يعني هذا أن Oracle AI Vector Search يمكن أن يقلل بشكل كبير من بصمة البنية التحتية للمتجهات لدى الشركة. يمكن لقاعدة البيانات Oracle AI Database واحدة تلبية احتياجات العديد من المستخدمين المختلفين بأذونات وصول مختلفة واعتماد دون الحاجة إلى تكرار البيانات أو تحمل أي تكاليف إضافية على الإدارة، كما هو الحال غالبًا مع قواعد بيانات المتجهات الأخرى.
كيف توفر Oracle إمكانات عالية التوافر وإجراءات التعافي من الكوارث للمتجهات؟
المتجهات في قاعدة البيانات Oracle AI Database هي أنواع بيانات قاعدة بيانات من الدرجة الأولى. يعني هذا أن المتجهات تكتسب ضمنيًا جميع الميزات والإمكانات المُبتكرة التي تجعل Oracle قاعدة بيانات المؤسسة الرائدة في العالم. يتم تقديم التوافر العالي (HA) عن طريق تشغيل عمليات البحث عن التشابه على Oracle RAC أو Oracle Globally Distributed Database (التقسيم). يمكن لكل من Data Guard وActive Data Guard وOracle GoldenGate توفير التعافي من الكوارث تلقائيًا.
ما المقصود بالموجه؟
المتجه هو تمثيل رياضي للنصوص أو الصور أو الصوتيات أو الفيديوهات يرمِّز الميزات أو المعاني الدلالية للبيانات، بدلاً من المحتوى الفعلي مثل الكلمات أو وحدات البكسل الأساسية. يتكون المتجه من قائمة بالقيم الرقمية، والمعروفة باسم الأبعاد، ويمكن استخدامه لعمليات الذكاء الاصطناعي (AI).
كيف يتم تكوين المتجهات؟
يتم إنشاء المتجهات من أنواع مختلفة من بيانات الإدخال (النص، والصور، والصوت، والفيديو، وبيانات أخرى) بواسطة نماذج التعلم العميق المعروفة باسم نماذج التضمين. يمكنك إنشاء متجهات خارج قاعدة البيانات باستخدام نماذج التضمين أو خدمة التضمين أو تكوينها داخل قاعدة البيانات باستخدام نماذج تضمين ONNX عبر دالة SQL VECTOR_EMBEDDING().
ما تنسيقات الأبعاد المدعومة للمتجهات؟
يدعم بحث متجهات الذكاء الاصطناعي من Oracle تنسيقات BINARY وINT8 وFLOAT32 وFLOAT64. كم عدد أبعاد المتجهات المدعومة؟ تدعم ميزة Oracle AI Vector Search المتجهات مع ما يصل إلى 65,535 بُعدًا.
ما حجم المتجهات؟
يُعد حجم المتجه نتاج عدد الأبعاد وحجم كل بُعد. على سبيل المثال، المتجه الذي يحتوي على 2048 بُعدًا وصيغة INT8 (بايت واحد) هو 2 كيلوبايت في الحجم، والمتجه الذي يحتوي على 1024 بُعدًا وصيغة FLOAT32 (4 بايت) هو 4 كيلوبايت في الحجم.
هل يدعم بحث متجهات الذكاء الاصطناعي المتجهات المتفرقة؟
يدعم بحص متجهات الذكاء الاصطناعي من Oracle المتجهات المتفرقة، والتي تحتوي عادةً على العديد من الأبعاد، لكن تحتوي بعض الأبعاد فحسب على قيم غير صفرية. بالنسبة إلى مستند معين، تتطابق قيم الأبعاد غير الصفرية في المتجه مع الكلمات الرئيسة (والتغيرات الخاصة بها) التي تظهر في هذا المستند.
ما نماذج التضمين التي يعمل بها بحث متجهات الذكاء الاصطناعي؟
يجب أن يعمل بحث متجهات الذكاء الاصطناعي مع أي نموذج تضمين صالح ينشئ متجهات باستخدام أحد تنسيقات الأبعاد المدعومة و65535 بُعدًا أو أقل.
ما نماذج التضمين التي يجب أن أفكر في استخدامها، وأين يمكنني الحصول عليها؟
يعتمد اختيار تضمين النماذج على العديد من العوامل، مثل طبيعة بياناتك ومقاييس الأداء التي تحددها حسب الأولوية والتكلفة التي ترغب في دفعها. يمكن العثور على نماذج تضمين مجانية ومفتوحة المصدر، بما في ذلك محولات الجملة المختلفة، على Hugging Face والمواقع المماثلة. يمكن تحويل هذه النماذج إلى ONNX لإنشاء تضمينات في قاعدة البيانات باستخدام ميزة بحث متجهات الذكاء الاصطناعي. تُعد (MTEB) Leaderboard التي يستضيفها Hugging Face مصدرًا شائعًا لأفضل نماذج تضمين النصوص. يمكنك أيضًا التوجه إلى مقدمي النماذج المعروفين مثل OpenAI وCohere.
هل يدعم بحث متجهات بالذكاء الاصطناعي نماذج تضمين الصور؟
يدعم بحث متجهات بالذكاء الاصطناعي المتجهات التي تم إنشاؤها من جميع نماذج التضمين، بغض النظر عما إذا كانت النماذج مُخصصة للنصوص أو الصور أو الصوت أو الفيديو أو البيانات الأخرى. تتضمن قاعدة البيانات Oracle AI Database أيضًا نماذج تضمين ONNX مُجمعة مُسبقًا لتنفيذ عمليات عن بُعد قائمة على الصور باستخدام AI Vector Search.
ما العمليات المدعومة على المتجهات؟
توجد عمليات رياضية متعددة مدعومة في المتجهات. تُعد العملية الأهم دالة SQL VECTOR_DISTANCE() التي تصل إلى المسافة الحسابية بين المتجهين على أساس معادلة المسافة المحددة. توجد العديد من معادلات المسافة التي يدعمها Oracle AI Vector Search، بما في ذلك Euclidean وEuclidean Squared وCosine Similarity وDot Product وManhattan وJaccard وHamming. يتم تشغيل اختيار دالة المسافة عادةً بواسطة نموذج التضمين المستخدم لإنشاء المتجهات، مع ذلك، فإن قياس المسافة الافتراضي في Oracle AI Database 26ai هو تشابه-جيب التمام.
كيف يتم استخدام المتجهات في البحث عن التشابه؟
تتشارك جميع المتجهات نفس الخاصية: فكلما زاد تشابه الكيانين، زادت المسافة الحسابية بينهما. على سبيل المثال، المتجهات "تفاحة" و"برتقالة" أقرب إلى بعضهما من المتجهات "تفاحة" و"كلب." تتيح خاصية المتجهات هذه استخدامها للبحث عن البيانات حسب التشابه الدلالي.
كيف يتم إجراء AI Vector Search (بحث عن المتجهات بالذكاء الاصطناعي) باستخدام SQL؟
هناك امتدادات SQL بسيطة وبديهية تسمح بدمج AI Vector Search بسهولة في تطبيقاتك. بما أن مسافة المتجه هي مقياس للتشابه، فإن ميزة AI Vector Search تتضمن ترتيب مجموعة المتجهات المحتملة بناءً على مسافتها من متجه بحث وإرجاع أفضل وأقرب تطابقات K. على سبيل المثال، يبحث الاستعلام أدناه عن أفضل 10 منتجات تتطابق صورها بشكل وثيق مع صورة بحث المستخدم:
SELECT product_name، product_photo
منتج FROM
ORDER BY VECTOR_DISTANCE(product_photo_vector، :search_photo_vector)
FETCH FIRST 10 ROWS ONLY؛
كيف يمكنني استخدام AI Vector Search في الاستعلامات المعقدة التي تتضمن بيانات العمل؟
يمكن استخدام بحث متجهات الذكاء الاصطناعي في استعلامات متطورة تتضمن عوامل التصفية والروابط والتجميعات والتجميع حسب العناصر الأخرى. على سبيل المثال، يمكن استخدام الاستعلام التالي للعثور على أفضل 10 منتجات مطابقة تم تصنيعها في كاليفورنيا بناءً على صورة تم تحميلها بواسطة مستخدم.
SELECT p.name, p.photo, m.name
FROM product p
JOIN manufacturer m ON (p.mfr_id = m.id)
WHERE m.state = 'CA'
ORDER BY VECTOR_DISTANCE(product_photo_vector, :search_photo_vector)
FETCH FIRST 10 ROWS ONLY;
ما فهارس المتجهات وكيف تختلف عن فهارس قواعد البيانات التقليدية؟
تُستخدم فهارس قواعد البيانات التقليدية لتسريع عمليات البحث استنادًا إلى القيم المطابقة. على سبيل المثال، يسرِّع فهرس B-tree من عمليات البحث القائمة على القيمة ومسح النطاق المستند إلى القيمة. من ناحية أخرى، تم تصميم فهارس المتجهات للعثور على أفضل K تطابقًا والأكثر تشابهًا بناءً على التشابه الدلالي بدلاً من مطابقة القيم بدقة. يمكن استخدام فهرس متجهات للعثور على أفضل كلمات بحرف ك الأكثر تشابهًا في المعنى مع "تفاحة" في مجموعة من الكلمات الموجودة. يؤدي استخدام فهرس متجهات إلى بحث تقريبي يضحي ببعض الدقة في البحث مقابل أداء يصل إلى 100 ضعف، إذ يتجنب فحص كل إدخال متجه داخل العمود.
ما المقصود بفهارس متجهات الرسم البياني المجاورة المُضمنة بالذاكرة؟
تمثل فهارس متجهات الرسم البياني المجاورة في الذاكرة فهارس متواجدة للذاكرة تستند إلى الرسم البياني. تمثل رؤوس الرسم البياني المتجهات، وتمثل الحواف بين الرؤوس التشابه بين المتجهات. يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس متجات الرسوم البيانية المجاورة القابلة للتنقل (HNSW) وهي من نوع عالمي صغيرة قابل للتنقل ومتدرجة (HNSW) بالذاكرة. يتم تنظيم فهارس HNSW باستخدام مبادئ من شبكات العالم الصغير والتنظيم الهرمي الطبقي، مما يجعلها سريعة ودقيقة للغاية للبحث عن التشابه.
ما هي فهارس المتجهات المقسمة المجاورة؟
يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس المتجهات المقسمة إلى مقاطع من نوع الملف غير المنسق (IVF). تمثل فهارس المتجهات المقسمة المجاورة فهارس متجهات قائمة على القرص، إذ يتم تجميع المتجهات في أقسام الجدول بناءً على التشابه. إنه فهرس فعَّال للتوسع مع دعم سريع وسلس للمعاملات، مما يسمح لك بموازنة البحث عالي الجودة مع سرعة معقولة. إنها مُصممة لاستيعاب أحجام بيانات غير محدودة، بحكم حقيقة أنها لا تعتمد على الذاكرة.
ما فهارس المتجهات المختلطة وكيف تختلف عن فهارس قواعد البيانات التقليدية؟
تمثل فهارس المتجهات المختلطة نوع جديد من فهارس المتجهات التي تسمح للمستخدمين بفهرسة مستنداتهم والاستعلام عنها بسهولة باستخدام مزيج من البحث بالنص الكامل والبحث المتجه الدلالي لتحقيق نتائج بحث ذات جودة أعلى. تدعم واجهة برمجة تطبيقات الاستعلام الموحدة التي تسمح للمستخدمين بتشغيل الاستعلامات النصية أو استعلامات تشابه المتجهات أو الاستعلامات المختلطة التي تستفيد من كلا النهجين.
ما لغات البرمجة التي يمكن استخدامها لتطوير تطبيقات بحث متجهات الذكاء الاصطناعي؟
بالإضافة إلى SQL وPL/SQL، يمكن إنشاء تطبيقات بحث متجهات الذكاء الاصطناعي بلغات برمجة مختلفة. تتضمن ميزة AI Vector Search دعم برامج التشغيل الأصلية للمتجهات بلغات شائعة، مثل Java وPython وJavaScript و#C.
ما الدور الذي تلعبه ميزة AI Vector Search في الذكاء الاصطناعي التوليدي؟
يكون بحث متجهات الذكاء الاصطناعي غالبًا جزءًا من سير عمل الإنشاء المعزز بالاسترجاع (RAG). إذ يوفر مدخلات إضافية مطلوبة لضبط الاستجابة من نموذج لغة كبير (LLM) من GenAI. عند الدمج مع سير العمل RAG، يتم تحويل سؤال المستخدم أولاً إلى متجه ومن ثم يُطابق مع المستندات الأكثر صلة داخل قاعدة البيانات عبر بحث متجهات الذكاء الاصطناعي. ثم يتم تمرير سؤال المستخدم والمستندات ذات الصلة الداعمة إلى نموذج LLM، الذي ينشئ إجابة مستنيرة بناءً على معرفته العامة والمعرفة المُتخصصة من قاعدة البيانات.
ما هي نماذج LLM التي يعمل بها AI Vector Search؟
يمكن استخدام بحث متجهات الذكاء الاصطناعي لـ RAG مع أي نموذج LLM، بما في ذلك النماذج مفتوحة المصدر، مثل Llama3 وMistral، بالإضافة إلى النماذج الخاصة من موفري الخدمات مثل OpenAI وCohere. بالإضافة إلى ذلك، تتوفر واجهات برمجة تطبيقات PL/SQL المُتخصصة للتكامل السلس بين بحث متجهات الذكاء الاصطناعي ونماذج LLM لـ RAG.
هل يدعم بحث متجهات الذكاء الاصطناعي أطر عمل تكامل الذكاء الاصطناعي وسلاسله؟
يتكامل بحث متجهات الذكاء الاصطناعي مع LangChain وLlamaIndex. يمكن أن تساعد أطر العمل هذه على دمج البيانات الخاصة والعامة لتطبيقات نماذج اللغات الكبيرة.
ما هي مزايا الإنشاء المعزز بالاسترجاع (RAG)؟
يلعب الإنشاء المعزز بالاسترجاع (RAG) دورًا محوريًا في الذكاء الاصطناعي التوليدي (GenAI)، مما يوفر مزايا كبيرة لتطبيقات GenAI. فيما يلي ثلاثة أسباب مقنعة فقط حول سبب ضرورة دمج RAG في إعداد GenAI:
كيف يمكنني توسيع نطاق بحث متجهات الذكاء الاصطناعي لتلبية الاحتياجات المتزايدة لتطبيقي؟
يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم ومجموعات التطبيقات الحقيقية (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا.
هل توجد أي مزايا في تشغيل بحث متجهات الذكاء الاصطناعي على Oracle Exadata؟
يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم وOracle Real Application Clusters (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا. تتضمن Oracle Exadata أيضًا المسح الذكي للذكاء الاصطناعي، الذي يفرغ عمليات استعلام بحث متجهات الذكاء الاصطناعي إلى خوادم تخزين Exadata للحصول على أداء استعلام لا مثيل له.
كيف توفر Oracle أمان البيانات للمتجهات؟
يتكامل بحث Oracle AI Vector بسلاسة مع ميزات أمان قاعدة البيانات الرائدة في المجال من Oracle لتقليل المخاطر وتبسيط الامتثال. يمكن للمؤسسات تأمين بيانات المتجهات الخاصة بها من خلال الاستفادة من الأدوات القوية، مثل التشفير وإخفاء البيانات الحساسة وعناصر التحكم في وصول المستخدم المتميزة ومراقبة النشاط والتدقيق مع الاستفادة الكاملة من إمكانات بحث الذكاء الاصطناعي المتقدمة. تساعد الميزات داخل قاعدة البيانات، مثل مخزن قاعدة البيانات وقاعدة البيانات الخاصة الافتراضية في تأمين بيانات المتجهات والتأكد من أن المستخدمين الذين يتمتعون بالامتيازات المناسبة فحسب هم الذين يمكنهم الوصول إليها.
يعني هذا أن Oracle AI Vector Search يمكن أن يقلل بشكل كبير من بصمة البنية التحتية للمتجهات لدى الشركة. يمكن لقاعدة البيانات Oracle AI Database واحدة تلبية احتياجات العديد من المستخدمين المختلفين بأذونات وصول مختلفة واعتماد دون الحاجة إلى تكرار البيانات أو تحمل أي تكاليف إضافية على الإدارة، كما هو الحال غالبًا مع قواعد بيانات المتجهات الأخرى.
كيف توفر Oracle إمكانات عالية التوافر وإجراءات التعافي من الكوارث للمتجهات؟
المتجهات في قاعدة البيانات Oracle AI Database هي أنواع بيانات قاعدة بيانات من الدرجة الأولى. يعني هذا أن المتجهات تكتسب ضمنيًا جميع الميزات والإمكانات المُبتكرة التي تجعل Oracle قاعدة بيانات المؤسسة الرائدة في العالم. يتم تقديم التوافر العالي (HA) عن طريق تشغيل عمليات البحث عن التشابه على Oracle RAC أو Oracle Globally Distributed Database (التقسيم). يمكن لكل من Data Guard وActive Data Guard وOracle GoldenGate توفير التعافي من الكوارث تلقائيًا.