آرون ريكاديلا | كاتب أول | 18 مارس 2025
كما يعيد الذكاء الاصطناعي التوليدي إعادة صياغة كيفية تفاعل المستخدمين مع أجهزة الكمبيوتر، فإنه يضع متطلبات جديدة على قواعد البيانات التي تخزن المعلومات الأساسية لإجابات الأنظمة وتسترجعها. قواعد بيانات المتجهات، المصممة للمطورين الذين يعملون مع مجموعات بيانات كبيرة جدًا غير منظمة أو شبه منظمة، أو يخزنون عمليات التضمين، أو المواضع في المساحة الرياضية لمليارات المتجهات المحتملة المحسوبة من البيانات الأولية. يمكن لقواعد البيانات إرجاع إجابات تعزز معرفة نماذج الذكاء الاصطناعي من خلال الحوسبة السريعة للعلاقات بين الموجهات.
على عكس قواعد البيانات التقليدية، التي تتفوق في العثور على مطابقات الاستعلام الدقيقة، تمثل قواعد البيانات المتجهة، مثل Weaviate (وكذلك أمثال Milvus وPinecone وChroma وQdrant)، تشابهًا بين الكائنات المخزنة عن طريق مسافة بعضها بعضًا في مساحة متجهة متعددة الأبعاد. يمكن لقواعد البيانات العثور على المعلومات ذات الصلة بسرعة وإرجاع الإجابات استنادًا إلى النماذج التي تفترض أن المستخدم يعنيها، حتى لو كانت قريبة تقريبًا وليست مطابقة تمامًا للاستعلام.
وهذا يجعل Weaviate وقواعد البيانات المتجهة الأخرى أدوات معالجة لغة طبيعية قوية للتطبيقات مثل توصيات خدمات التجارة الإلكترونية والبث والبحث الدلالي أو التشابه والكشف عن الاحتيال والإنشاء المعزز للاستعادة (RAG).
Weaviate، المملوكة لشركة ناشئة هولندية تحمل نفس الاسم، هي قاعدة بيانات متجهة متخصصة تتفوق في عمليات البحث السريعة عبر مليارات المتجهات. تستخدم بنية البحث الخاصة بها تقسيم قواعد البيانات، وهي تقنية تنشر المعلومات عبر العديد من الخوادم، لزيادة قابلية التوسع والأداء.
تستخدم Weaviate أنواعًا مختلفة من فهارس قواعد البيانات لتحسين الأداء تبعًا لحجم مجموعة البيانات. يخزن فهرسه المسطح مواقع المتجهات وهو مناسب لمجموعات البيانات الصغيرة. إن مؤشر HNSW (العالم الصغير القابل للتنقل الهرمي) أبطأ في الإنشاء ولكنه مناسب بشكل أفضل لمجموعات البيانات الكبيرة.
تؤكد Weaviate على إنتاجية المطورين من خلال تقديم مجموعة من الأدوات والواجهات، بما في ذلك مكتبات العملاء في Python وJavaScript وGo وJava وواجهة برمجة تطبيقات لغة الاستعلام GraphQL. يتم توزيع قاعدة البيانات بموجب ترخيص BSD-3-Clause مفتوح المصدر. قوتها تقارب عمليات بحث أقرب الأجهزة المجاورة (ANN)، التي تعزز نتائجها استعلامات الذكاء الاصطناعي العامة.
يمكن للعملاء تشغيل Weaviate على أجهزة الكمبيوتر الخاصة بهم، أو في خدمة سحابية عامة في نموذج بدون خادم، أو من خلال خدمة سحابية مُدارة من الشركة باستخدام أجهزة مخصصة.
توفر Oracle Database 23ai أيضًا بحث موجه للذكاء الاصطناعي، مما يتيح لها تخزين الموجهات والبحث عنها كما تفعل Weaviate، مع أوقات استجابة أقل من الثانية. ومع ذلك، بدلاً من تخزين البيانات واسترجاعها من قاعدة بيانات متجهات أحادية الغرض، يمكن لفرق التطوير التي تستخدم Oracle Database 23ai تخزين البيانات العلائقية والرسم البياني والمكاني وJSON وInternet of Things والبحث فيها—إلى جانب البحث المتجه. باستخدام قاعدة بيانات Oracle، لا تحتاج مجموعات تكنولوجيا المعلومات إلى إدارة قواعد بيانات ونسخ بيانات متعددة، مما يؤدي إلى تعقيد أقل.
بينما تدعم Weaviate التجميع لتحسين توافر قاعدة البيانات، توفر Oracle Database 23ai مجموعة أوسع من خيارات التوافر العالي، بما في ذلك Oracle Real Application Clusters، التي تتيح تشغيل مثيلات قاعدة البيانات على خوادم منفصلة لتجاوز الأخطاء وموازنة التحميل؛ وOracle Active Data Guard، للنسخ المتماثل الفوري لقاعدة بيانات بديلة حتى لا يتم فقدان أي بيانات أثناء انقطاع غير مخطط له؛ وOracle GoldenGate، لاتساق البيانات عبر مواقع متعددة. لقابلية التوسع، تدعم Oracle Globally Distributed Database التقسيم لعمليات البحث عن المتجهات؛ واستعلامات التوجيه؛ وتحديث العمليات وإدراجها وحذفها إلى الأقسام.
يمكن أن تعتمد قواعد بيانات المتجهات المتخصصة على تحديثات الدفعات الدورية للبيانات سريعة التغير، مما قد يؤدي إلى مجموعات بيانات غير متسقة. باستخدام Oracle Database 23ai، يظل مسار RAG ومصادر البيانات الأساسية متزامنين. عندما يتعلق الأمر بالاستعلامات، تقوم Oracle Autonomous Database Select AI بتحويل استعلامات اللغة الطبيعية إلى أوامر SQL، باستخدام نماذج اللغات الكبيرة من Anthropic وCohere وGoogle وMeta وMicrosoft وOpenAI. تتيح Oracle Database 23ai أيضًا للمطورين الاستفادة من خدمات الذكاء الاصطناعي من موفري السحابة الكبار الآخرين، بما في ذلك نماذج Gemini من Google وخدمات Azure AI من Microsoft ونماذج LLM من OpenAI، للاستخدام مع بيانات المؤسسة المخزنة في Oracle.
تعرف على كيفية عمل بحث متجه Oracle Database 23ai مع تطبيقك.
كيف يتعامل Weaviate مع البحث الدلالي والمتجه؟
تتيح قاعدة بيانات Weaviate عمليات البحث ذات زمن الوصول المنخفض عن عمليات تضمين المتجهات التي تم إنشاؤها من بيانات غير منظمة لمجموعة متنوعة من التطبيقات. وتشمل هذه محركات التوصية وRAG، بالإضافة إلى عمليات البحث المختلطة التي تجمع بين الفهم الدلالي للعلاقات بين النص والصور والصوت والفيديو مع البحث عن الكلمات الرئيسية التقليدية.
ما هو الفرق بين Pinecone وWeaviate؟
تشحن Weaviate بترخيص BSD-3-Clause ويمكن أن تعمل محليًا أو في خدمة سحابية عامة. يتم توزيع Pinecone بموجب ترخيص خاص ويعمل في السحابة (وكذلك عبر رابط إلى سحابة خاصة من AWS). يدعم Pinecone مجموعة واسعة من أنواع البيانات، في حين يمكن تخصيص Weaviate بسبب ترخيصه مفتوح المصدر.
هل يمكن استخدام Weaviate مع نماذج NLP؟
نعم، يتيح Weaviate للمستخدمين تشغيل نماذج معالجة اللغة الطبيعية الخاصة بهم وتوسيع نطاقها، بالإضافة إلى استخدام النماذج التي يتم شحنها باستخدام البرنامج.
ما الذي يميز Weaviate بصرف النظر عن قواعد بيانات المتجهات الأخرى؟
تركز Weaviate على جذب المطورين إلى منتجاتها من خلال دعم مجموعة متنوعة من لغات البرمجة وأدوات الذكاء الاصطناعي. تم تصميم بنيتها لقابلية التوسع الأفقية من خلال تقسيم البيانات.