ما هي Weaviate؟ قاعدة بيانات بحث دلالي

آرون ريكاديلا | كاتب أول | 18 مارس 2025

في ظل إعادة الذكاء الاصطناعي التوليدي صياغة طريقة تفاعل المستخدمين مع أجهزة الكمبيوتر، فإنه يضع متطلبات جديدة على قواعد البيانات التي تخزِّن المعلومات الرئيسة لإجابات الأنظمة وتستردها. قواعد بيانات المتجهات، وهي المصممة للمطورين الذين يعملون على مجموعات بيانات كبيرة جدًا غير مُنظمة أو شبه مُنظمة، أو تخزِّن عمليات التضمين، أو المواضع في المساحة الرياضية لمليارات المتجهات المحتملة المحسوبة من البيانات الأولية. يمكن لقواعد البيانات إرجاع إجابات تعزز المعرفة بنماذج الذكاء الاصطناعي من خلال الحوسبة السريعة للعلاقات بين المتجهات.

على عكس قواعد البيانات التقليدية التي تتفوق في وصولها إلى مطابقات الاستعلام الدقيقة، تمثل قواعد البيانات المتجهات، مثل Weaviate (وكذلك أمثال Milvus وPinecone وChroma وQdrant) تشابهًا بين الكائنات المُخزَّنة حسب مسافة بعضها بعضًا في مساحة متجهة متعددة الأبعاد. يمكن لقواعد البيانات الوصول إلى المعلومات ذات الصلة بسرعة وإرجاع الإجابات على أساس النماذج التي تفترض أن المستخدم يعنيها، حتى لو كانت قريبة تقريبًا وليست مطابقة تمامًا للاستعلام.

يجعل هذا Weaviate وقواعد بيانات المتجهات الأخرى أدوات معالجة لغة طبيعية قوية للتطبيقات مثل توصيات خدمات التجارة الإلكترونية والبث والبحث الدلالي أو التشابه والكشف عن الاحتيال والتوليدالمعزز بالاسترجاع (RAG).

ما هي Weaviate؟

إن Weaviate المملوكة لشركة ناشئة هولندية تحمل نفس الاسم، هي قاعدة بيانات مُتجهات مُتخصصة تتفوق في عمليات البحث السريعة عبر مليارات المتجهات. تستخدم بنية البحث الخاصة بها تقسيم قواعد البيانات، وهي تقنية تنشر المعلومات عبر العديد من الخوادم لتعزيز قابلية التوسع والأداء.

تستخدم Weaviate أنواعًا مُختلفة من فهارس قواعد البيانات لتحسين الأداء تبعًا إلى حجم مجموعة البيانات. يُخزن فهرسها المسطح مواقع المتجهات وهو مناسب لمجموعات البيانات الصغيرة. إن فهرس HNSW (العالم الصغير القابل للملاحة الهرمي) أبطأ في الإنشاء لكنه مُناسب بشكل أفضل لمجموعات البيانات الكبيرة.

تؤكد Weaviate على إنتاجية المطورين من خلال تقديم مجموعة من الأدوات والواجهات، بما في ذلك مكتبات العملاء بلغة Python وJavaScript وGo وJava وواجهة برمجة تطبيقات للغة الاستعلام GraphQL. يتم توزيع قاعدة البيانات بموجب ترخيص BSD-3-Clause مفتوح المصدر. إن قوتها تقارب عمليات بحث الجار الأقرب (ANN)، التي تعزز نتائجها استعلامات الذكاء الاصطناعي التوليدي.

يمكن للعملاء تشغيل Weaviate على أجهزة الكمبيوتر الخاصة بهم، أو عبر خدمة سحابية عامة في نموذج دون خادم، أو من خلال خدمة سحابية مُدارة من الشركة باستخدام أجهزة مُخصصة.

طريقة التفوق في الأداء من Oracle على Weaviate في التوافر وقابلية التوسع

توفر Oracle Database 23ai أيضًا بحث متجهي بالذكاء الاصطناعي، مما يتيح لها تخزين المتجهات والبحث عنها كما تفعل Weaviate، مع أوقات استجابة أقل من الثانية. مع ذلك، بدلاً من تخزين البيانات واستردادها من قاعدة بيانات متجهات أحادية الغرض، يمكن لفِرق التطوير التي تستخدم Oracle Database 23ai تخزين البيانات العلائقية والرسم البياني والمكاني وJSON وإنترنت الأشياء والبحث فيها—إلى جانب البحث المتجهي. باستخدام قاعدة بيانات Oracle، لا تحتاج مجموعات تكنولوجيا المعلومات إلى إدارة قواعد بيانات ونُسخ بيانات متعددة، مما ينتج عنه تعقيد أقل.

بينما تدعم Weaviate التجميع لتحسين توافر قاعدة البيانات، توفر Oracle Database 23ai مجموعة أوسع من خيارات التوافر العالي، بما في ذلك Oracle Real Application Clusters، التي تتيح تشغيل مثيلات قاعدة البيانات على خوادم مُنفصلة لتجاوز الأخطاء وموازنة التحميل؛ وOracle Active Data Guard، لتُستخدم في النسخ المتماثل الفوري لقواعد بيانات بديلة حتى لا يتم فقدان أي بيانات أثناء انقطاع غير مُخطط له؛ وOracle GoldenGate، لتحقيق اتساق البيانات عبر مواقع متعددة. بالنسبة إلى قابلية التوسع، تدعم Oracle Globally Distributed Database تقسيم عمليات البحث عن المتجهات وتوجيه الاستعلامات وتحديث العمليات وإدراجها وحذفها إلى التقسيمات.

يمكن أن تعتمد قواعد بيانات المتجهات المُتخصصة على تحديثات على دفعات دورية للبيانات سريعة التغير، مما قد يؤدي إلى مجموعات بيانات غير مُتسقة. باستخدام Oracle Database 23ai، يظل مسار RAG ومصادر البيانات الأساسية متزامنين. عندما يتعلق الأمر بالاستعلامات، تُحوِّل Oracle Autonomous Database Select AI استعلامات اللغة الطبيعية إلى أوامر SQL، باستخدام نماذج اللغات الكبيرة من Anthropic وCohere وGoogle وMeta وMicrosoft وOpenAI. تتيح Oracle Database 23ai أيضًا للمطورين الاستفادة من خدمات الذكاء الاصطناعي من مقدمي خدمات السحابة الكبار الآخرين، بما في ذلك نماذج Gemini من Google وخدمات Azure AI من Microsoft ونماذج LLM من OpenAI، للاستخدام مع بيانات مؤسسية مُخزنة في Oracle.

تعرَّف على طريقة عمل بحث متجهات Oracle Database 23ai مع تطبيقك.

الأسئلة الشائعة حول Weaviate

كيف تتعامل Weaviate مع البحث الدلالي والمتجهات؟

تتيح قاعدة بيانات Weaviate عمليات بحث ذات زمن وصول مُنخفض عن عمليات تضمين المتجهات مُكونة من بيانات غير مُنظمة لمجموعة مُتنوعة من التطبيقات. تشمل هذه محركات التوصية وRAG، بالإضافة إلى عمليات البحث الهجينة التي تجمع بين الفهم الدلالي للعلاقات بين النص والصور والصوت والفيديو مع البحث عن الكلمات الرئيسة التقليدية.

ما هو الفَرق بين Pinecone وWeaviate؟

يُزود Weaviate بترخيص BSD-3-Clause ويمكن أن تعمل محليًا أو في خدمة سحابية عامة. يتم توزيع Pinecone ضمن ترخيص خاص وتعمل في السحابة (وكذلك عبر رابط إلى سحابة خاصة من AWS). يدعم Pinecone مجموعة واسعة من أنواع البيانات، في حين يمكن تخصيص Weaviate بسبب ترخيصها مفتوح المصدر.

هل يمكن استخدام Weaviate مع نماذج NLP؟

نعم، تتيح Weaviate للمستخدمين تشغيل نماذج معالجة اللغة الطبيعية الخاصة بهم وتوسيع نطاقها، بالإضافة إلى استخدام النماذج التي يتم تزويدها باستخدام البرامج.

ما الذي يميز Weaviate عن قواعد بيانات المتجهات الأخرى؟

تركز Weaviate على جذب المطورين إلى منتجاتها من خلال دعم مجموعة مُتنوعة من لغات البرمجة وأدوات الذكاء الاصطناعي. تم تصميم بنيتها لقابلية التوسع الأفقي من خلال تقسيم البيانات.