ما هي Chroma؟ قاعدة بيانات مُضمنة مفتوحة المصدر

آرون ريكاديلا | كاتب أول | 15 أبريل 2024

تتحول فِرق تطوير الذكاء الاصطناعي التي تنشئ تطبيقات بحث عن التشابه التي تستخدم نماذج لغوية كبيرة ومجموعات بيانات غير مُنظمة إلى قواعد بيانات متجهات مصممة لمقارنة خصائص الملايين أو مليارات نقاط البيانات بسرعة.

يقارن هذه النوع الجديد من قواعد بيانات المتجهات المُتخصصة من شركات مثل Chroma، بالإضافة إلى Pinecone وQdrant وWeaviate وZilliz العلاقات بين عمليات تضمين المتجهات التي تمثل محتوى غير مُنظم في الفضاء الرياضي عالي الأبعاد، ليكشف عن علاقات دلالية بين ميزات مجموعة البيانات. تشغِّل قواعد بيانات المتجهات تطبيقات الذكاء الاصطناعي التي تبحث في محتوى الصور والفيديو، وتوصي بالمنتجات أو تبث الوسائط، وتصل إلى معلومات أكثر صلة بناءً على هدف المستخدمين، وتكمل استعلامات روبوتات محادثة الذكاء الاصطناعي ببيانات مملوكة للشركات من خلال التوليد المعزز بالاسترجاع (RAG). تتفوق قواعد بيانات المتجهات في العثور على مطابقات الجار الأقرب التقريبي (ANN) في مجموعات البيانات.

المقصود بـ ChromaDB؟

تتيح قاعدة بيانات Chroma، مفتوحة المصدر التي تحمل اسم شركة San Francisco الناشئة للمطورين إنشاء تطبيقات بما في ذلك بحث ANN واسترجاع الصور وRAG وموفري توصيات التجارة الإلكترونية. من المعروف أنها قاعدة بيانات متجهات خفيفة الوزن يمكن للمطورين تشغيلها على جهاز كمبيوتر محمول للنماذج الأولية السريعة، وكذلك في الخدمات السحابية العامة أو الخاصة. تستخدم Chroma تنسيق بيانات Apache Arrow للوصول السريع إلى البيانات.

يمكن لفِرق التطوير تشغيل Chroma في وضع العميل/الخادم على نقطة توصيل واحدة ونشرها باستخدام حاوية Docker أو جهاز مُستضاف في خدمة سحابية عامة. كما يمكنهم تشغيل قاعدة البيانات في Chroma Cloud، وهي الخدمة المُدارة من الشركة، مع عمليات النشر على Amazon Web Services وGoogle Cloud Platform وMicrosoft Azure. تتوفر Chroma بموجب ترخيص Apache 2.0، والذي يسمح بالاستخدام التجاري.

توفر قاعدة البيانات سهلة التطوير نماذج تضمين من OpenAI وGoogle وCohere وHugging Face وغيرها. تحتوي على تكامل Python وJavaScript مع LangChain وLlamaIndex وBraintrust، بالإضافة إلى تكاملات Python مع أدوات الذكاء الاصطناعي والتي من بينها Streamlit. تصنع Chroma عملاء لمجموعة مُتنوعة من اللغات، بما في ذلك Python وJavaScript وRuby وJava وGo وC# وElixir وRust.

سبب تفوق Oracle على Chroma في قواعد بيانات المتجهات

يوفر بحث متجهات الذكاء الاصطناعي الخاص بـ Oracle Database 23ai مجموعة أوسع بكثير من خيارات التوافر والأمان العالية من Chroma وقواعد بيانات المتجهات المستقلة الأخرى. تتيح Oracle Virtual Private Database وميزة Oracle Label Security للمؤسسات التحكم في الوصول الداخلي إلى البيانات على أساس دور المستخدم أو درجة الإذن. تتيح Oracle Real Application Clusters تشغيل مثيلات قاعدة البيانات على مجموعة من الخوادم للتسامح مع الأخطاء وموازنة الأحمال. يُنسخ Oracle Active Data Guard على الفور إلى قاعدة بيانات بديلة، مما يمنع فقدان البيانات في حال انقطاع غير مُخطط له.

يمكن لـ Oracle Database 23ai أيضًا تحسين عمليات البحث عن المتجهات من خلال تحديد إذا كان يجب تطبيق عوامل التصفية الإضافية، والتي يتم تخزينها غالبًا في أعمدة علائقية، قبل بحث المتجهات أو بعده. يعني هذا أنه عندما يُرجع تطبيق بحث التشابه قائمة بنتائج أعلى مستوى، يمكن لـ Oracle Database تحديد إذا كان يتم تضييق نطاق هذه النتائج على أساس السمات العلائقية للبيانات، إما قبل تنفيذ بحث المتجهات أو أثناء تنفيذه أو فيما بعده.

اكتشف كيف يمكن للذكاء الاصطناعي الوصول بشكل أفضل إلى بياناتك وتحسين النتائج وتبسيط الاستخدام.

الأسئلة الشائعة حول ChromaDB

ما هي Chroma وكيف تعمل؟

تُعد Chroma قاعدة بيانات متجهات خفيفة الوزن لبناء التطبيقات المدعومة بعمليات البحث عن التشابه في مساحة تضمين المتجهات. يتضمن ذلك طبقة تخزين للكائنات تخفض تكلفة تقديم فهارس المتجهات للبحث عن التشابه.

ما الذي يجعل Chroma مختلفة عن قواعد بيانات المتجهات الأخرى؟

تهدف قاعدة بيانات Chroma المطورين الذين يعملون على مشروعات صغيرة ويمكن تثبيتها على جهاز كمبيوتر محمول للنماذج الأولية السريعة دون التزامات بالأجهزة الكبيرة. كما تدعم مجموعة واسعة من لغات التطوير وأدوات الذكاء الاصطناعي.

هل يمكن لـ Chroma التعامل مع كل من البيانات المُنظمة وغير المُنظمة؟

تم تصميم Chroma لتخزين تضمينات المتجهات والبحث عنها، ليس لمعالجة البيانات المُنظمة والعلائقية.

هل Chroma مفتوحة المصدر؟

نعم، تتوفر Chroma بموجب ترخيص Apache 2.0 مفتوح المصدر، والذي يتيح للمستخدمين إعادة توزيع تعليماتها البرمجية في منتجاتهم الخاصة.