جيفري إريكسون | كاتب أول | 31 يوليو 2025
"أريد قضاء بعض الوقت في قراءة المعلومات التي بمستند ورقي أو PDF وكتابتها في تطبيق محاسبي"، وهو ما لم يقله أحد قط. هذا هو السبب في أن فهم المستندات القائم على الذكاء الاصطناعي مُفيد للغاية—إذ يعالج نوع العمل المزدحم الذي يسعد الناس في تسليمه. وكما يفعل ذلك، يمكنه تسريع معالجة المستندات والمساعدة في خفض التكاليف مع تحسين الدقة. تجد في الغالب أن تقنية فهم المستندات مُدمجة في عمليات سير عمل تطبيق SaaS، وتم تكليفها مؤخرًا بتسمية نص لبيانات تدريب الذكاء الاصطناعي وتوفير المعلومات التي يحتاجها وكلاء الذكاء الاصطناعي لإكمال مهامهم متعددة الخطوات. بتلك الطريقة، يمكن للناس العودة إلى التفكير والبناء والتواصل مع العمل الذي يستمتعون به.
يمثل فهم المستندات عملية آلية تسحب المعلومات من ملف نصي، مثل PDF أو مسح مستند ورقي ضوئيًا وتمريرها إلى تطبيق أعمال. إذ يساعد في تقليل إدخال البيانات يدويًا—بل وربما القضاء عليه—مع تحسين الدقة. أصبح فهم المستندات ممكنًا مع خوارزميات التعلم الآلي (ML) المُتطورة. يعد ML أساسًا لعدة خطوات، بدءًا من معالجة الصور، إذ يتم اكتشاف المعلومات ذات الصلة، مثل السعر والاسم ورقم الفاتورة أو أمر الشراء (PO)، واستخراجها وتخزينها في قاعدة بيانات للتكامل في أنظمة الأعمال ذات الصلة.
على سبيل المثال، قد تستخدم الشركة المصنِّعة فهم المستندات لاستخراج المعلومات من أوامر الشراء وإدخالها تلقائيًا في دفتر الأستاذ المحاسبي ونظام مراقبة المخزون، مما يزيد بشكل كبير من سرعة عملية المبيعات ودقتها. بالمثل، قد تنشر الشركة نظام سداد النفقات لسحب المعلومات ذات الصلة من صور الإيصالات ثم تنشئ تقرير النفقات تلقائيًا للموظف.
كان فهم المستندات حالة استخدام مُبكرة وناجحة لـ AI وML. تجده مدمجًا في تطبيقات الأعمال لأتمتة عمليات سير العمل، مما يوفر الوقت للمتخصصين الذين لولا ذلك كانوا سيتعبون في خطوات إدخال البيانات اليدوية ومعالجة المستندات هذه. عند دمجه مع معالجة اللغة الطبيعية (NLP) والتكوين المعزز بالاسترجاع (RAG)، يمكن أن يكون فهم المستندات جزءًا لا يتجزأ من النظام الذي يساعد في فهم المعنى الدلالي للمستندات، والمساعدة في تصنيف المستندات واكتشاف المعلومات.
النقاط الرئيسة
تعد معالجة المستندات مكونًا أساسًا في فهم المستندات: استخراج البيانات من مجموعة مُتنوعة من أنواع الملفات، ووضعها بتنسيق مُنظم، وتصنيفها في قاعدة بيانات يمكن استخدامها لملء الحقول في النماذج عبر الإنترنت وسحبها إلى وظائف الأعمال، مثل معالجة الفواتير وكشف الرواتب والمبيعات ومحاسبة المصروفات.
للقيام بذلك، يحتاج نظام مُعالجة المستندات إلى قواعد محددة مُسبقًا. يمكن لخوارزميات التعلم الآلي بعد ذلك تحديد البيانات واستخراجها من الكتل النصية والجداول والحقول التي تحتوي على الأسعار والتواريخ والأسماء والعناوين والملاحظات ذات الصلة وأرقام الحسابات وبيانات الأعمال الأخرى. من خلال أتمتة عمليات إدخال البيانات اليدوية، يمكن للمؤسسات تسريع وظائف الأعمال بشكل كبير مع تقليل الأخطاء.
تستخدم برامج فهم المستندات والخدمات السحابية التعلم الآلي المُتقدم والذكاء الاصطناعي لاستخراج البيانات من أنواع مختلفة من المستندات، مثل الفواتير والإيصالات، وتوفيرها للتطبيقات وسير العمل التي تُعلمك بعمليات الأعمال. توفر هذه الأتمتة كفاءة ودقة جديدة لمهام مثل، تصنيف المستندات وإدخال البيانات.
يمكن لعملية فهم المستندات التعرُّف على النصوص والجداول والتوقيعات واستخراجها من تنسيقات مختلفة، بما في ذلك ملفات PDF وعمليات المسح الضوئي وملفات JPEG. يتم بعد ذلك إرجاع البيانات المستخرجة بتنسيق مُنظم، مثل بيانات JSON المنقولة، التي تتضمن نوع الحقل وقيمته، مما يسهِّل التكامل في التطبيقات وسير العمل. أصبح فهم المستندات مُهمًا في خدمات الذكاء الاصطناعي التوليدي ووكلاء الذكاء الاصطناعي لأنه يحول المستندات إلى نص قابل للقراءة الآلية وقابل للتحرير يمكن لأنظمة الذكاء الاصطناعي هذه استخدامه لمخرجاتها.
يُعد وكلاء الذكاء الاصطناعي كيانات برمجية يمكن تعيين مهام لها، وفحص بيئاتها، واتخاذ الإجراءات كما هو محدد بواسطة أدوارهم، والتكيف بناءً على تجاربهم. يمكن أن تكون هذه المهام مُعقدة، وذات خطوات متعددة، وتعتمد غالبًا على الوصول إلى البيانات المستندة إلى النصوص. على سبيل المثال، قد يتم تكليف وكيل إدارة سلسلة التوريد بالمساعدة في تحسين الخدمات اللوجستية من خلال تحليل أوامر الشراء من مجموعة مُتنوعة من المصادر وفي تنسيقات مُتعددة، بما في ذلك النماذج الورقية الممسوحة ضوئيًا.
يمكن لخدمات فهم المستندات أيضًا تغذية أداة تسمية البيانات، والتي تتيح للمستخدمين تمييز حقول محددة بصريًا وتسميتها مباشرةً في عينات المستندات—وهي خطوة حيوية لإنشاء مجموعة بيانات تدريب يمكن استخدامها لضبط نماذج اللغات الكبيرة (LLM) المُخصصة. هذه دائرة حميدة تحسِّن من قدرة النموذج على فهم المعلومات واستخراجها من المستندات المماثلة في المستقبل.
يتم الوصول إلى فهم المستندات بشكل عام عبر ERP وسلسلة التوريد وإدارة علاقات العملاء (CRM) وغيرها من تطبيقات الأعمال، وخاصةً أنظمة SaaS، وهي طريقة رئيسة لزيادة كفاءة المستخدمين. يمكن لمنشئي التطبيقات الوصول إلى الخدمات السحابية في فهم المستندات من خلال واجهات برمجة التطبيقات، مثل API استخراج النصوص وAPI تعريف الجدول وAPI تصنيف المستندات، مما يتيح لهم أتمتة مهام معالجة المستندات داخل التطبيقات التي ينشؤنها.
تنفِّذ الشركات فهم المستندات لخفض التكاليف وتقليل مخاطر الأخطاء البشرية مع تسريع المعالجة. فيما يلي نظرة على طريقة تحقيق هذه المزايا.
يتمتع الذكاء الاصطناعي التوليدي بفهم مستندات مُتقدم—بشكل كبير—من خلال دعم الأساليب التقليدية، مثل التعرُّف البصري على الأحرف (OCR) والأنظمة القائمة على القواعد. لكنها ليست التكنولوجيا الجديدة الوحيدة التي تترك انطباعًا في هذا المجال.
نظرًا إلى أن GenAI وNLP يجعلان أنظمة فهم المستندات أكثر قدرة—دعم الصور داخل المستندات، وفهم التخطيطات المُعقدة، واستخراج المعلومات بدقة جيدة، حتى من البيانات غير المُنظمة—صار هذا الفهم الأكثر شبهًا بالإنسان يوسع نطاق حالات الاستخدام بشكل كبير. فيما يلي بعض المجالات التي نرى فيها استخدامًا أكبر لأنظمة فهم المستندات.
مهما كان المجال، عندما تتمكن الشركة من معالجة محتوى المستندات وفهمه بدقة، فيمكن أن يحسن ذلك وظائف الأعمال من خلال اتخاذ قرارات أكثر استنارة، وعمليات سير عمل فعَّالة، وخدمة عملاء محسنة، والقدرة على طرح رؤى قيمة خفية في البيانات النصية. في نهاية المطاف، يُترجم الفهم الفعَّال للمستندات في توفير في الوقت والتكلفة، وتقليل الأخطاء، وإنشاء مؤسسة أكثر تنافسية وقائمة على البيانات.
إذا كنت تبحث عن إنشاء فهم المستندات في تطبيقك، فيمكن أن يمنحك فهم مستندات في البنية التحتية من Oracle Cloud (OCI) حلاً قويًا لكنه فعَّال من جانب التكلفة. من خلال واجهات برمجة تطبيقات بسيطة وأدوات واجهة سطر الأوامر، يمكن لتطبيقك استخراج النصوص والجداول والبيانات الرئيسة الأخرى من المستندات عبر لغات متعددة باستخدام نماذج الذكاء الاصطناعي التي تم إنشاؤها مُسبقًا، كما تتوفر أدوات استخراج مستندات أكثر قابلية للتخصيص لتناسب احتياجاتك.
يعتمد فهم مستندات OCI على رؤية الكمبيوتر وتقنيات معالجة اللغة الطبيعية من Oracle المستخدمة في مهام المؤسسات الأساسية، مثل معالجة حسابات المدفوعات من ناحية النفقات وإدارة المحتوى. لمساعدة مؤسستك في الاستفادة منها، توفر Oracle Cloud واجهة سهلة الاستخدام لك لتحميلها وتسميتها، والبيانات لتدريب النماذج المُخصصة في خدمة الذكاء الاصطناعي الأحدث. يعد فهم المستندات مجرد مجموعة من خدمات الذكاء الاصطناعي المتوفرة على OCI، والتي يتم تسعيرها بشكل تنافسي حتى يتمكن جميع مستخدمي التطبيق من استخدامها.
كان فهم المستندات نجاحًا مبكرًا في استخدام التعلم الآلي لأتمتة عمليات الأعمال. مع استمرار نمو حجم المعلومات في جميع قطاعات الاقتصاد، فيمكنه أن ييساعد الشركات من خلال معالجة البيانات والعمل عليها بكفاءة والسماح للأشخاص بالقيام بعمل أكثر قيمة. ويستمر في لعب دور حيوي في جعل GenAI أفيد، سواء بصفته جزء من نظامها التدريبي أو من خلال تحسين المخرجات، خاصةً مع اضطلاع وكلاء الذكاء الاصطناعي بمزيد من المهام.
يعد فهم المستندات أمرًا أساسًا لمساعدة الذكاء الاصطناعي في الوصول بشكل أفضل إلى المزيد من بياناتك، وتحسين نتائجها وتبسيط الاستخدام. هذا مجرد محرك واحد لزيادة استخدام السحابة في عام 2025.
كيف يختلف فهم المستندات عن OCR التقليدي؟
تمثل OCR إمكانية أساسية تجعل عملية فهم الوثيقة ممكنة—إنها هي التي تحول النص الذي في صورة أو PDF إلى نص قابل للتحرير. من تلك النقطة، تتيح معالجة فهم المستندات النص لتطبيقات الأعمال.
ما أنواع المستندات التي يمكن معالجتها باستخدام فهم المستندات؟
تمسح عملية فهم المستندات الوثائق، مثل ملفات PDF أو ملفات الصور مثل ملفات .jpg أو .png وتحوِّل النص الذي تجده إلى نموذج قابل للتحرير. تمسح الحقول في المستندات، مثل الإيصالات أو الفواتير أو طلبات القروض؛ وتتعرَّف على الأسماء والمبالغ والتواريخ والتفاصيل المهمة الأخرى؛ وتجعل تلك المعلومات متاحة لتطبيقات الأعمال.
ما مدى أمان البيانات التي تتم معالجتها باستخدام حلول فهم المستندات؟
يتوقف أمان البيانات في عملية فهم المستندات على البنية وتدابير أمان البيانات المُتخذة بصفتها جزء من العملية. هل يتم تشفير البيانات أثناء وجودها على القرص وأثناء نقلها؟ هل تم نسخها احتياطيًا؟ هل توجد ضواط كافية للوصول؟ كل هذه الأمور يمكن أن تجعل أي عملية بيانات أكثر أمانًا.