ظهر المنشور Ray Data وDocling يعالجان أكبر نقطة ألم للذكاء الاصطناعي للمؤسسات على BitcoinEthereumNews.com. Zach Anderson ٢٧ فبراير ٢٠٢٦ ١٦:٥٨ تكامل جديدظهر المنشور Ray Data وDocling يعالجان أكبر نقطة ألم للذكاء الاصطناعي للمؤسسات على BitcoinEthereumNews.com. Zach Anderson ٢٧ فبراير ٢٠٢٦ ١٦:٥٨ تكامل جديد

راي داتا ودوكلينغ يعالجان أكبر نقطة ألم في الذكاء الاصطناعي للمؤسسات

2026/02/28 12:33
3 دقيقة قراءة


Zach Anderson
27 فبراير 2026 4:58 مساءً

يجمع التكامل الجديد بين المعالجة الموزعة لـ Ray Data وتحليل المستندات من Docling لمعالجة أكثر من 10,000 ملف معقد لتطبيقات RAG في ساعات بدلاً من أيام.

حصلت فرق المؤسسات التي تبني تطبيقات الذكاء الاصطناعي على حل لأكثر عوائقها إحباطًا. قدمت Anyscale تفاصيل حول كيفية تحويل الجمع بين Ray Data و Docling لأسابيع من معالجة المستندات إلى ساعات - وهو تطور يمكن أن يسرع الجداول الزمنية للنشر للشركات التي لديها أرشيفات ضخمة من المستندات.

يعالج التكامل التقني ما يسميه المطلعون "عنق الزجاجة في البيانات" في أنظمة التوليد المعزز بالاسترجاع. بينما تجعل العروض التوضيحية الذكاء الاصطناعي التوليدي يبدو واضحًا، فإن الواقع يتضمن التعامل مع آلاف ملفات PDF القديمة والجداول المعقدة والصور المضمنة التي تتعامل معها أدوات المعالجة التقليدية بشكل سيئ.

ما الذي يتغير فعليًا

يقوم محرك التنفيذ المتدفق لـ Ray Data بتوصيل البيانات عبر مهام CPU و GPU في وقت واحد. تلغي بنية Python الأصلية التكاليف الإضافية للتسلسل التي تصيب الأطر الأخرى عند ترجمة البيانات بين بيئات اللغة. بالنسبة للفرق التي تقوم بتشغيل الاستدلال الدفعي أو المعالجة المسبقة لمجموعات البيانات الضخمة، فهذا يعني دورات تكرار أسرع.

يتعامل Docling مع تعقيد التحليل الذي يكسر معظم الأدوات التقليدية - استخراج الجداول والتخطيطات بدقة مع الحفاظ على البنية الدلالية. عند دمجه مع Ray Data، تقوم كل عقدة عمل بتشغيل مثيل Docling مع نماذج الذكاء الاصطناعي المضمنة في الذاكرة، مما يتيح معالجة المستندات المتوازية على نطاق واسع.

تعمل البنية على النحو التالي: يدير Ray Data Driver التنفيذ ويسلسل كود المهام للتوزيع. يقرأ العمال كتل البيانات مباشرة من التخزين ويكتبون ملفات JSON المعالجة إلى الوجهة. لا يصبح الـ driver عنق زجاجة أبدًا لأنه لا يتعامل مع إنتاجية البيانات الفعلية.

أساس Kubernetes

ينظم KubeRay مجموعات Ray على Kubernetes، ويتعامل مع القياس التلقائي الديناميكي من 10 إلى 100 عقدة بشفافية. يتضمن النظام الاسترداد التلقائي عند فشل عقد العمل - وهو أمر بالغ الأهمية لوظائف الاستيعاب الكبيرة التي لا تستطيع تحمل إعادة التشغيل من البداية.

ينقل التدفق من البداية إلى النهاية المستندات من تخزين الكائنات من خلال التحليل والتجزئة، ويولد التضمينات على عقد GPU، ويكتب إلى قواعد البيانات المتجهة مثل Milvus. ثم تستعلم تطبيقات RAG قاعدة البيانات لتغذية السياق إلى LLMs.

تستخدم شركات بما في ذلك Pinterest و DoorDash و Instacart بالفعل Ray Data للمعالجة في الميل الأخير وتدريب النماذج، مما يشير إلى أن التكنولوجيا أثبتت قابليتها للإنتاج.

ما وراء البحث البسيط

تستهدف اللعبة الأوسع هنا سير عمل الذكاء الاصطناعي القائم على الوكلاء حيث ينفذ الوكلاء المستقلون المهام متعددة الخطوات. تصبح جودة البيانات المعالجة أكثر أهمية حيث يعتمد الوكلاء على التوثيق الدقيق للتصرف نيابة عن المستخدمين. تضع المؤسسات التي تبني هياكل قابلة للتوسع نفسها الآن لسلاسل الاستدلال المتقدمة مع مكالمات LLM متسلسلة متعددة.

توفر منصات Red Hat OpenShift AI و Anyscale خيارات النشر مع متطلبات حوكمة المؤسسة. يعني الأساس مفتوح المصدر أن الفرق يمكنها البدء في الاختبار دون عقبات رئيسية في المشتريات.

بالنسبة لفرق الذكاء الاصطناعي التي تقضي حاليًا وقتًا أطول في إعداد البيانات أكثر من ضبط النموذج، يوفر هذا التكامل مسارًا عمليًا للأمام. السؤال ليس ما إذا كانت معالجة المستندات الموزعة مهمة - بل ما إذا كانت البنية التحتية الخاصة بك يمكنها التعامل مع ما سيأتي بعد ذلك.

مصدر الصورة: Shutterstock

المصدر: https://blockchain.news/news/ray-data-docling-enterprise-ai-document-processing

فرصة السوق
شعار Raydium
Raydium السعر(RAY)
$0.5584
$0.5584$0.5584
-7.11%
USD
مخطط أسعار Raydium (RAY) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني crypto.news@mexc.com لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.