أعلنت شركة ديب سيك الصينية اليوم عن ابتكار نموذج ذكاء اصطناعي جديد تحت اسم DeepSeek-OCR، يمتاز بقدرته غير المسبوقة على ضغط النصوص الطويلة والمعقدة حتى 20 ضعفًا، ما يتيح للنماذج اللغوية معالجة كميات ضخمة من البيانات بتكاليف حوسبة منخفضة. يعتمد النموذج على تقنية "المشفّر البصري" التي تمرر البيانات أولًا عبر محرك DeepEncoder لضغط بيانات النص والصورة قبل ترميزها وتحليلها من قبل النموذج اللغوي الأساسي.
إقرأ ايضاً:المنصات في مرمى الاتهامات والإجراءات… تقرير عن أدوات يوتيوب لصحة المستخدمين النفسيةأزمة قانونية جديدة تهدد عرش الأهلي.. مستشار قانوني يكشف تطورات جذرية قد تسحب لقب السوبر السعودي
معالجة السياقات الطويلة وحفظ الدقة
تفيد الشركة بأن تقنيتها الجديدة تسمح بخفض عدد الرموز النصية (Tokens) بمعدل من 7 حتى 20 مرة مقارنة بالحجم الأصلي، مع الاحتفاظ بدقة فائقة بلغت 97% عند ضغط النص لعشر أضعاف، وما يزيد عن 60% حتى في حالات الضغط الشديد (20 ضعفًا). وتبرز أهمية التقنية في تمكين LLMs من التعامل مع سياقات ممتدة ومعالجة الجداول والرسوم والمعادلات، ما يجعل التطبيق واعدًا في مجالات المال والبحث العلمي وبيئات الذكاء الصناعي الضخمة.
أداء عالي بموارد محدودة وتكلفة أقل
توضح اختبارات ديب سيك أن النظام تفوق على نماذج مثل GOT-OCR 2.0 وMinerU 2.0 في الحفاظ على المعلومات الأساسية مع استهلاك رموز نصية أقل، كما يمكن للنموذج توليد 200 ألف صفحة بيانات تدريب يوميًا باستخدام بطاقة رسوميات واحدة (إنفيديا A100-40G)، ما يمهد الطريق لأنظمة ذكاء صناعي أقل تكلفة وأكثر مرونة في المعالجة.
آليات وخبرات هندسية متقدمة
يتألف النموذج من مكونين أساسيين: DeepEncoder لضغط النصوص عميقًا مع الحفاظ على جودة البيانات، ووحدة DeepSeek3B-MoE-A570M التي تستخدم تقنية Mixture-of-Experts لتوزيع معالجة البيانات وصقل النتائج. يعتمد النظام أيضًا على بنية هندسية متعددة الوسائط تجمع الرؤية البصرية والتحليل النصي، وتساهم في تمكين الذكاء الصناعي من تفسير جداول ومعادلات ورسوم هندسية باحترافية.
تطبيقات واعدة في الذكاء الاصطناعي العملاق
من المتوقع أن يمثل نموذج ديب سيك خطوة ثورية نحو هندسة ذكاء صناعي يعمل بسياق واسع وموارد تشغيل منخفضة، ما يسهم في نقل واجهات البرمجة ومعالجة النصوص إلى مستوى جديد من الكفاءة والمرونة، ويجعل 2025 عامًا مفصليًا لابتكارات الذكاء الصناعي عالمياً.