دبي، الإمارات العربية المتحدة، في يونيو 2026: أعلنت Arabic.AI، إحدى الشركات الرائدة على مستوى المنطقة في تطوير الحلول التقنية المخصصة للمؤسسات والمدعومة بالذكاء الاصطناعي باللغة العربية، عن إطلاق إطار تقييم النماذج اللغوية العربية الكبيرة «HELM Arabic Enterprise»، وذلك بالتعاون مع مركز أبحاث النماذج الأساسية «CRFM» التابع لجامعة ستانفورد. وتهدف هذه المبادرة إلى تعزيز قدرات المؤسسات على تقييم النماذج اللغوية العربية الكبيرة، بما يضمن ملاءمتها للاستخدامات المؤسسية وفق معايير دقيقة وموثوقة.
ويُعرف مركز أبحاث النماذج الأساسية «CRFM» التابع لجامعة ستانفورد بتطويره إطار التقييم الشامل للنماذج اللغوية «HELM»، الذي أصبح معيارًا عالميًا لتقييم النماذج اللغوية وفق منهجيات تتسم بالشفافية وإمكانية إعادة التحقق من النتائج. وانطلاقًا من هذا الأساس، يقدّم «HELM Arabic Enterprise» معيارًا مرجعيًا منظّمًا يوفّر لمنظومة الذكاء الاصطناعي العربي إطارًا عمليًا موحدًا لمقارنة سلوكيات النماذج، ودعم ممارسات تقييم أكثر اتساقًا وموثوقية.
ويُقيّم «HELM Arabic Enterprise» أداء النماذج استنادًا إلى كفاءتها في ست مهام مؤسسية رئيسية تشمل إنشاء المحتوى، وفهم وتحليل البيانات المالية، والإجابة عن الاستفسارات القانونية. وقد صُمم هذا الإطار خصيصًا لقياس مدى موثوقية أداء النماذج اللغوية الكبيرة العربية في بيئات العمل المهنية والمؤسسية، لا سيما تلك الخاضعة للضوابط التنظيمية. وعلى غرار جميع أطر «HELM»، تتسم الأوامر التوجيهية، والاستجابات، ومقاييس التقييم، والنتائج بالشفافية وإمكانية إعادة التحقق، وذلك من خلال إطار «HELM»مفتوح المصدر.

ويأتي هذا التعاون انسجامًا مع رؤية شركة Arabic.AI الرامية إلى تعزيز حضور اللغة العربية في تقنيات الذكاء الاصطناعي، وتطوير أدوات عملية تخدم المؤسسات والجهات البحثية على حد سواء. وبإطلاق إطار تقييم «HELM Arabic Enterprise»، باتت المؤسسات تمتلك مرجعًا موحدًا يساعدها على تقييم النماذج داخليًا، والمقارنة بين مزوّدي الحلول، ومتابعة أداء النماذج والإشراف عليها بصورة مستمرة. وترى شركة Arabic.AI ومركز أبحاث النماذج الأساسية (CRFM) التابع لجامعة ستانفورد أنّ هذه المبادرة تمثل خطوة مهمة نحو ترسيخ معايير أكثر نضجًا وموثوقية لتقييم حلول الذكاء الاصطناعي المؤسسي باللغة العربية.
في هذا السياق، صرّحت نور الحسن، الرئيسة التنفيذية لشركة Arabic.AI__: "إنّ الذكاء الاصطناعي المؤسسي باللغة العربية بحاجة ماسة إلى إطار تقييم صارم ومفتوح، ويرتبط ارتباطًا مباشرًا بمسارات العمل الفعلية في قطاع الأعمال". وتابعت: "يوفر إطار «HELM Arabic Enterprise» للمنظومة معيارًا مشتركًا لقياس مدى التقدم والموثوقية بكل وضوح وثقة".
لمعرفة المزيد حول الجوانب التي يقيّمها إطار «HELM Arabic Enterprise» وآلية عمله، يرجى زيارة صفحة HELM Arabic Enterprise على الموقع الإلكتروني لمركز Stanford CRFM. النص الإعلاني: "العنوان الرئيسي: نموذج "LLM-X" من شركة Arabic.AI يتصدر إطار معايير HELM Arabic Enterprise النص الفرعي: جرى تقييم النموذج واعتماده من جانب مركز Stanford CRFM (مركز أبحاث النماذج الأساسية بجامعة ستانفورد)"