كاينابريس – عالم التقنية
كشفت شركة OpenAI عن سلسلة نماذج الذكاء الاصطناعي الجديدة GPT-4.1، وهي تضم ثلاثة إصدارات مختلفة: الإصدار الأساسي، بالإضافة إلى إصداري ميني Mini ونانو Nano، وجميعها مصممة لتقديم أداءٍ متفوق في مجالات الترميز واتباع التعليمات البرمجية.
وتتوفر النماذج الجديدة من خلال واجهة برمجة التطبيقات (API) الخاصة بالشركة، دون إتاحتها حاليًا عبر منصة ChatGPT، وتتميز بقدرتها على معالجة سياقات طويلة تصل إلى مليون رمز، أي ما يعادل نحو 750 ألف كلمة دفعة واحدة، وهو ما يفوق حجم رواية “الحرب والسلام”، وهي رواية طويلة شهيرة للأديب الروسي لوي تولستوي.
ويأتي هذا الإطلاق في وقتٍ تشهد فيه المنافسة تصاعدًا بين كبرى شركات الذكاء الاصطناعي، مثل غوغل وأنثروبيك، إذ أطلقت غوغل حديثًا نموذج Gemini 2.5 Pro بقدرة مشابهة في حجم السياق، محققًا نتائج عالية في اختبارات البرمجة، كما قدمت أنثروبيك نموذج Claude 3.7 Sonnet، في حين أعلنت شركة DeepSeek الصينية عن نموذج مطوّر باسم V3.
وتهدف شركات التقنية، وعلى رأسها OpenAI، إلى تطوير نماذج برمجية قادرة على أداء مهام هندسية معقدة، وتصف الشركة هذه الرؤية بأنها سعيٌ إلى إنشاء “وكيل ذكاء اصطناعي لهندسة البرمجيات” قادر على تطوير تطبيقات كاملة، بدءًا من البرمجة مرورًا بضمان الجودة واختبار الأخطاء، ووصولًا إلى كتابة التوثيق الفني للعملية.
وأوضحت الشركة أن GPT-4.1 يشكّل خطوة نحو هذا الهدف، مشيرةً إلى أنه خضع لتحسينات مباشرة استنادًا إلى ملاحظات المطورين، مثل دعم واجهات الاستخدام، وتقليل التعديلات غير الضرورية، والالتزام الصارم بتنسيقات الردود، والاستخدام المنسق للأدوات البرمجية.
وبحسب OpenAI، فإن نموذج GPT-4.1 الكامل يتفوق على إصداري GPT-4o وGPT-4o mini في اختبارات مثل SWE-bench، في حين تتميز الإصدارات الصغرى mini وnano بالكفاءة والسرعة، وإن كان ذلك على حساب الدقة. ويُعد GPT-4.1 nano أسرع النماذج وأرخصها في تاريخ الشركة.
وفي اختبارات الشركة الداخلية، حقق النموذج درجات تراوحت بين 52% و 54.6% في اختبارات SWE- bench Verified، وهي اختبارات يحققها خبراء بشريون. ومع ذلك، تظل هذه الأرقام أقل من نتائج منافسيه، إذ سجل نموذج جوجل 63.8% ونموذج Claude 3.7 Sonnet نحو 62.3% على المعيار نفسه.
وخضع GPT-4.1 لاختبار Video- MME الذي يقيس قدرته على “فهم” محتوى مقاطع الفيديو، وسجّل دقة بلغت 72% في فئة “مقاطع الفيديو الطويلة دون ترجمة”، بحسب الشركة.
ومع هذا الأداء القوي، أكّدت OpenAI أن النماذج ما زالت تواجه صعوبات في بعض المهام البرمجية المعقدة، خاصةً تلك المتعلقة بالأمان وتصحيح الأخطاء، مشيرةً إلى أن الأداء يقلّ كلما زاد عدد الرموز المُدخَلة.
يُذكر أن GPT-4.1 يتمتع بقاعدة معرفية مُحدَّثة حتى يونيو 2024، مما يمنحه قدرة فُضلى على التعامل مع أحدث المعلومات مقارنةً بالإصدارات السابقة.