نماذج الذكاء الاصطناعي تواجه تحديات في اختبارات الرياضيات المعقدة

أظهرت دراسة جديدة أن نماذج الذكاء الاصطناعي لا تزال تواجه صعوبات كبيرة في تجاوز خبراء الرياضيات خلال اختبارات معقدة. كشف الباحثون أن هذه النماذج، رغم تقدمها، لم تنجح في حل مسائل رياضية متقدمة بسبب عدم قدرتها على التعامل مع التعقيدات الفريدة لهذه المسائل.

وأضاف الباحثون أنه تم تقييم أداء هذه النماذج من قبل علماء رياضيات محترفين، حيث أظهرت النتائج أن الأنظمة الحالية لم تكن قادرة على المنافسة مع الخبراء البشريين. وأوضحوا أن الاختبار يركز على مسائل جديدة وغير مألوفة، مما يجعل التقييم أكثر تحدياً للنماذج المستخدمة.

وأشار المشاركون إلى أنه تم استخدام نماذج متعددة، بما في ذلك ChatGPT 5.5 Pro، من قبل فرق أكاديمية مرموقة مثل جامعة كاليفورنيا وجامعة برينستون. وقد نجحت أنظمة معينة في حل بعض المسائل، لكن لم يتمكن أي فريق من حل جميع المسائل المطروحة.

كما لوحظ أن الأنظمة واجهت تحديات تتعلق بـ"الهلوسة"، حيث قدمت نتائج غير صحيحة حتى عند طلب التحقق من دقتها. وأكد العلماء أن هذه النتائج تعكس الحاجة إلى تحسين نماذج الذكاء الاصطناعي لتكون أكثر قدرة على فهم وتطبيق الرياضيات المعقدة.

في الختام، تعد هذه الدراسة خطوة هامة نحو فهم كيفية تحسين قدرات الذكاء الاصطناعي في مجالات علمية متقدمة، مما يفتح المجال لمزيد من البحث والتطوير في هذا المجال.