"غوغل" تصدم مستخدمي الذكاء الاصطناعي.. دقة روبوتات الدردشة لا تتجاوز 69%
كشفت شركة غوغل في تقييم صريح عن مستوى موثوقية روبوتات الدردشة المعتمدة على الذكاء الاصطناعي، لتؤكد أن هذه الأنظمة لا تزال بعيدة عن الكمال، حتى في أفضل حالاتها.
ووفقاً لاختبارات أجرتها الشركة باستخدام معيارها الجديد FACTS Benchmark Suite، لم يتمكن أي نموذج ذكاء اصطناعي من تجاوز حاجز 70% من الدقة الواقعية.
وجاء نموذج جيميني 3 برو في الصدارة بنسبة 69% فقط، فيما سجلت نماذج منافسة من "OpenAI" و"أنثروبيك" و"xAI" نتائج أقل.
وبمعنى آخر، تُظهر البيانات أن روبوتات الدردشة تخطئ في واحد من كل ثلاثة ردود تقريباً، رغم أنها غالباً ما تقدم إجابات واثقة وسلسة، بحسب تقرير نشره موقع "digitaltrends" واطلعت عليه "العربية Business".
تكتسب هذه النتائج أهمية خاصة لأن معظم اختبارات الذكاء الاصطناعي الحالية تركز على قدرة النموذج على تنفيذ المهمة أو صياغة رد مقنع، لا على مدى صحة المعلومات نفسها.
وفي قطاعات حساسة مثل التمويل والرعاية الصحية والقانون، قد تؤدي إجابة واحدة خاطئة، حتى لو بدت مقنعة، إلى عواقب مكلفة وخطيرة.
وتحذر "غوغل" من أن الثقة العمياء في هذه الأنظمة تمثل مخاطرة حقيقية، خاصة عندما يفترض المستخدم أن الروبوت "يعرف ما يقول".

0 Comments: