بنچمارک جدید گوگل: یکسوم پاسخهای هوش مصنوعی ممکن است غلط باشد
تحقیق جدید دیپمایند گوگل نشان میدهد حتی پیشرفتهترین مدلهای هوش مصنوعی جهان نیز حداکثر ۶۹ درصد دقت دارند، یعنی از هر سه پاسخ، یکی ممکن است نادرست باشد.

دقت هوش مصنوعی: واقعیت vs ادعا
تحقیق جدید دیپمایند گوگل با بنچمارک FACTS نشان میدهد که حتی پیشرفتهترین مدلهای هوش مصنوعی جهان از مرز ۷۰ درصد دقت عبور نکردهاند. مدل جمینی ۳ پرو گوگل با امتیاز ۶۹ درصد در صدر قرار دارد، به این معنی که تقریباً یکسوم پاسخهای هوش مصنوعی ممکن است غلط باشند.
- بنچمارک FACTS روی چهار حوزه تمرکز دارد: دانش درونی، جستجوی اینترنتی، استناد دقیق و تحلیل تصاویر
- ضعف اصلی مدلها در بخش چندوجهی است که دقت اغلب زیر ۵۰ درصد میباشد
- تحلیل نمودارهای مالی و پزشکی توسط هوش مصنوعی میتواند عواقب خطرناکی داشته باشد
- محققان هشدار میدهند که اعتماد کورکورانه به هوش مصنوعی میتواند فاجعهبار باشد
- در مشاغل حساس مانند پزشکی و وکالت، نظارت انسانی ضروری است
“اگر خبرنگاری در یک رسانه ۶۹ درصد مواقع راست بگوید، فوراً اخراج میشود؛ اما ما همین سطح خطا را از هوش مصنوعی میپذیریم.”
“پاشنه آشیل تمام مدلها بخش چندوجهی بود؛ جایی که دقت اغلب زیر ۵۰ درصد است.”
این تحقیق اهمیت تأیید اطلاعات ارائه شده توسط هوش مصنوعی را بهویژه در زمینههای حساس برجسته میکند.



