Loading...

بنچمارک FACTS گوگل: دقت هوش مصنوعی فقط ۶۹ درصد

آخرین تحقیقات گوگل دیپ‌مایند نشان می‌دهد که حتی پیشرفته‌ترین مدل‌های هوش مصنوعی مانند جمنای ۳ پرو تنها ۶۹ درصد دقت در بیان حقایق دارند. بنچمارک FACTS که هفته گذشته رونمایی شد، مدل‌های AI را در چهار حوزه کلیدی ارزیابی می‌کند: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر.

جمنای ۳ پرو با امتیاز ۶۹ درصد بهترین عملکرد را ثبت کرد
سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر قرار گرفتند
این آمار زنگ خطری برای کسب‌وکارهای متکی به هوش مصنوعی است
خطاهای کوچک در صنایع مالی، بهداشت و حقوق می‌توانند ویرانگر باشند
یک شرکت حقوقی کارمندش را به دلیل استفاده از ChatGPT با پرونده‌های ساختگی اخراج کرد