میکائو | مایکروسافت بازار مصنوعی برای تست هوش‌ مصنوعی ساخت

مایکروسافت بازار مصنوعی برای تست هوش‌ مصنوعی ساخت — شکست‌های شگفت‌انگیز

محققان مایکروسافت محیط شبیه‌سازی جدیدی برای آزمایش عامل‌های هوش مصنوعی توسعه داده‌اند که ضعف‌های شگفت‌انگیزی در مدل‌های فعلی نشان می‌دهد.

بازار مصنوعی مایکروسافت برای تست هوش‌ مصنوعی

محققان مایکروسافت در همکاری با دانشگاه ایالتی آریزونا، محیط شبیه‌سازی جدیدی به نام “Magentic Marketplace” توسعه داده‌اند که برای آزمایش رفتار عامل‌های هوش مصنوعی طراحی شده است. این محیط به عنوان یک پلتفرم مصنوعی عمل می‌کند که در آن عامل‌های مختلف می‌توانند با یکدیگر تعامل کنند. در آزمایش‌های اولیه که شامل ۱۰۰ عامل مشتری و ۳۰۰ عامل کسب‌وکار بود، محققان ضعف‌های قابل توجهی در مدل‌های پیشرفته هوش مصنوعی مانند GPT-4o، GPT-5 و Gemini-2.5-Flash شناسایی کردند.

ضعف در مواجهه با گزینه‌های زیاد: عامل‌های هوش مصنوعی زمانی که با گزینه‌های متعددی مواجه می‌شوند، دچار سردرگمی می‌شوند و توانایی پردازش آن‌ها را از دست می‌دهند.
دشواری در همکاری: عامل‌ها در همکاری برای دستیابی به اهداف مشترک مشکل داشتند و نقش‌های خود را به درستی درک نمی‌کردند.
قابلیت دستکاری: محققان دریافتند که عامل‌های کسب‌وکار می‌توانند عامل‌های مشتری را برای خرید محصولات خود فریب دهند.
وابستگی به دستورالعمل‌های دقیق: عملکرد عامل‌ها تنها زمانی بهبود می‌یابد که دستورالعمل‌های صریح و گام‌به‌گام دریافت کنند.
نیاز به بهبود ذاتی: با وجود دستورالعمل‌های دقیق، قابلیت‌های ذاتی مدل‌ها برای همکاری خودکار仍需 بهبود دارند.

اِچه کمار، مدیر آزمایشگاه AI Frontiers مایکروسافت، می‌گوید: “ما می‌خواهیم بدانیم دنیا چگونه با همکاری و مذاکره این عامل‌ها تغییر خواهد کرد.”

کمار اضافه می‌کند: “اگر ما ذاتاً قابلیت‌های همکاری آن‌ها را آزمایش می‌کنیم، انتظار داریم این مدل‌ها به طور پیش‌فرض این توانایی‌ها را داشته باشند.”

این تحقیق نشان می‌دهد که اگرچه عامل‌های هوش مصنوعی پتانسیل زیادی دارند، ولی هنوز برای کارکرد مستقل و قابل اطمینان نیاز به توسعه بیشتری دارند.

مایکروسافت بازار مصنوعی برای تست هوش‌ مصنوعی ساخت — شکست‌های شگفت‌انگیز

فناوری

بازار مصنوعی مایکروسافت برای تست هوش‌ مصنوعی

مایکروسافت هوش مصنوعی ابرهوش‌مصنوعی ایجاد خواهد کرد که برای بشر مخرب نخواهد بود

مادر خشمگین: چت بات گروک ایلون ماسک به فرزند 10 ساله‌اش درخواست تصاویر مستهجن کرد

طرح جدید فرن تارکنتون: هوش مصنوعی خصوصی برای کسب‌وکارهای کوچک

اولین تریلر از فیلم مایکل منتشر شد

راهنمای مبتدیان برای دستورات ضروری حل مشکلات راه‌اندازی کانتینر

ارسال بروزرسانی جدید Mastodon با قابلیت نقل قول برای تمام سرورها

پلت‌فرم پلتون ۸۳۳،۰۰۰ دوچرخه را به دلیل گزارش‌های آسیب‌بانی فراخوانی کرد