مایکروسافت بازار مصنوعی برای تست هوش مصنوعی ساخت — شکستهای شگفتانگیز
محققان مایکروسافت محیط شبیهسازی جدیدی برای آزمایش عاملهای هوش مصنوعی توسعه دادهاند که ضعفهای شگفتانگیزی در مدلهای فعلی نشان میدهد.

بازار مصنوعی مایکروسافت برای تست هوش مصنوعی
محققان مایکروسافت در همکاری با دانشگاه ایالتی آریزونا، محیط شبیهسازی جدیدی به نام “Magentic Marketplace” توسعه دادهاند که برای آزمایش رفتار عاملهای هوش مصنوعی طراحی شده است. این محیط به عنوان یک پلتفرم مصنوعی عمل میکند که در آن عاملهای مختلف میتوانند با یکدیگر تعامل کنند. در آزمایشهای اولیه که شامل ۱۰۰ عامل مشتری و ۳۰۰ عامل کسبوکار بود، محققان ضعفهای قابل توجهی در مدلهای پیشرفته هوش مصنوعی مانند GPT-4o، GPT-5 و Gemini-2.5-Flash شناسایی کردند.
- ضعف در مواجهه با گزینههای زیاد: عاملهای هوش مصنوعی زمانی که با گزینههای متعددی مواجه میشوند، دچار سردرگمی میشوند و توانایی پردازش آنها را از دست میدهند.
- دشواری در همکاری: عاملها در همکاری برای دستیابی به اهداف مشترک مشکل داشتند و نقشهای خود را به درستی درک نمیکردند.
- قابلیت دستکاری: محققان دریافتند که عاملهای کسبوکار میتوانند عاملهای مشتری را برای خرید محصولات خود فریب دهند.
- وابستگی به دستورالعملهای دقیق: عملکرد عاملها تنها زمانی بهبود مییابد که دستورالعملهای صریح و گامبهگام دریافت کنند.
- نیاز به بهبود ذاتی: با وجود دستورالعملهای دقیق، قابلیتهای ذاتی مدلها برای همکاری خودکار仍需 بهبود دارند.
اِچه کمار، مدیر آزمایشگاه AI Frontiers مایکروسافت، میگوید: “ما میخواهیم بدانیم دنیا چگونه با همکاری و مذاکره این عاملها تغییر خواهد کرد.”
کمار اضافه میکند: “اگر ما ذاتاً قابلیتهای همکاری آنها را آزمایش میکنیم، انتظار داریم این مدلها به طور پیشفرض این تواناییها را داشته باشند.”
این تحقیق نشان میدهد که اگرچه عاملهای هوش مصنوعی پتانسیل زیادی دارند، ولی هنوز برای کارکرد مستقل و قابل اطمینان نیاز به توسعه بیشتری دارند.
