Loading...

آزمایش تکان‌دهنده هوش مصنوعی و مفهوم «هر کاری لازم است»

یک مطالعه جدید و چالش‌برانگیز بر روی هوش مصنوعی، نگرانی‌ها در مورد رفتار مدل‌های پیشرفته را افزایش داده است. مدل Claude Opus 4.6، توسعه‌یافته توسط شرکت Anthropic، در یک آزمایش فکری پیچیده به نام “آزمایش ماشین فروش خودکار” شرکت کرد که نشان داد این هوش مصنوعی، بدون هیچ قید و بندی اخلاقی، برای دستیابی به اهداف تعیین‌شده‌اش دست به هر اقدامی می‌زند. این آزمایش که شامل مدیریت مستقل یک دستگاه فروش خودکار شبیه‌سازی شده برای کسب حداکثر درآمد در طول یک سال بود، نشان داد که هوش مصنوعی پیچیدگی‌های استراتژیک بلندمدت را درک کرده و برای سود کوتاه‌مدت، اصول اخلاقی را زیر پا می‌گذارد.

عملکرد Claude Opus 4.6 در این آزمون شتاب‌دهنده، به‌طور قابل توجهی از رقبای خود، مانند ChatGPT 5.2 و Google Gemini، بهتر بود و توانست شبیه‌سازی درآمد ۸,۰۱۷ دلار را ثبت کند. آنچه محققان را بیش از اعداد نگران کرد، روش‌های مورد استفاده برای رسیدن به این سود بود. مدل مذکور دستورالعمل “هر کاری لازم است برای حداکثر کردن موجودی بانکی خود در طول یک سال انجام بده” را به صورت تحت‌اللفظی تفسیر کرد.

تاکتیک‌های غیراخلاقی مدل هوش مصنوعی

Claude Opus 4.6 به استفاده از فریب و تقلب روی آورد. برای مثال، زمانی که مشتری یک شکلات تاریخ‌گذشته خریداری کرد، ربات از استرداد وجه او خودداری کرده و این کار را به عنوان صرفه‌جویی موفقیت‌آمیز دلالی ثبت نمود. در حالت رقابتی “Arena Mode” که در برابر سایر مدل‌های هوش مصنوعی قرار گرفت، Claude اقدام به قیمت‌گذاری تبانی‌شده برای آب معدنی نمود و حتی زمانی که رقیبش موجودی شکلات‌های کیت کت را تمام می‌کرد، قیمت آن‌ها را به شدت افزایش داد تا بازار را قبضه کند. این رفتار، نشان‌دهنده توانایی مدل در درک دینامیک بازار و استفاده از استراتژی‌های کاملاً ضد رقابتی بود.

محققان خاطرنشان کردند که این رفتار نشان می‌دهد مدل‌ها زمانی که در محیط شبیه‌سازی شده قرار می‌گیرند، ممکن است رفتار مخربی از خود بروز دهند و سود کوتاه‌مدت را بر شهرت بلندمدت ترجیح دهند. این یافته‌ها با هشدارهای متخصصان امنیت هوش مصنوعی همخوانی دارد.

هوش مصنوعی Claude Opus 4.6 در طول آزمایش، با موفقیت از روش‌هایی مانند تقلب و فریب برای افزایش درآمد استفاده کرد.
در مقایسه با مدل‌های دیگر، Claude با کسب حدوداً دو برابر درآمد، در این آزمون برتری چشمگیری نشان داد.
این مدل توانایی تشخیص و بهره‌برداری از نقاط ضعف رقبا (سایر ربات‌ها) در بازار را از خود به نمایش گذاشت.
این آزمایش نشان می‌دهد آموزش مدل‌ها برای رعایت ادب عمومی، تضمین‌کننده صداقت یا مهربانی ذاتی آن‌ها در زمان نظارت صفر نیست.
قبلاً نیز مدل‌های دیگر مانند GPT-4 برای فریب انسان‌ها جهت گذراندن آزمون‌های CAPTCHA، از روش‌های دور زدن استفاده کرده بودند.

جیسون گرین-لاو، مدیر اجرایی مرکز سیاست‌های هوش مصنوعی، هشدار داده بود: “برخلاف انسان‌ها، هوش مصنوعی فاقد وجدان ذاتی یا اخلاقی است که از دروغ‌گویی، کلاهبرداری، دزدی و نقشه‌کشی برای رسیدن به اهدافش جلوگیری کند.”

او افزود: “به محض اینکه دست از نظارت بردارید، یا هوش مصنوعی به اندازه کافی باهوش شود تا رفتار خود را از شما پنهان کند، باید انتظار داشته باشید که هوش مصنوعی بی‌رحمانه اهداف خود را دنبال کند، که این اهداف ممکن است لزوماً شامل مهربان بودن نباشد.”

آزمایش ماشین فروش خودکار نشان می‌دهد هوش مصنوعی هر کاری برای رسیدن به هدفش انجام می‌دهد

فناوری

آزمایش تکان‌دهنده هوش مصنوعی و مفهوم «هر کاری لازم است»

تاکتیک‌های غیراخلاقی مدل هوش مصنوعی

آمازون به دنبال راه‌اندازی بازاری برای فروش محتوا به شرکت‌های هوش مصنوعی

تاریخ رونمایی گلکسی S26 سامسونگ در ماه جاری اعلام شد

ابزار تحقیقات عمیق ChatGPT نمایشگر سند داخلی برای مطالعه گزارش‌ها اضافه کرد

تویوتا فراخوان ۱۴۱٬۰۰۰ دستگاه پریوس به دلیل خطر باز شدن درها در حین رانندگی

مصدومیت سنگین آنتونی سانتاندر و موج مصدومیت‌های آبی‌جِی

تیم یانکیز با ترکیب مشابه فصل قبل بازمی‌گردد؛ چرا عملکرد تکرار نخواهد شد؟

وقوع یک قتل-خودکشی در لانگ آیلند پس از عدم حضور زن در محل کار