راهنمای ویکی‌پدیا برای تشخیص نوشته‌های تولیدشده توسط هوش مصنوعی

راهنمای عمومی ویکی‌پدیا با عنوان «علائم نوشتار هوش مصنوعی» بهترین منبع برای شناسایی متون تولیدشده توسط مدل‌های زبانی بزرگ است که بر اساس تجربه ویراستاران تهیه شده است.

راهنمای ویکی‌پدیا برای شناسایی نوشته‌های هوش مصنوعی

ویراستاران ویکی‌پدیا از سال ۲۰۲۳ در قالب «پروژه پاکسازی هوش مصنوعی» به مقابله با ارسال‌های تولیدشده توسط مدل‌های زبانی بزرگ پرداخته‌اند. این راهنمای عمومی که حاصل تجربه تحلیل میلیون‌ها ویرایش روزانه است، به جای تکیه بر ابزارهای اتوماتیک، بر شناسایی الگوهای زبانی و عادات نگارشی تمرکز دارد که در داده‌های آموزشی این مدل‌ها شایع است اما در ویکی‌پدیا نادر می‌باشد.

تأکید بیش از حد بر اهمیت موضوع با عبارات کلیشه‌ای مانند «لحظه محوری» یا «جنبش گسترده‌تر»
ذکر جزئیات رسانه‌ای کم‌اهمیت برای القای مشهوریت موضوع، مشابه زندگینامه‌های شخصی
استفاده از عبارات مبهم مانند «تأکید بر اهمیت» یا «بازتاب مرتبط بودن ادامه‌دار» در پایان جملات
کاربرد زبان تبلیغاتی vague مانند توصیف «چشم‌اندازهای همیشه دیدنی» و «مناظر همیشه نفس‌گیر»

ویراستاران ویکی‌پدیا اشاره می‌کنند: «این نوشته‌ها بیشتر شبیه نسخه‌برداری از یک تبلیغ تلویزیونی هستند تا یک منبع مستقل.»

این الگوها به دلیل نحوه آموزش و استقرار مدل‌های هوش مصنوعی به طور عمیق در نوشتار آن‌ها ریشه دوانده‌اند. اگرچه می‌توان آن‌ها را پنهان کرد، اما حذف کامل‌شان دشوار خواهد بود. افزایش آگاهی عمومی در شناسایی این متون می‌تواند پیامدهای قابل توجهی در پی داشته باشد.