راهنمای ویکیپدیا برای تشخیص نوشتههای تولیدشده توسط هوش مصنوعی
راهنمای عمومی ویکیپدیا با عنوان «علائم نوشتار هوش مصنوعی» بهترین منبع برای شناسایی متون تولیدشده توسط مدلهای زبانی بزرگ است که بر اساس تجربه ویراستاران تهیه شده است.

راهنمای ویکیپدیا برای شناسایی نوشتههای هوش مصنوعی
ویراستاران ویکیپدیا از سال ۲۰۲۳ در قالب «پروژه پاکسازی هوش مصنوعی» به مقابله با ارسالهای تولیدشده توسط مدلهای زبانی بزرگ پرداختهاند. این راهنمای عمومی که حاصل تجربه تحلیل میلیونها ویرایش روزانه است، به جای تکیه بر ابزارهای اتوماتیک، بر شناسایی الگوهای زبانی و عادات نگارشی تمرکز دارد که در دادههای آموزشی این مدلها شایع است اما در ویکیپدیا نادر میباشد.
- تأکید بیش از حد بر اهمیت موضوع با عبارات کلیشهای مانند «لحظه محوری» یا «جنبش گستردهتر»
- ذکر جزئیات رسانهای کماهمیت برای القای مشهوریت موضوع، مشابه زندگینامههای شخصی
- استفاده از عبارات مبهم مانند «تأکید بر اهمیت» یا «بازتاب مرتبط بودن ادامهدار» در پایان جملات
- کاربرد زبان تبلیغاتی vague مانند توصیف «چشماندازهای همیشه دیدنی» و «مناظر همیشه نفسگیر»
ویراستاران ویکیپدیا اشاره میکنند: «این نوشتهها بیشتر شبیه نسخهبرداری از یک تبلیغ تلویزیونی هستند تا یک منبع مستقل.»
این الگوها به دلیل نحوه آموزش و استقرار مدلهای هوش مصنوعی به طور عمیق در نوشتار آنها ریشه دواندهاند. اگرچه میتوان آنها را پنهان کرد، اما حذف کاملشان دشوار خواهد بود. افزایش آگاهی عمومی در شناسایی این متون میتواند پیامدهای قابل توجهی در پی داشته باشد.



