میلیونها کتاب قربانی شدند تا Claude زنده بماند
در این قسمت از ورجکست، درباره مدلهای هوش مصنوعی تشنه داده، سینماهای نتفلیکس و دکمههای هوشمند صحبت میشود. تمرکز بر تلاش عظیم Anthropic برای دیجیتالی کردن کتابها است.
رسوایی دادههای عظیم در توسعه مدلهای هوش مصنوعی
راهاندازی ChatGPT در نوامبر ۲۰۲۲ مسابقهای را در صنعت فناوری آغاز کرد که به سرعت همه جا را فرا گرفت. اگرچه OpenAI مفهوم هوش مصنوعی را اختراع نکرد، اما بیشتر فناوریهای پیشرفته در آزمایشگاههای تحقیقاتی شرکتها و مؤسسات باقی مانده بود. ناگهان، این فناوری همهجا حاضر شد و عملکرد آن بهتر از حد انتظار بود. این وضعیت باعث شد شرکتهای زیادی تصمیم بگیرند به هر قیمتی که شده عقب نمانند و برای کسب برتری در مهمترین فناوری تاریخ تلاش کنند. این تلاشها اغلب با مسائل اخلاقی و قانونی همراه بوده است.
در این قسمت از ورجکست، جزئیات مربوط به “پروژه پاناما” در شرکت Anthropic مورد بحث قرار میگیرد. این پروژه یک تلاش عظیم برای دسترسی و دیجیتالی کردن مقادیر عظیمی از کتابها بود تا بهعنوان داده برای آموزش مدلهای زبان بزرگ (LLM) مورد استفاده قرار گیرند. برنامه Anthropic شامل استفاده از روشهایی مانند اسکن کتابها، وبسایتهای قاچاق و انبارهای بزرگ برای جمعآوری این دادهها بود. این شیوه عملیاتی شباهت زیادی به آنچه در سایر شرکتهای فعال در این حوزه در حال رخ دادن است، دارد و نزاع قانونی و اخلاقی بر سر درستی این اقدامات همچنان ادامه دارد.
“برنامه Anthropic — که شامل دستگاههای اسکن کتاب، وبسایتهای قاچاق و انبارهای عظیم بود — شبیه به کارهایی است که در سایر شرکتها نیز در حال انجام است.”
- تلاش گسترده شرکتها برای عقب نماندن از رقابت هوش مصنوعی پس از موفقیت ChatGPT.
- پروژه “پاناما” شرکت Anthropic با هدف جمعآوری میلیونها کتاب برای آموزش مدلهای زبانی.
- مسئله حقوق کپیرایت و اخلاقیات استفاده از منابع کتابی اسکن شده توسط شرکتهای هوش مصنوعی بزرگ.
- بحث در مورد آینده سینماها در دنیایی که محتوای نتفلیکس در حال تسلط است.
- بررسی مشکلات عملکردی دکمههای هوشمند جدید ایکیا و پشتیبانی گوگل از این قابلیتها.
بحث دیگری که در این پادکست مطرح شد مربوط به نتفلیکس و تلاش آن برای خرید استودیوهای Warner Bros بود. با توجه به جاهطلبیهای نتفلیکس در صنعت سینما، تحلیلهایی در مورد بقای سینماهای سنتی در محیطی که نتفلیکس بر آن سلطه مییابد، صورت گرفت و این سؤال مطرح شد که آیا مردم اصلاً تمایل دارند فیلمهای نتفلیکس را روی پرده بزرگ سینما تماشا کنند یا خیر.
“پس از اینکه همه چیز مشخص شد، آیا سینماها میتوانند در دنیایی که به طور فزایندهای توسط نتفلیکس تسخیر شده، زنده بمانند؟”
نتیجهگیری این بحثها نشان میدهد که صنعت فناوری با سرعت سرسامآوری در حال پیشرفت است، اما این پیشرفتها با چالشهای مهمی در زمینه حقوق مالکیت معنوی و اخلاق استفاده از دادههای عمومی و خصوصی روبرو هستند. این موضوعات، مانند مدلهای دادهمحور و فناوریهای جدید خانههای هوشمند، مسیر آینده فناوری را تعیین میکنند.

