جمینای گوگل در حال توسعه قابلیت ساخت آواتار سهبعدی شبیه به اپل ویژن پرو
بررسی کدهای اپلیکیشن گوگل نشان میدهد که قابلیت ساخت آواتارهای سهبعدی تحت عنوان «کاراکترز» با استفاده از هوش مصنوعی جمینای در دسترس کاربران اندرویدی قرار خواهد گرفت.
توسعه آواتارهای سهبعدی توسط هوش مصنوعی جمینای
بر اساس بررسیهای انجام شده بر روی کدهای جدیدترین نسخه آزمایشی اپلیکیشن گوگل (نسخه ۱۷.۴.۶۶ بتا)، گوگل در حال کار بر روی افزودن قابلیتی برای ساخت آواتارهای سهبعدی برای کاربران اندرویدی است. این ویژگی که احتمالاً با نام «کاراکترز» (Characters) شناخته خواهد شد، شباهتهایی به قابلیت Persona در هدست اپل ویژن پرو و همچنین آواتارهای موجود در هدست گلکسی XR دارد. هدف اصلی این قابلیت، تقویت تعاملات دیجیتال کاربران، به ویژه در سرویسهایی مانند گوگل میت و سایر اپلیکیشنهای ارتباطی است.
گوگل به طور مداوم در تلاش است تا قابلیتهای هوش مصنوعی جمینای را در پلتفرمها و سرویسهای مختلف خود یکپارچه سازد. ساخت آواتارهای سهبعدی یکی از ویژگیهای جذاب هوش مصنوعی محسوب میشود که میتواند در زمینههای متعددی کاربرد داشته باشد. این آواتارها میتوانند چهره واقعی کاربر را شبیهسازی کرده و به عنوان جایگزین در تماسهای تصویری مورد استفاده قرار گیرند.
نحوه فعالسازی و ملاحظات فنی
گزارشها حاکی از آن است که گزینه مربوط به آواتارهای سهبعدی در منوی لانچر جمینای در اپلیکیشن اندروید ظاهر شده است. فعالسازی این قابلیت نیازمند ضبط یک ویدیوی سلفی توسط کاربر است تا هوش مصنوعی جمینای بتواند مدل سهبعدی مورد نظر را ایجاد کند. این امر به ویژه در دستگاههای اندرویدی که فاقد سنسورهای پیشرفته سختافزاری مانند هدستهای تخصصی هستند، اهمیت بیشتری پیدا میکند؛ زیرا قدرت پردازشی جمینای برای مدلسازی دقیق چهره به کار گرفته میشود.
علاوه بر این، گزینه دیگری به نام Likeness در صفحه ضبط ویدئو دیده شده است که پیشتر در نسخه تحت وب جمینای نیز مشاهده شده بود. در ابتدا تصور میشد این گزینه برای تشخیص ویدیوهای تولید شده توسط هوش مصنوعی باشد، اما اکنون به نظر میرسد مستقیماً با فرآیند ساخت و مدیریت آواتارها در ارتباط است.
- قابلیت مورد نظر برای ساخت آواتار سهبعدی احتمالاً با نام «کاراکترز» در اندروید ارائه میشود.
- این ویژگی برای جایگزینی چهره کاربر در تماسهای تصویری مانند گوگل میت طراحی شده است.
- ساخت آواتار نیازمند ضبط یک ویدیوی سلفی برای پردازش توسط هوش مصنوعی جمینای است.
- توانایی پردازشی جمینای نقش مهمی در جایگزینی سنسورهای پیشرفته سختافزاری دارد.
- ممکن است این قابلیت در نهایت با نامی متفاوت یا در پلتفرمهای محدودتری عرضه شود.
«آواتارهای سهبعدی که احتمالاً با نام کاراکترز در دسترس کاربران دستگاههای اندرویدی قرار میگیرد، در گذشته روی پلتفرم گلکسی XR نیز ارائه شده بود.»
«نبود سنسورهای پیشرفته موجود در هدست گلکسی XR یا ویژن پرو روی گوشیهای اندرویدی، باعث میشود پای هوش مصنوعی جمینای به میان کشیده شود تا بتواند با استفاده از قدرت پردازشی خود، مدل سهبعدی از چهره کاربران ایجاد نماید.»
در نهایت، توسعه این قابلیت نشاندهنده تمرکز گوگل بر ارتقاء تجربه کاربری در محیطهای مجازی و ارتباطات تصویری با بهرهگیری از قدرت مدلهای زبانی بزرگ مانند جمینای است، که این امر رقابت در حوزه رابطهای کاربری سهبعدی و واقعیت ترکیبی را تشدید میکند.
