انویدیا از مدلهای Nemotron 3 برای ساخت ایجنتهای هوش مصنوعی رونمایی کرد
انویدیا از سه مدل هوش مصنوعی Nemotron 3 با معماری ترکیبی رونمایی کرده که برای ساخت ایجنتهای هوش مصنوعی طراحی شدهاند. این مدلها در سه سایز مختلف ارائه میشوند و از معماری ترکیبی ترنسفورمر و Mamba بهره میبرند.

رونمایی انویدیا از مدلهای Nemotron 3 برای ایجنتهای هوش مصنوعی
انویدیا از خانواده جدید مدلهای هوش مصنوعی خود به نام Nemotron 3 رونمایی کرده که با هدف افزایش دقت در ساخت ایجنتهای هوش مصنوعی طراحی شدهاند. این مدلها در سه سایز مختلف ارائه میشوند:
- Nemotron 3 Nano (۳۰ میلیارد پارامتر): مدلی کارآمد برای انجام کارهای خاص با سرعت بالا
- Nemotron 3 Super (۱۰۰ میلیارد پارامتر): مدل میانی برای برنامههای چند-ایجنتی
- Nemotron 3 Ultra (۵۰۰ میلیارد پارامتر): برای حل پیچیدهترین مسائل سازمانی
کارایی بالای این مدلها بهخاطر معماری ترکیبی آنهاست که معماری ترنسفورمر را با معماری Mamba ترکیب کرده است. این ترکیب باعث میشود مدلها بسیار سبکتر اجرا شوند و طبق ادعای انویدیا، مدل نانو جدید تا ۴ برابر خروجی توکن سریعتری دارد.
کاری بریسکی، معاون نرمافزار انویدیا، در توصیف تکنیک MoE هیبریدی میگوید: «تصور کنید چندین آشپز ماهر در یک آشپزخانه بزرگ کار میکنند. آنها همگی از یک هسته مشترک استفاده میکنند، اما هرکدام قفسه ادویه مخصوص خود را دارند.»
انویدیا همچنین محیط شبیهسازیشده NeMo Gym را راهاندازی کرده که مانند یک باشگاه بدنسازی برای هوش مصنوعی عمل میکند و به توسعهدهندگان امکان میدهد ایجنتهای خود را قبل از ورود به دنیای واقعی محک بزنند.



