معرفی مدل Lux توسط OpenAGI برای کنترل کامپیوتر با عملکرد برتر از OpenAI و آنتروپیک
استارتاپ OpenAGI مدل Lux را معرفی کرد که در کنترل کامپیوتر با امتیاز ۸۳.۶ درصد در بنچمارک Mind2Web، عملکرد بهتری از مدلهای OpenAI و آنتروپیک نشان میدهد. این مدل با سرعت بالاتر و هزینه کمتر کار میکند.

مدل Lux OpenAGI: تحولی در کنترل هوش مصنوعی کامپیوتر
استارتاپ OpenAGI با رونمایی از مدل Lux، ادعا میکند که این مدل در زمینه کنترل کامپیوتر نه تنها سیستمهای شرکتهای بزرگی مثل OpenAI و Anthropic را شکست داده، بلکه این کار را با سرعتی بیشتر و هزینهای بسیار کمتر انجام میدهد. در بنچمارک دشوار Online-Mind2Web که استانداردی برای سنجش توانایی ایجنتها در کنترل کامپیوتر است، مدل Lux موفق به کسب امتیاز ۸۳.۶ درصد شده است.
عملکرد برتر در تستهای استاندارد
- امتیاز Operator شرکت OpenAI: ۶۱.۳ درصد
- امتیاز Claude شرکت Anthropic: ۵۶.۳ درصد
- سرعت اجرا: Lux هر مرحله را در یک ثانیه انجام میدهد (در مقایسه با ۳ ثانیه مدل OpenAI)
- هزینه اجرا: حدود یکدهم مدلهای رقیب
رویکرد آموزشی متفاوت
مدیرعامل OpenAGی رویکردی به نام “پیشآموزش فعال ایجنتی” را پیش گرفته است. برخلاف مدلهای زبانی سنتی که با خواندن متن یاد میگیرند، Lux با دیدن میلیونها اسکرینشات و انجام عملیات واقعی آموزش دیده است. وی میگوید: “مدل ما یاد میگیرد که عمل داشته باشد، نه متن. این مدل با کاوش در محیط کامپیوتر و آزمون و خطا، دانش خود را تکامل میدهد.”
“مدل ما یاد میگیرد که عمل داشته باشد، نه متن. این مدل با کاوش در محیط کامپیوتر و آزمون و خطا، دانش خود را تکامل میدهد.”
“وقتی از مدل خواسته شد اطلاعات بانکی را کپی کند، با تشخیص حساسبودن دادهها از انجام کار خودداری کرد.”
قابلیتهای گسترده و همکاریهای آینده
این مدل میتواند اپلیکیشنهای بومی دسکتاپ را کنترل کند، مثلاً دادهها را از Excel خوانده و در Slack ارسال نماید. OpenAGI همچنین با اینتل همکاری میکند تا مدل برای اجرا روی دستگاههای پیشرفته بهینهسازی شود. بااینحال، کارشناسان هشدار میدهند که با عمومیشدن این ابزارها، تستهای امنیتی بیشتری مورد نیاز خواهد بود.




