رونمایی OpenAI از مدل GPT-5.3 Codex برای برنامهنویسی عاملمحور در رقابت با Anthropic
OpenAI با معرفی GPT-5.3 Codex، ابزار Codex را از یک کدنویس ساده به عاملی تبدیل کرده که میتواند تقریباً هر وظیفه توسعهدهندگان را بر عهده بگیرد و در بنچمارکها از Claude Opus 4.6 پیشی گرفته است.

رونمایی OpenAI از GPT-5.3 Codex در رقابت با آنتروپیک
اخیراً شرکت OpenAI، رقیب اصلی شرکت Anthropic در حوزه هوش مصنوعی، از یک مدل جدید با نام GPT-5.3 Codex رونمایی کرد. این مدل به منظور تقویت ابزار برنامهنویسی مبتنیبر ایجنت (Agent-based programming) این شرکت معرفی شده است. هدف اصلی این تحول، ارتقاء سطح توانمندیهای Codex است؛ به طوری که دیگر صرفاً یک ابزار برای نوشتن و بازبینی کد نباشد، بلکه بتواند «تقریباً هر کاری را که توسعهدهندگان و متخصصان با کامپیوتر انجام میدهند، بر عهده بگیرد». این پیشرفت نشاندهنده تمرکز رو به رشد شرکتهای پیشرو بر هوش مصنوعی عاملمحور (Agentic AI) است که قابلیت خودکارسازی وظایف پیچیده را در اختیار کاربران قرار میدهد. بر اساس ادعاهای OpenAI، GPT-5.3 Codex به کمک آزمایشهای انجام شده، قادر است بازیها و اپلیکیشنهای پیچیده را در مدت زمان کوتاهی، یعنی در عرض چند روز، از صفر تا صد خلق کند.
یکی از نکات قابل توجه در مورد این مدل، بهبود کارایی و سرعت است. گزارش شده که GPT-5.3 Codex نسبت به نسل قبلی خود، یعنی GPT-5.2، تا ۲۵ درصد سریعتر عمل میکند. همچنین، OpenAI اعلام کرده است که این مدل در فرایند «خلق خود» نقش فعال داشته و کارکنان این شرکت از نسخههای ابتدایی آن برای رفع اشکالات و ارزیابی عملکرد مدل استفاده کردهاند، که این مسئله به نوعی خودکارسازی فرآیند توسعه نرمافزار را نشان میدهد.
- برتری در بنچمارکهای تخصصی کدنویسی: مدل جدید OpenAI علیرغم داشتن پنجره زمینه (Context Window) کوچکتر در مقایسه با رقیب، در معیارهای تخصصی مانند SWE-Bench Pro و Terminal-Bench بر عملکرد برتری دارد.
- قابلیت Mid-Task Steering: این ویژگی منحصربهفرد به مدل اجازه میدهد تا در حین اجرای یک وظیفه پیچیده، هدایت و تنظیم شود، که این امر کنترل لحظهای بیشتری را برای توسعهدهندگان فراهم میآورد.
- سرعت بالاتر نسبت به نسل قبل: افزایش ۲۵ درصدی سرعت در GPT-5.3، بهرهوری توسعه را تسریع میبخشد.
جدال استراتژیها در برابر Claude Opus 4.6
معرفی GPT-5.3 Codex تقریباً بلافاصله پس از رونمایی از مدل رقیب، یعنی Claude 4.6 Opus از شرکت Anthropic، صورت گرفت. این رقابت، تقابل دو استراتژی متفاوت در حوزه ایجنتهای هوش مصنوعی را نشان میدهد. مدل آنتروپیک با پنجره زمینه عظیم ۱ میلیون توکنی خود و تمرکز بر محیطهای سازمانی، به عنوان ابزاری قوی برای مدیریت پروژههای بزرگ و حتی کشف آسیبپذیریهای امنیتی (با کشف بیش از ۵۰۰ مورد Zero-Day) معرفی شده است.
«مدل Claude 4.6 Opus به کاربران اجازه میدهد وظایف بزرگ را به بخشهای کوچکتر تقسیم کرده و انجام هر کدام را به یک ایجنت بسپارند.»
در مقابل، مدل OpenAI با ظرفیت حافظه تقریبی ۴۰۰ هزار توکن، کنترل لحظهای، دقت بالاتر و سرعت بیشتر را در اولویت قرار داده است. این مدل برای توسعهدهندگانی طراحی شده که نیازمند تعامل دقیق و هدایت لحظهای بر کد در حال اجرا هستند، در حالی که Claude روی حجم داده و مدیریت پروژههای عظیم متمرکز است.
«GPT-5.3 Codex را از عاملی که صرفاً «کد مینویسد و بررسی میکند»، به ابزاری تبدیل میکند که میتواند «تقریباً هر کاری را که توسعهدهندگان و متخصصان با کامپیوتر انجام میدهند، برعهده بگیرد.»
به طور خلاصه، رقابت بین GPT-5.3 Codex و Claude 4.6 Opus نشاندهنده تکامل سریع هوش مصنوعی در عرصه برنامهنویسی و مهندسی نرمافزار است؛ جایی که اتوماسیون و قابلیتهای عاملمحور به سرعت در حال تبدیل شدن به استاندارد جدید صنعت هستند.


