نوآوریهای مدلهای هوش مصنوعی فراتر از ترنسفورمرها و کاربرد آن در حوزه حقوق
مصاحبه با مدیران Pathway درباره مدلهای پسا-ترنسفورمر مبتنی بر یادگیری مداوم و همچنین Mary Technology درباره کاربرد هوش مصنوعی در مدیریت شواهد حقوقی، به ویژه تمرکز بر حل مشکل حافظه و دقت.
معماریهای نوین هوش مصنوعی: فراتر از ترنسفورمرها
این محتوا به بررسی دو نوآوری مهم در حوزه هوش مصنوعی میپردازد: توسعه مدلهای فرانتیر پس از ترنسفورمرها توسط Pathway و کاربرد مدلهای زبانی بزرگ (LLMs) در مدیریت اسناد حقوقی توسط Mary Technology. تمرکز اصلی Pathway بر حل مشکلات اساسی مدلهای فعلی، به ویژه محدودیت طول توجه (attention span) و فقدان یادگیری مداوم (continual learning) است. آنها در حال ساخت اولین مدل فرانتیر پس از ترنسفورمر هستند که عملکردی شبیه به مغز انسان دارد، جایی که نورونها و سیناپسها نقش کلیدی در ایجاد حافظه ذاتی (intrinsic memory) ایفا میکنند. این رویکرد جدید به جای تکیه بر «قدرت خام محاسباتی» و بزرگتر کردن ترنسفورمرها، بر اساس اصول اولیه هوش و با الهام از ساختار مغز شکل گرفته است. این معماری نه تنها از نظر محاسباتی کارآمدتر است، بلکه وعده استدلال بلندمدت و تعمیمپذیری بهتر از داده کم را میدهد.
مزایای مدلهای پساترنسفورمر
مدلهای جدید Pathway با تمرکز بر ساختاردهی شبیه به شبکههای عصبی واقعی (با سیناپسها و یادگیری هاگلر محلی)، مزایای قابل توجهی نسبت به ترنسفورمرهای سنتی دارند. این مزایا شامل موارد زیر است:
- حافظه ذاتی و طول توجه نامحدود: برخلاف محدودیتهای پنجره زمینه (context window) در LLMهای فعلی، حافظه این مدلها به سیناپسها متصل است و به طور بالقوه نامحدود است. این امر احتمال توهمزایی (hallucination) را به شدت کاهش میدهد، زیرا مدل میتواند برای مدت طولانیتری بر روی یک وظیفه متمرکز بماند.
- کارایی محاسباتی بالا: به دلیل محاسبات توزیعشده محلی، این مدلها بسیار کارآمدتر هستند.
- قابلیت مشاهده (Observability): معمار سیناپسی امکان بازرسی و مشاهده نحوه عملکرد داخلی مدل را فراهم میکند، که این یک مزیت بزرگ در صنایع نظارتشده مانند حقوق و امور مالی است، زیرا مدلهای ترنسفورمر عموماً «جعبه سیاه» هستند.
- تعمیمپذیری از دادههای کم: مدلها تمایل دارند از «تطابق الگو» فراتر رفته و از دادههای کم یا یکباره (مانند «یکبار مزه کردن صابون» برای یادگیری یک مفهوم) تعمیم یابند، که برای کاربردهای سازمانی حیاتی است.
"ما مدل را به عنوان یک سیستم فیزیکی با فعالسازیهای محلی میبینیم. این فعل و انفعالات محلی مزایای زیادی از جمله کارایی محاسباتی فوقالعاده به همراه دارد، زیرا ما ماتریسهای عظیم را فعال نمیکنیم، بلکه مستقیماً بر اساس اصول محاسبات توزیعشده عمل میکنیم."
کاربرد هوش مصنوعی در حوزه حقوق با Mary Technology
در بخش دوم، Mary Technology راهکارهای خود را برای وکلا معرفی میکند که با چالشهای مدیریت حجم عظیمی از شواهد و اسناد حقوقی سروکار دارند. این شرکت از LLMها برای ایجاد یک «لایه واقعیت (fact layer)» استفاده میکند. برخلاف رویکردهای سنتی که صرفاً اسناد را برداری (vectorize) میکنند، Mary Technology تمامی حقایق، چه مرتبط و چه نامرتبط، را استخراج کرده و ذخیره میکند.
- استخراج دقیق و عینی حقایق: هدف این است که هر رویداد یا ادعای موجود در شواهد استخراج شود، بدون اینکه تفسیر حقوقی ارائه گردد. این امر شامل استفاده از تکنیکهایی برای اطمینان از عدم وجود توهمزایی با مقایسه مداوم با منبع اصلی است.
- ابزارهای اطمینان (Confidence Tooling): برای مقابله با کاهش اعتماد کاربران به هوش مصنوعی، ابزارهایی مانند «تاریخهای استنباطی» و «توجیه ارتباط (Relevance Rationale)» ارائه میشود که توضیح میدهند چرا یک واقعیت خاص مرتبط یا نامرتبط تلقی شده است و امکان بازگشت سریع به منبع اصلی را فراهم میکنند.
- مدیریت حاکمیت داده: استفاده از مدلهای خصوصی سازمانی و رعایت حاکمیت داده (Data Sovereignty) برای اطمینان از امنیت اطلاعات حساس مشتریان در حوزههای قضایی مختلف بسیار مهم است، و این شرکت در تولید دادههای مصنوعی (synthetic data) برای آموزش مدلها بدون نقض حریم خصوصی، تخصص دارد.
"ما تلاش میکنیم با ارائه ابزارهای اطمینان، مانند ارائه دلایل برای درجهبندی ارتباط یک واقعیت، به وکلا اطمینان دهیم. البته همواره تأکید میکنیم که مسئولیت نهایی بررسی و تفسیر حقوقی بر عهده خود وکیل است."
این دو مصاحبه نشاندهنده یک تغییر بنیادین در مهندسی مدلهای هوش مصنوعی از رویکردهای مقیاسپذیری صرف ترنسفورمر به سمت معماریهای الهامگرفته از زیستشناسی و تمرکز بر قابلیتهای استدلالی و حافظهای پایدار هستند که میتواند کاربردهای عملی و قابل اعتمادی در صنایع پیچیده ایجاد کند.



