پیشی گرفتن هوش مصنوعی از پزشکان محلی در تشخیصهای پزشکی
مطالعاتی در رواندا و پاکستان نشان میدهند که چتباتهای مبتنی بر هوش مصنوعی (LLM) در کلینیکهای کممنابع نه تنها مفید هستند، بلکه در برخی معیارها از پزشکان محلی نیز عملکرد بهتری دارند و بسیار مقرون به صرفهترند.
عملکرد چشمگیر مدلهای زبانی بزرگ در مراقبتهای بهداشتی
مطالعات اخیر منتشر شده در مجله نیچر نشاندهنده مزیتهای قابل توجه مدلهای زبانی بزرگ (LLM) در محیطهای پزشکی با منابع محدود هستند. این تحقیقها، فراتر از آزمایشهای کنترلشده، بررسی کردند که آیا چتباتهای مبتنی بر هوش مصنوعی میتوانند در عمل به پزشکان کمک کرده و شکافهای موجود در سیستمهای درمانی کمبرخوردار را پر کنند. نتایج به دست آمده در رواندا و پاکستان حاکی از پتانسیل عظیم این فناوری برای بهبود نرخ موفقیت تشخیصی است، تا جایی که در برخی مواقع از پزشکان محلی پیشی گرفتهاند.
در مطالعهای که در رواندا انجام شد، بهورزان جامعه بیش از ۵۶۰۰ پرسش بالینی را جمعآوری کردند و پاسخهای پنج مدل زبانی بزرگ با پاسخهای پزشکان محلی مقایسه شد. ارزیابیها بر اساس ۱۱ معیار مختلف، شامل درک پرسش و احتمال ایجاد آسیب، نشان داد که مدلهای LLM به طور کلی عملکرد بهتری نسبت به پزشکان محلی داشتند. یکی از مهمترین مزایای این مدلها، دسترسی ۲۴ ساعته و هزینه فوقالعاده پایین آنها است؛ هزینه پاسخدهی توسط LLM در حدود ۰.۰۰۴۴ دلار بود، در حالی که هزینه پاسخ پزشکان به طور متوسط چند دلار تعیین میشد. علاوه بر این، مدلها موفق به پاسخگویی به پرسشها به زبان ملی رواندا نیز شدند، که یک پیشرفت فرهنگی-عملی محسوب میگردد.
تفوق در افزایش دقت تشخیصی در پاکستان
مطالعهای دیگر در پاکستان بر افزایش دقت تشخیصی با استفاده از GPT-۴o متمرکز بود. پزشکان مجاز پس از دریافت آموزشهای لازم برای کار با این ابزارهای هوش مصنوعی، مورد آزمایش قرار گرفتند. گروهی که از GPT-۴o استفاده کردند، میانگین امتیاز دقت تشخیصی ۷۱ درصد کسب کردند، در حالی که گروهی که تنها به PubMed و جستجوی اینترنتی متکی بودند، به ۴۳ درصد رسیدند. این دادهها نشان میدهد که ادغام هوش مصنوعی میتواند به طور قابل توجهی خطای تشخیصی ناشی از کمبود متخصص و حجم بالای بیماران را کاهش دهد. حتی در مواردی، LLM به تنهایی بهتر از پزشکانی عمل کرد که از آنها کمک میگرفتند، هرچند که پزشکان در ۳۱ درصد موارد (معمولاً موارد با نشانههای هشداردهنده) عملکرد برتری داشتند.
- مدلهای LLM در رواندا در همه معیارهای ارزیابی از پزشکان محلی پیشی گرفتند.
- هزینه پاسخگویی LLM حدود ۵۰۰ برابر ارزانتر از پاسخ پزشکان محلی است.
- در پاکستان، استفاده از GPT-۴o دقت تشخیصی پزشکان را از ۴۳٪ به ۷۱٪ افزایش داد.
- این مدلها قابلیت پاسخگویی به زبانهای محلی را دارند.
- کارولین گرین از دانشگاه آکسفورد بر لزوم آموزش پزشکان برای استفاده صحیح از هوش مصنوعی تأکید کرده است.
احسان قاضی، دانشمند رایانه، معتقد است نتایج مطالعات پاکستان مسیرهای جدیدی برای ادغام ایمنتر و مؤثرتر هوش مصنوعی و مراقبتهای بهداشتی باز میکند.
کارولین گرین هشدار میدهد که نباید تصور کرد تمام مراقبتهای بهداشتی را مدلهای زبانی بزرگ میتوانند بر عهده بگیرند و نگرانیهایی مانند سوگیری و حفظ حریم دادههای بیماران باید مد نظر قرار گیرد.
این مطالعات به وضوح نقش پررنگ هوش مصنوعی را در آینده پزشکی، به ویژه در مناطقی که با کمبود منابع مواجه هستند، تبیین میکنند. با این حال، تعامل مؤثر میان تخصص انسانی و قدرت محاسباتی LLM برای تضمین ایمنی و اخلاق در مراقبتهای بهداشتی حیاتی است.



