هوش مصنوعی در بخش اورژانس دقت بیشتری نسبت به پزشکان متخصص دارد.

به نقل از منابع خبرگزاری‌ها، مدل زبانی بزرگ o1 شرکت OpenAI در زمینه تشخیص بیماری‌های پیچیده و خطرناک، به ویژه در مرحله پذیرش بیماران در اورژانس، عملکرد بهتری نسبت به پزشکان انسانی از خود نشان داد. این مدل هوش مصنوعی در شرایط با اطلاعات محدود، در حدود ۶۷ درصد مواقع، تشخیص صحیح یا تقریباً صحیح ارائه کرد، در حالی که نرخ موفقیت پزشکان بین ۵۰ تا ۵۵ درصد بود.

برای ارزیابی این مدل، پژوهشگران پنج نوع آزمون شامل تحلیل پروفایل‌های پزشکی و پیش‌بینی تغییرات سلامت را طراحی کردند. نتایج آزمون‌ها نشان داد که o1 در تمامی مراحل، عملکرد مشابه یا بهتری نسبت به پزشکان داشته است.

آدام رادمن، یکی از پژوهشگران ارشد این پژوهش، بیان کرد که در یک آزمایش خاص، این مدل موفق به کسب نمره کامل در ۹۸ درصد از موارد در زمینه استدلال بالینی شد، در حالی که پزشکان متخصص تنها در ۳۵ درصد موارد به این سطح دست‌یابی کردند.

بخش مهم این مطالعه، بررسی عملکرد مدل در سه مرحله از پذیرش بیمار در اورژانس بود. در این شرایط، پزشکان با فشار کاری بالایی مواجه هستند و اطلاعات ناقصی از بیماران دریافت می‌کنند که احتمال خطا را افزایش می‌دهد.

تیم تحقیقاتی از داده‌های واقعی بیماران استفاده کردند تا عملکرد مدل را در برابر اطلاعات “نامنظم و ناقص” ارزیابی کنند. نتایج نشان داد که حتی در این شرایط، هوش مصنوعی عملکردی ۱۰ درصد دقیق‌تر از پزشکان داشته است.

توماس باکلی، دانشمند علوم کامپیوتر در دانشگاه هاروارد، این مرحله را به عنوان حیاتی‌ترین بخش آزمایش توصیف کرد زیرا تمرکز اصلی آن بر روی داده‌های واقعی بود.

با وجود این دستاوردها، کارشناسان هشدار می‌دهند که این مدل هنوز برای جایگزینی کامل انسان آماده نیست. یکی از محدودیت‌های اصلی، ناتوانی آن در تحلیل داده‌های بلندمدت بیماران بستری است.

علاوه بر این، این مطالعه تنها بر روی متون نوشتاری متمرکز شده و ورودی‌های غیرمتنی مانند تصاویر رادیولوژی یا MRI که در تشخیص سرطان و لخته‌های خونی اهمیت دارند، در نظر گرفته نشده است.