به نقل از منابع خبرگزاریها، مدل زبانی بزرگ o1 شرکت OpenAI در زمینه تشخیص بیماریهای پیچیده و خطرناک، به ویژه در مرحله پذیرش بیماران در اورژانس، عملکرد بهتری نسبت به پزشکان انسانی از خود نشان داد. این مدل هوش مصنوعی در شرایط با اطلاعات محدود، در حدود ۶۷ درصد مواقع، تشخیص صحیح یا تقریباً صحیح ارائه کرد، در حالی که نرخ موفقیت پزشکان بین ۵۰ تا ۵۵ درصد بود.
برای ارزیابی این مدل، پژوهشگران پنج نوع آزمون شامل تحلیل پروفایلهای پزشکی و پیشبینی تغییرات سلامت را طراحی کردند. نتایج آزمونها نشان داد که o1 در تمامی مراحل، عملکرد مشابه یا بهتری نسبت به پزشکان داشته است.
آدام رادمن، یکی از پژوهشگران ارشد این پژوهش، بیان کرد که در یک آزمایش خاص، این مدل موفق به کسب نمره کامل در ۹۸ درصد از موارد در زمینه استدلال بالینی شد، در حالی که پزشکان متخصص تنها در ۳۵ درصد موارد به این سطح دستیابی کردند.
بخش مهم این مطالعه، بررسی عملکرد مدل در سه مرحله از پذیرش بیمار در اورژانس بود. در این شرایط، پزشکان با فشار کاری بالایی مواجه هستند و اطلاعات ناقصی از بیماران دریافت میکنند که احتمال خطا را افزایش میدهد.
تیم تحقیقاتی از دادههای واقعی بیماران استفاده کردند تا عملکرد مدل را در برابر اطلاعات “نامنظم و ناقص” ارزیابی کنند. نتایج نشان داد که حتی در این شرایط، هوش مصنوعی عملکردی ۱۰ درصد دقیقتر از پزشکان داشته است.
توماس باکلی، دانشمند علوم کامپیوتر در دانشگاه هاروارد، این مرحله را به عنوان حیاتیترین بخش آزمایش توصیف کرد زیرا تمرکز اصلی آن بر روی دادههای واقعی بود.
با وجود این دستاوردها، کارشناسان هشدار میدهند که این مدل هنوز برای جایگزینی کامل انسان آماده نیست. یکی از محدودیتهای اصلی، ناتوانی آن در تحلیل دادههای بلندمدت بیماران بستری است.
علاوه بر این، این مطالعه تنها بر روی متون نوشتاری متمرکز شده و ورودیهای غیرمتنی مانند تصاویر رادیولوژی یا MRI که در تشخیص سرطان و لختههای خونی اهمیت دارند، در نظر گرفته نشده است.










