اختبر الباحثون نموذج الذكاء الاصطناعي ضد أطباء الطوارئ ووجدوا أن النموذج تفوق على البشر.
شيبشارج / إي + / جيتي إيماجيس
إخفاء التسمية التوضيحية
تبديل التسمية التوضيحية
شيبشارج / إي + / جيتي إيماجيس
يظهر مريض في المستشفى مصابًا بانسداد رئوي – جلطة دموية انتقلت إلى الرئتين. وبعد التحسن الأولي، تبدأ الأعراض في التفاقم. يشتبه الفريق الطبي في أن الدواء لا يعمل.
في خطوات الذكاء الاصطناعي – بنظريته الخاصة.
لقد قام بفحص السجلات الطبية ويشتبه في أن وجود تاريخ من مرض الذئبة، وهي حالة من أمراض المناعة الذاتية يمكن أن تؤدي إلى التهاب القلب، يمكن أن يفسر سبب مرض المريض حقًا.
وتبين أن نموذج الذكاء الاصطناعي صحيح.
ووفقا لدراسة، فإن هذا النوع من السيناريوهات يمكن أن يصبح حقيقة في المستقبل غير البعيد نشرت الخميس في المجلة علوم.
وجد الباحثون المقيمون في كلية الطب بجامعة هارفارد ومركز بيث إسرائيل ديكونيس الطبي أن نموذج الاستدلال للذكاء الاصطناعي، الذي طورته شركة OpenAI، تفوق في تشخيص المرضى واتخاذ القرارات بشأن إدارة رعايتهم. لقد طابق الأطباء وتفوق في كثير من الأحيان على نموذج الذكاء الاصطناعي السابق، GPT-4.
أجرى الباحثون سلسلة من التجارب على نموذج الذكاء الاصطناعي لاختبار فطنته السريرية، بما في ذلك الحالات الفعلية مثل مريض الذئبة الذي عولج سابقًا في قسم الطوارئ في بيث إسرائيل في بوسطن.
قام الفريق بتقييم مدى قدرة نموذج الذكاء الاصطناعي على توفير تشخيص دقيق في ثلاث لحظات زمنية، بدءًا من مرحلة الفرز في غرفة الطوارئ وحتى دخول المستشفى.
بشكل عام، تفوق الذكاء الاصطناعي في الأداء على طبيبين من ذوي الخبرة، وقد فعل ذلك باستخدام السجلات الصحية الإلكترونية والمعلومات المحدودة التي كانت متاحة للأطباء في ذلك الوقت فقط.
قال: “هذا هو الاستنتاج الكبير بالنسبة لي – إنه يعمل مع بيانات العالم الحقيقي الفوضوية لقسم الطوارئ”. دكتور آدم رودمان، باحث سريري في بيت إسرائيل وأحد مؤلفي الدراسة. “إنه يعمل على إجراء التشخيص في العالم الحقيقي.”
اعتمدت أجزاء أخرى من الدراسة على تقارير حالة صعبة نشرت في مجلة نيو انغلاند جورنال اوف ميديسين ومقالات إكلينيكية لمعرفة ما إذا كان نموذج الذكاء الاصطناعي قادرًا على تلبية “المعايير” الراسخة والإجابة على الأسئلة التشخيصية الشائكة.
وقال “لقد تفوق النموذج على خط الأساس الطبي الكبير لدينا”. راج مانراي، أستاذ مساعد للمعلوماتية الطبية الحيوية في كلية الطب بجامعة هارفارد والذي كان أيضًا جزءًا من الدراسة.
يؤكد المؤلفون على أن البحث يعتمد على النص وحده، بينما في الحياة الواقعية، يحتاج الأطباء إلى الاهتمام بالعديد من المدخلات الأخرى مثل الصور والأصوات والإشارات غير اللفظية عند تشخيص المريض وعلاجه.
ومع ذلك، فإن هذا العمل يوضح مدى تقدم التكنولوجيا في السنوات القليلة الماضية. الأجيال السابقة من اللغة الكبيرة تعثرت النماذج عند التعامل مع حالة عدم اليقين، وعند إنشاء قائمة بالحالات الممكن فحصها، وهو ما يعرف بالتشخيص التفريقي.
يقول الدكتور: “هذه الورقة هي ملخص جميل لمدى تحسن الأمور”. ديفيد رايش، كبير المسؤولين السريريين في نظام ماونت سيناي الصحي في نيويورك، والذي لم يشارك في العمل.
يقول: “لديك شيء دقيق تمامًا، وربما يكون جاهزًا للاستخدام في أوقات الذروة”. “والسؤال المطروح الآن هو كيف يمكنك إدخاله في سير العمل السريري بطرق تعمل بالفعل على تحسين الرعاية؟”
بعد كل شيء، فإن الوصول إلى تشخيص نهائي وصعب – وهو ما يتألق فيه نموذج الذكاء الاصطناعي – لا يعكس بالضرورة كيفية سير الأمور “في الطب السريري الحقيقي”، كما يقول رايش، حيث “تكون النتائج أكثر دقة وربما أكثر تنوعًا”.
ولا يمثل قسم الطوارئ سوى جزء صغير من إجمالي الرعاية الطبية للمريض. يعترف رودمان أنه من غير المحتمل أن يقوم الذكاء الاصطناعي بمثل هذا العمل “المثير للإعجاب” لو أن الفريق زوده بسجلات شخص قضى شهرًا في المستشفى.
لا يعتقد أي من المشاركين في الدراسة الجديدة أن النتائج تدعم استبدال الأطباء بالذكاء الاصطناعي، “على الرغم مما من المحتمل أن تقوله بعض الشركات وكيف من المحتمل أن تستخدم هذه النتائج”، كما يقول مانراي.
ويضيف: “أعتقد أن هذا يعني أننا نشهد تغيرًا عميقًا حقًا في التكنولوجيا من شأنه أن يعيد تشكيل الطب”.
لكن النتائج تشير إلى ضرورة اختبار نماذج الذكاء الاصطناعي بطريقة صارمة، ومن الأفضل من خلال تجارب تطلعية يمكن أن تعطي المزيد من اليقين حول كيفية تأثير التكنولوجيا في نهاية المطاف على الممارسة السريرية.
يقول رايخ: “إن تصميم هذه التجارب عملية صعبة للغاية، لكن هذه الدراسة هي دعوة مثالية للعمل”.














