Истражувачите ги оценуваат перформансите на ChatGPT во сумирањето на медицински апстракти

Во една неодамнешна студија објавена во The Annals of Family Medicine, истражувачите ја оценија ефикасноста на Chat Generative Pretrained Transformer (ChatGPT) во сумирањето на медицинските апстракти за да им помогнат на лекарите. Студијата имаше за цел да го утврди квалитетот, точноста и пристрасноста во резимеата генерирани од ChatGPT, обезбедувајќи увид во неговиот потенцијал како алатка за варење на огромни количини медицинска литература среде временските ограничувања со кои се соочуваат здравствените работници.

Високи оценки за квалитет и точност

Студијата го искористи ChatGPT за да кондензира 140 медицински апстракти од 14 различни списанија, намалувајќи ја содржината во просек за 70%. И покрај некои неточности и халуцинации откриени во мал дел од резимеата, лекарите високо ги оценија резимеата за квалитет и точност. Наодите сугерираат дека ChatGPT има потенцијал да им помогне на лекарите во ефикасно прегледување на медицинската литература, нудејќи концизни и точни резимеа среде огромниот обем на информации.

Истражувачите избраа 10 статии од секое од 14-те списанија кои покриваат различни медицински теми и структури. Тие му дадоа задача на ChatGPT да ги сумира овие написи и ги оценија генерираните резимеа за квалитет, точност, пристрасност и релевантност во десет медицински области. Студијата покажа дека ChatGPT успешно ги кондензира медицинските апстракти во просек за 70%, собирајќи високи оценки од рецензентите на лекарите за квалитет и точност.

Импликации за здравствената заштита

И покрај високите оценки, студијата идентификуваше сериозни неточности и халуцинации во мал број резимеа. Овие грешки се движеа од испуштени критични податоци до погрешни толкувања на дизајните на студијата, што потенцијално може да ја смени интерпретацијата на наодите од истражувањето. Сепак, перформансите на ChatGPT во сумирањето на медицинските апстракти се сметаа за сигурни, со минимална пристрасност.

Додека ChatGPT покажа силна усогласеност со човечките проценки на ниво на списание, неговите перформанси во прецизирањето на релевантноста на поединечните написи за одредени медицински специјалности беа помалку импресивни. Ова несовпаѓање го истакна ограничувањето во способноста на ChatGPT прецизно да ја идентификува релевантноста на еднина статии во поширокиот контекст на медицинските специјалности.

Студијата дава вредни сознанија за потенцијалот на вештачката интелигенција, особено ChatGPT, во помагањето на лекарите во ефикасното прегледување на медицинската литература. Додека ChatGPT ветува ветување за сумирање на медицински апстракти со висок квалитет и точност, потребни се дополнителни истражувања за да се решат ограничувањата и да се подобрат неговите перформанси во специфични медицински контексти.

Идните истражувања би можеле да се фокусираат на усовршување на способноста на ChatGPT да ја препознае релевантноста на поединечни статии за одредени медицински специјалности. Дополнително, напорите за ублажување на неточностите и халуцинациите во генерираните резимеа би можеле дополнително да ја подобрат корисноста на алатките за вештачка интелигенција во здравствените поставки.

Извор: https://www.cryptopolitan.com/chatgpt-in-summarizing-medical-abstracts/