Az orvosokat is lekörözi az AI? Meglepő eredmények a bostoni sürgősségi osztályról -

A mesterséges intelligencia orvosi diagnosztikában betöltött szerepéről szóló viták új szintet léptek. A héten a Science folyóiratban megjelent tanulmány szerint az OpenAI legújabb modelljei bizonyos sürgősségi esetekben pontosabb diagnózist állítottak fel, mint a tapasztalt humán szakorvosok.

Harvardi kutatás a frontvonalban

A Harvard Medical School és a Beth Israel Deaconess Medical Center kutatói egyedülálló kísérletet végeztek: 76 valós, a bostoni sürgősségi osztályra érkező beteg adatait táplálták be az OpenAI o1 és GPT-4o modelljeibe.

A kísérlet különlegessége, hogy a kutatók semmilyen előfeldolgozást nem végeztek az adatokon; az AI pontosan azt az információhalmazt kapta meg, amely az elektronikus egészségügyi nyilvántartásban a diagnózis pillanatában rendelkezésre állt.

Az o1 modell diadala a triázs során

A kutatás során az AI teljesítményét két ügyeletes szakorvoséval vetették össze. Az eredményeket egy független orvosi panel értékelte „vakteszt” keretében, tehát nem tudták, melyik diagnózis származik embertől és melyik géptől.

Az eredmények magukért beszélnek, különösen a kritikus triázs (betegosztályozás) szakaszában:

Diagnosztikai pontosság	Eredmény (%)
OpenAI o1 modell	67%
1. számú szakorvos	55%
2. számú szakorvos	50%

A kutatók kiemelték, hogy az o1 modell akkor teljesített a legjobban, amikor a legkevesebb információ állt rendelkezésre, és a legnagyobb volt a sürgősség a döntéshozatalhoz.

Miért teljesített jobban a gép?

Arjun Manrai, a Harvard Medical School AI-laboratóriumának vezetője szerint az o1 modell minden eddigi benchmarkot és orvosi alapértéket felülmúlt. A siker kulcsa az o1 továbbfejlesztett érvelési képességeiben rejlik, amely szisztematikusabban képes átlátni az összefüggéseket a töredékes adatok között.

Korlátok és a felelősség kérdése

Bár az eredmények lenyűgözőek, a kutatók óvatosságra intenek. A tanulmány több fontos korlátot is megnevez:

Csak szöveges adatok: A modellek jelenleg a szöveges leleteken alapuló érvelésben erősek, a vizuális diagnosztikában (pl. röntgen, ultrahang) vagy a nem szöveges bemenetek feldolgozásában még korlátozottabbak.
Nincs elszámoltathatóság: Adam Rodman, a kutatás egyik vezetője hangsúlyozta, hogy jelenleg nincs jogi keretrendszer az AI által felállított diagnózisok felelősségére.
Emberi tényező: A páciensek továbbra is igénylik a humán jelenlétet az élet-halál kérdésekben és a komplex kezelési döntések meghozatalakor.

A jövő: AI-asszisztált gyógyítás

A tanulmány nem azt állítja, hogy az AI készen áll az orvosok leváltására a sürgősségin. Ehelyett rámutat arra a sürgető igényre, hogy klinikai tesztek keretében vizsgálják meg, hogyan integrálható ez a technológia biztonságosan a valódi betegellátásba. Az AI a jövőben egyfajta „szuper-asszisztensként” segítheti az orvosokat a gyorsabb és pontosabb döntéshozatalban, csökkentve a diagnosztikai tévedések számát.

forrás: harvard.edu, science.org