Semmelweis Egyetem: a ChatGPT szinte hibátlanul felismeri a leggyakoribb bőrproblémákat

//Tóth Gábor
mestersegesintelligenciaorvos_freepik_phonlamaistudio_250414

Képünk illusztráció. forrás: freepik / phonlamaistudio

Bőrbetegségek felismerésében tesztelték a két legismertebb mesterségesintelligencia-alkalmazást a Semmelweis Egyetem kutatói.

A GPT-4o az esetek 93%-ában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21%-ában ismerte fel a kórképeket, derül ki az egyetem új klinikai kutatásából. A MI hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, de a végleges diagnózis felállítása szakorvosi feladat marad, hangsúlyozzák a szerzők.

A vizsgálat során a két mesterségesintelligencia-modellnek olyan betegek fotóit mutatták meg, akiknél szakorvosi diagnózis igazolta az akne vagy a rosacea meglétét. A képeket ezt megelőzően két bőrgyógyász értékelte ki egymástól függetlenül, egy harmadik szakértő bevonásával, aki eltérő diagnózis esetén döntött. A végső diagnózist többségi vélemény alapján állapították meg.

„Az akne és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak”

– hangsúlyozza dr. Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.

A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük. A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója.

A GPT-4o 100%-ban adott betegségmeghatározást; 93%-os pontossággal azonosította be a kórképeket.

Akne esetében 91%-os, rosaceánál 100%-os találati arányt ért el, más betegségeket szinte soha nem kevert össze ezekkel. Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek az akne altípusait 55%-ban, a rosacea altípusait pedig 50%-ban találta el helyesen.

Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.

„Az olyan, mindenki számára elérhető MI-eszközök, mint a ChatGPT, egyre nagyobb szerephez jutnak a bőrgyógyászati önellenőrzésben, sőt hatással vannak arra is, hogy valaki orvoshoz fordul-e, vagy sem

– mondja dr. Mehdi Boostani, a Semmelweis Egyetem PhD-hallgatója, a tanulmány első szerzője. Bár az általunk tesztelt modell kiválóan szerepelt az alapdiagnózis felállításában, az egyes betegségaltípusok megállapításában már kevésbé volt hatékony” – teszi hozzá.

Ezért fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést.

„A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad”

– emeli ki dr. Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.

(Semmelweis Egyetem)