A GPT-4o az esetek 93%-ában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21%-ában ismerte fel a kórképeket, derül ki az egyetem új klinikai kutatásából. A MI hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, de a végleges diagnózis felállítása szakorvosi feladat marad, hangsúlyozzák a szerzők.
A vizsgálat során a két mesterségesintelligencia-modellnek olyan betegek fotóit mutatták meg, akiknél szakorvosi diagnózis igazolta az akne vagy a rosacea meglétét. A képeket ezt megelőzően két bőrgyógyász értékelte ki egymástól függetlenül, egy harmadik szakértő bevonásával, aki eltérő diagnózis esetén döntött. A végső diagnózist többségi vélemény alapján állapították meg.
„Az akne és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak”
– hangsúlyozza dr. Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.
A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük. A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója.
A GPT-4o 100%-ban adott betegségmeghatározást; 93%-os pontossággal azonosította be a kórképeket.
Akne esetében 91%-os, rosaceánál 100%-os találati arányt ért el, más betegségeket szinte soha nem kevert össze ezekkel. Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek az akne altípusait 55%-ban, a rosacea altípusait pedig 50%-ban találta el helyesen.
Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.
„Az olyan, mindenki számára elérhető MI-eszközök, mint a ChatGPT, egyre nagyobb szerephez jutnak a bőrgyógyászati önellenőrzésben, sőt hatással vannak arra is, hogy valaki orvoshoz fordul-e, vagy sem”
– mondja dr. Mehdi Boostani, a Semmelweis Egyetem PhD-hallgatója, a tanulmány első szerzője. Bár az általunk tesztelt modell kiválóan szerepelt az alapdiagnózis felállításában, az egyes betegségaltípusok megállapításában már kevésbé volt hatékony” – teszi hozzá.
Ezért fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést.
„A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad”
– emeli ki dr. Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.