Svenska forskare har i en ny studie utvärderat hur bra tre olika AI-algoritmer (AI=artificiell intelligens) är på att ställa bröstcancerdiagnoser. Forskarna undersökte algoritmernas förmåga att identifiera bröstcancer på tidigare tagna mammografibilder. De såg stora skillnader mellan AI-verktygens träffsäkerhet. Och att den bästa algoritmen var ungefär lika skicklig på att granska mammografibilder som en genomsnittlig röntgenläkare.
Den jämförande studien gjordes av forskare vid Karolinska institutet och Karolinska universitetssjukhuset. Den har publicerats i Jama oncology. Forskningen finansierades av Region Stockholm. Leverantörerna av de tre algoritmerna fick på begäran vara anonyma i studien men hade inget inflytande i övrigt över studien.
Flera AI-verktyg för bröstcancerdiagnoser
– Vi gjorde studien för att få veta hur långt utvecklingen av algoritmerna har nått, säger Fredrik Strand, forskare vid institutionen för onkologi-patologi på Karolinska institutet och röntgenläkare vid Karolinska universitetssjukhuset i ett pressmeddelande.
– Resultatet visar att den bästa algoritmen i princip är redo att användas och att det finns en betydlig skillnad mellan de olika algoritmerna på marknaden.
I dag finns ett stort antal leverantörer som utvecklar olika AI-lösningar för bildanalys i vården. Samtidigt pågår en livlig diskussion om vilken roll AI kan komma att spela inom screening och annan diagnostik i framtiden.
Enligt Fredrik Strand är den aktuella studien den första oberoende jämförelsen av flera AI-algoritmers träffsäkerhet. I studien användes mammografibilder från 8 805 kvinnor i åldrarna 40–74 år. Kvinnorna hade genomgått bröstcancerscreening med vanlig 2D- mammografi mellan 2008 och 2015. 739 kvinnor hade diagnostiserats med bröstcancer vid screeningtillfället eller upp till 12 månader efteråt. Övriga 8 066 kvinnor var kontrollgrupp.
En algoritm var bättre
Ett av verktygen var signifikant träffsäkrare än de andra två på att identifiera bilderna från de kvinnor som diagnostiserats med bröstcancer.
Forskarna har inte studerat vad som gjorde att det bästa verktyget var bäst. Men i sin diskussion i artikeln i Jama oncology framhåller de att den mest träffsäkra algoritmen hade ”tränats upp” med hjälp av betydligt mer data än de andra två.
AI-algoritmernas prestationer jämfördes även med resultatet av radiologernas granskning av mammografibilderna under screeningen. Enligt praxis gör två radiologer en oberoende granskning av varje mammografibild. Om någon av dem upptäcker en misstänkt tumör så går fallet vidare till en diskussion mellan två radiologer. Dessa avgör om kvinnan ska återkallas för ytterligare undersökning.
Den bästa av AI-algoritmerna var något bättre än radiologerna på att hitta cancerfallen. Denna algoritm hittade 81,9 procent av tumörerna medan radiologerna identifierade 77,4 respektive 80,1 procent. När det gäller förmågan att undvika falskt positiva svar, specificiteten, låg samtliga algoritmer samt radiologerna däremot på ungefär samma nivå.
Planerar ny studie
En annan studie av samma forskargrupp, nyligen publicerad i The Lancet Digital Health, visade att ett AI-verktyg även kan hjälpa till att sortera mammografibilder. Bland annat för att indikera vilka som kan behöva extra uppmärksamhet av en radiolog.
Nu går forskarna vidare för att undersöka hur AI kan bli en del av att förbättra dagens bröstcancerscreening.
– Vi planerar en prospektiv klinisk studie för att se hur AI kan fungera som självständig granskare av mammografier i den kliniska vardagen. Dels genom att agera som en tredje granskare, dels för att hjälpa till att välja ut de kvinnor som ska erbjudas en kompletterande magnetkameraundersökning med målet att upptäcka cancer tidigare, säger Fredrik Strand.