Artifical intelligence models to diagnose diabetic retinopathy. Part1
Prof. dr hab. n. med. AndrzejGrzybowski
Kierownik Katedry Okulistyki, Uniwersytet Warmińsko-Mazurski, Olsztyn Kierownik Instytutu Okulistycznych Badań Naukowych, Fundacja Okulistyka 21, Poznań
Streszczenie
Retinopatia cukrzycowa (DR) to jedno z najczęstszych powikłań cukrzycy, prowadzące do utraty wzroku. W związku z rosnącą liczbą chorych na cukrzycę na świecie potrzeba skutecznych i szeroko dostępnych metod diagnostycznych staje się coraz pilniejsza. Tradycyjna diagnostyka DR opiera się na badaniu okulistycznym i fotografii dna oka, jednak rozwój telemedycyny i sztucznej inteligencji (AI) znacząco zmienia ten krajobraz. Systemy oparte na AI, a szczególnie techniki głębokiego uczenia (deep learning), pozwalają na automatyczne wykrywanie zmian w siatkówce charakterystycznych dla DR. Przełomem było zatwierdzenie przez FDA systemu IDx-DR (obecnie LumineticsCore™), który jako pierwszy autonomiczny system wykazuje wysoką czułość i swoistość bez udziału lekarza. Badania wykazują, że systemy te potrafią osiągać czułość na poziomie 87–96% i swoistość 84– 91%, choć wyniki zależą od przyjętej klasyfikacji zmian (np. ICDR). W przeszłości rozwój AI w DR był ograniczony przez niską jakość danych, ale współczesne sieci neuronowe pozwalają uzyskiwać bardzo wysoką skuteczność diagnostyczną. Wdrożenie takich rozwiązań w praktyce klinicznej może znacząco usprawnić przesiewowe wykrywanie DR, szczególnie w obszarach z ograniczonym dostępem do okulistów, jednak wymaga odpowiedniego zaplecza technologicznego i przeszkolenia personelu.
Słowa kluczowe: retinopatia cukrzycowa, sztuczna inteligencja, głębokie uczenie, diagnostyka obrazowa, IDx-DR, telemedycyna, sieci neuronowe, klasyfikacja ICDR, przesiewowe badania okulistyczne, analiza obrazów dna oka
Abstract
Diabetic retinopathy (DR) is one of the most common complications of diabetes and a leading cause of vision loss. With the global rise in diabetes cases, the need for effective and widely accessible diagnostic methods is becoming increasingly urgent. Traditional DR diagnosis relies on ophthalmologic examination and retinal imaging, but the development of telemedicine and artificial intelligence (AI) is transforming this landscape. AI-based systems—particularly those using deep learning—enable automated detection of retinal changes characteristic of DR. A major breakthrough was the FDA approval of the IDx-DR system (now LumineticsCore™), the first autonomous diagnostic system demonstrating high sensitivity and specificity without physician involvement. Studies show these systems can achieve sensitivity levels of 87–96% and specificity of 84–91%, although results vary depending on the classification criteria used (e.g., ICDR). Earlier AI models were limited by poor data quality, but modern neural networks allow for highly accurate diagnostic performance. Implementing such solutions in clinical practice could significantly improve DR screening, especially in underserved areas, though it requires proper technological infrastructure and trained personnel.
Key words: diabetic retinopathy, artificial intelligence, deep learning, image-based diagnosis, IDx-DR, telemedicine, neural networks, ICDR classification, ophthalmic screening, fundus image analysis
Globalne znaczenie retinopatii cukrzycowej
Retinopatia cukrzycowa (DR, diabeticretinopathy) to jedno z najpoważniejszych powikłań cukrzycy, prowadzące do uszkodzenia naczyń krwionośnych siatkówki, co w skrajnych przypadkach może skutkować utratą wzroku, jeśli choroba nie zostanie wcześnie wykryta i leczona. Wraz z rosnącą liczbą osób chorujących na cukrzycę na całym świecie DR staje się istotnym wyzwaniem dla systemów opieki zdrowotnej. Szacuje się, że do 2035 r. liczba chorych na cukrzycę może osiągnąć 592 mln, co przełoży się na wzrost zachorowań na retinopatię cukrzycową. Retinopatia cukrzycowa odpowiada za 4,8% przypadków ślepoty na świecie, dlatego wczesne rozpoznanie tej choroby ma kluczowe znaczenie w zapobieganiu jej poważnym konsekwencjom.
Epidemiologia retinopatii cukrzycowej
Częstość występowania DR różni się w zależności od regionu i od typu cukrzycy. U pacjentów z cukrzycą typu 1 ryzyko rozwoju DR jest wyższe niż u osób z cukrzycą typu 2, co wynika z dłuższego czasu trwania choroby. W krajach rozwiniętych, takich jak USA, Wielka Brytania czy Australia, odsetek pacjentów z DR wynosi od 28,5% do 40%. W krajach rozwijających się, gdzie dostęp do opieki medycznej jest ograniczony, wskaźniki te mogą być jeszcze wyższe.
Metody diagnostyczne w retinopatii cukrzycowej
Tradycyjne metody diagnozowania DR obejmują badanie dna oka przy użyciu oftalmoskopii bezpośredniej lub pośredniej oraz cyfrową fotografię siatkówki. W niektórych krajach, takich jak Wielka Brytania, Singapur czy Irlandia, wprowadzono programy przesiewowe, które polegają na regularnym badaniu siatkówki u wszystkich pacjentów z cukrzycą. Programy te okazały się skuteczne w redukcji liczby przypadków ślepoty spowodowanej retinopatią cukrzycową.
Rola telemedycyny
Telemedycyna odgrywa coraz większą rolę w diagnostyce i leczeniu retinopatii cukrzycowej, szczególnie w regionach o ograniczonym dostępie do specjalistycznej opieki okulistycznej. W systemach telemedycznych obrazy siatkówki są przesyłane do ośrodków referencyjnych, gdzie są analizowane przez ekspertów. Wprowadzenie tych rozwiązań przyczyniło się do zwiększenia dostępności badań przesiewowych oraz zmniejszenia liczby nieleczonych przypadków DR.
Zastosowanie sztucznej inteligencji w diagnostyce retinopatii cukrzycowej
Sztuczna inteligencja (AI, artifical inteligence) zaczyna odgrywać kluczową rolę w automatyzacji procesu diagnostycznego DR [1]. Algorytmy oparte na głębokim uczeniu, takie jak głębokie sieci neuronowe (DNN, deep neural network), są w stanie analizować obrazy siatkówki i wykrywać charakterystyczne zmiany związane z DR. Algorytmy te są trenowane na dużych zbiorach danych, co pozwala na osiągnięcie wysokiej dokładności diagnostycznej. Przykładem jest system IDx-DR, który jako pierwszy został zatwierdzony przez FDA do stosowania w praktyce klinicznej bez konieczności potwierdzenia rozpoznania przez lekarza.
Pomysł wykorzystania programu komputerowego do analizy obrazów dna oka w kierunku retinopatii cukrzycowej nie jest nowy. Pierwszy raport na ten temat został opublikowany w 1996 r. przez Gardnera i wsp. Prawie 30 lat temu autorzy stworzyli sieć neuronową, która została przeszkolona na 147 obrazach dna oka pacjentów z cukrzycą i 32 obrazach oka osób zdrowych. Celem było nauczenie sieci rozpoznawania konkretnych cech, takich jak naczynia krwionośne, krwotoki i wysięki. Ze względu na ograniczenia techniczne, w tym moc obliczeniową, każdy obraz został podzielony na małe kwadraty o szerokości 20 lub 30 pikseli, a następnie oceniony przez okulistę pod kątem obecności naczyń, wysięków, krwotoków, mikrotętniaków lub prawidłowej siatkówki bez naczyń [2]. Kolejne badanie, z 2000 r. opisuje technikę mieszaną, w której algorytmy zaprojektowane do wzmacniania okrągłych cech na obrazie zostały wykorzystane do identyfikacji mikrotętniaków na obrazie dna oka. Następnie sieć neuronowa oceniała znaczenie wyodrębnionych cech. Ta metoda pozwoliła na wykrycie mikrotętniaków z rozsądną skutecznością (81%) w porównaniu z opinią kliniczną [3].
W pierwszych latach XXI w. przeprowadzono kilka badań na ten temat, bez użycia sieci neuronowych, opierając się na różnych technikach analizy obrazu, takich jak automatyczne wykrywanie anatomicznych punktów orientacyjnych na obrazach dna oka (tarcza nerwu wzrokowego, naczynia krwionośne, plamka żółta itp.) w połączeniu ze specjalnie zaprojektowanymi algorytmami do wykrywania cech DR. Wśród nich opublikowano pierwsze trzy raporty dotyczące systemu, później znanego jako Retinalyze, który wykazywał względnie dobrą czułość na poziomie 71–93% i specyficzność 72–86%. Badania te opierały się jednak na małych próbach, z największą liczbą 137 pacjentów [4, 5]. Wszystkie te badania przeprowadzono w erze przed cyfryzacją, co oznacza, że obrazy w formie slajdów, wykonane za pomocą kamery dna oka, musiały być ręcznie skanowane przy użyciu czytnika slajdów lub skanera, aby uzyskać cyfrową wersję obrazu. Proces był czasochłonny, wymagał specjalistycznego sprzętu, a dodatkowe etapy przetwarzania mogły wprowadzać artefakty i powodować utratę jakości obrazu. Brak scentralizowanych baz danych i cyfrowego przechowywania obrazów dna oka sprawiał, że zdobycie obrazów do treningu i weryfikacji było trudne. W konsekwencji większość badań opierała się na niewielkiej liczbie obrazów w porównaniu ze współczesnymi modelami, które wykorzystują dziesiątki tysięcy obrazów do ustanowienia i walidacji systemu.
Mimo że w tamtym czasie automatyczne badania przesiewowe były poważnie ograniczone pod względem technicznym, wielu specjalistów już wtedy próbowało opracować odpowiednie metody przesiewowe, dostrzegając potencjał nowych technologii w uzupełnianiu lub zastępowaniu oceny dokonywanej przez ludzi.
Algorytmy głębokiego uczenia
W kolejnych latach, wraz z postępem cyfryzacji, pojawiły się nowe sposoby podejścia do automatycznej analizy obrazów. Do lat 2010. eksperci projektowali algorytmy do wykrywania konkretnych cech DR, takich jak mikrotętniaki czy krwotoki. W głębokim uczeniu oprogramowanie otrzymuje cały obraz dna oka wraz z określonym wynikiem. W trakcie analizy wielu takich obrazów, często tysięcy, system uczy się rozróżniać obrazy z różnymi wynikami. To, co odróżnia jeden wynik od drugiego, nie musi być wyraźnie określone przez projektantów. Wprowadzenie technik głębokiego uczenia do wykrywania DR przyniosło znaczącą poprawę dokładności nowo opracowanych lub ulepszonych systemów.
Abramoff i wsp. opisali, jak wprowadzenie technik głębokiego uczenia znacząco poprawiło działanie już istniejącego, klasycznie zaprojektowanego oprogramowania do automatycznego wykrywania DR – Iowa Detection Program. Na podstawie publicznie dostępnego zbioru obrazów dna oka z DR i bez DR – zestawu danych Messidor-2 – czułość wzrosła z 94,4% do 96,8%, a specyficzność z przedziału ufności 55,7–63% do 87% [6)]. W przypadku Iowa Detection Program funkcje głębokiego uczenia dodano do już istniejących algorytmów.
Wiele innych inicjatyw próbowało stworzyć całkowicie nowe oprogramowanie do wykrywania DR oparte na głębokim uczeniu. Poniżej opisano kilka znaczących inicjatyw związanych z wykrywaniem retinopatii cukrzycowej opartym na sztucznej inteligencji.
IDx-DR (obecnie LumineticsCore™, Digital Diagnostics)
IDx-DR to kompleksowe rozwiązanie do przesiewowego badania DR, które łączy wspomniany algorytm przesiewowy z systemem oceny jakości obrazu i informacji zwrotnej. Przesyłanie obrazów odbywa się za pomocą klienta IDx-DR, który jest samodzielnym oprogramowaniem. Klient IDx zawiera system ponownego przesyłania obrazów uznanych za obrazy zbyt niskiej jakości. Próg wyniku pozytywnego został ustalony jako „więcej niż łagodna” retinopatia cukrzycowa według skali ICDR lub oznaki cukrzycowego obrzęku plamki. IDx-DR oferuje dodatkowy poziom wyniku wskazujący na zagrożenie wzroku, co sugeruje bardziej zaawansowaną, możliwą proliferacyjną DR. Badanie przesiewowe opiera się na 4 obrazach dna oka na pacjenta, po 2 z każdego oka – jeden skoncentrowany na plamce, a drugi na tarczy nerwu wzrokowego. Wszystkie obrazy muszą zostać przesłane, aby uzyskać wynik. Algorytm radzi sobie z pewną utratą jakości, wykorzystując nakładanie się dwóch pól obrazu. Chociaż użytkownik widzi wynik przesiewowy w jednej z 4 kategorii – brak DR, DR powyżej łagodnej, DR zagrażająca wzrokowi i niewystarczająca jakość – w tle IDx-DR generuje wartość liczbową reprezentującą prawdopodobieństwo wystąpienia DR powyżej łagodnej. Obecnie system używa zdefiniowanych progów, aby zaklasyfikować pacjenta do odpowiedniej kategorii. Teoretycznie oznacza to, że wynik IDx-DR można dostosować, aby zmaksymalizować czułość lub specyficzność w zależności od potrzeb danego programu przesiewowego.
IDx-DR to pierwsze autonomiczne oprogramowanie diagnostyczne i jedno z pierwszych opartych na sztucznej inteligencji w medycynie, które otrzymało zatwierdzenie amerykańskiej Agencji Żywności i Leków (FDA). W kluczowym badaniu oprogramowanie IDx-DR zostało przetestowane w warunkach rzeczywistych. Prawie 900 pacjentów zostało przebadanych przy użyciu IDx-DR w połączeniu z automatyczną kamerą dna oka Topcon NW-400 w warunkach podstawowej opieki zdrowotnej. Personel obsługujący klienta IDx i wykonujący zdjęcia dna oka nie był związany z IDx ani z badaniem klinicznym, lecz byli to stali pracownicy klinik, którzy przeszli standardowe szkolenie. Jest to ważne, ponieważ w przypadku wdrożenia na dużą skalę – specjalistyczny personel, np. w zakresie obrazowania okulistycznego, może być trudniejszy do pozyskania niż niezbędny sprzęt techniczny.
W poprzednich badaniach IDx-DR i innych algorytmów AI ich wydajność była porównywana z oceną dokonywaną przez ludzi na podstawie tych samych informacji, głównie obrazów dna oka. Czasem, aby wzmocnić standard oceny, kilka osób oceniało każdy obraz, a następnie ustalano konsensus. To badanie przyjęło jeszcze bardziej rygorystyczne podejście – dając ludziom znacznie więcej informacji, podczas gdy AI było ograniczone do 4 obrazów dna oka wykonanych przez stosunkowo niedoświadczony personel, choć przy użyciu automatycznej kamery dna oka i selektywnej mydriazy. Wyniki te porównano z oceną wykonaną na podstawie czterech stereoskopowych, szerokokątnych obrazów dna oka wykonanych przez profesjonalnych techników i ocenionych przez uznane, niezależne centrum odczytu – Wisconsin Fundus Photograph Reading Center. Obecność klinicznie istotnego cukrzycowego obrzęku plamki (CSME, clinicallysignificantmacularedema) została dodatkowo potwierdzona na podstawie obrazowania optycznej koherentnej tomografii (OCT, opticalcoherencetomography) plamki, do którego algorytm nie miał dostępu. Algorytm AI przekroczył wszystkie punkty końcowe ustalone przed rozpoczęciem badania, osiągając czułość 87,2% (>85%), specyficzność 90,7% (>82,5%) i wskaźnik jakości obrazu 96,1% (wśród pacjentów uznanych za możliwych do obrazowania przez centrum odczytu) [7, 8].
Decyzja FDA o zezwoleniu na działanie IDx-DR w Stanach Zjednoczonych w dużej mierze opierała się na wynikach tego badania. W USA, zgodnie z zatwierdzonym przez Agencję Żywności i Leków (FDA, Food and Drug Administration) zastosowaniem, IDx-DR musi być połączony z kamerą dna oka Topcon NW400 bez mydriazy. Przed tym badaniem opublikowano kilka innych prac dotyczących IDx-DR, choć żadna nie była tak znacząca. Warto zauważyć, że wydajność IDx-DR w zestawie danych Messidor-2 była znacznie wyższa niż w opisanym powyżej badaniu, z czułością 96,8% i ze specyficznością 87%.
W innym badaniu przeprowadzonym w Holandii przebadano 1410 pacjentów w ramach holenderskiego systemu opieki nad cukrzycą. Trzech ekspertów oceniło obrazy zgodnie ze skalą ICDR i EURODIAB, co dało znacząco różne wyniki w zależności od użytej skali. Dla EURODIAB czułość i specyficzność IDx-DR wynosiły odpowiednio 91% i 84%, podczas gdy dla ICDR były to 68% i 86%. Znacznie niższa wydajność w porównaniu z kryteriami ICDR może być przypisana jednemu aspektowi ICDR – uznaniu pojedynczego krwotoku za co najmniej umiarkowaną DR. Autorzy zauważają, że gdyby to kryterium zostało zmienione, czułość wzrosłaby z 68% do 96,1% [9]. To doskonała ilustracja, jak ważne są kryteria oceny. W różnych badaniach stosowano różne kryteria, takie jak Eurodiab, ICDR, ETDRS, a niektóre badania opierały się na lokalnych wytycznych. Każde z nich ma znaczący wpływ na wyniki i ostateczne wskaźniki wydajności.
Pimiennictwo:
- Grzybowski A.: Artificial inteligence in ophthalmology, Springer 2021.
- Gardner G.G., Keating D., Williamson T.H., Elliott A.T.: Automatic detection of diabetic retinopathy using an artificial neural network: a screening tool. Br J Ophthalmol. 1996; 80(11): 940–944.
- Hipwell J.H., Strachan F., Olson J.A., McHardy K.C. i wsp.: Automated detection of microaneurysms in digital red-free photographs: a diabetic retinopathy screening tool. Diabet. Med. 2000; 17(8): 588–594.
- Hansen A.B., Hartvig N.V., Jensen M.S., Borch‐Johnsen K. i wsp.: Diabetic retinopathy screening using digital non‐mydriatic fundus photography and automated image analysis. Acta Ophthalmol. Scand. 2004; 82(6): 666-672.
- Larsen M., Godt J., Larsen N., Lund-Andersen H. i wsp.: Automated detection of fundus photographic red lesions in diabetic retinopathy. Invest. Ophthalmol. Vis. Sci. 2003; 44(2): 761-766.
- Abràmoff M.D., Lou Y., Erginay A., Clarida W. i wsp.: improved automated detection of diabetic retinopathy on a publicly available dataset through integration of deep learning. Invest. Ophthalmol. Vis. Sci. 2016 Oct 1; 57(13): 520-526.
- Xie Y., Gunasekeran D.V., Balaskas K., Keane P.A. i wsp.: Health economic and safety considerations for artificial intelligence applications in diabetic retinopathy screening. Transl. Vis. Sci. Technol. 2020; 9(2): 22-22.
- Abràmoff M.D., Lavin P.T., Birch M., Shah N., Folk J.C.: Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ Digit. Med. 2018; 1(1): 1-8.
- Van Der Heijden A.A., Abramoff M.D., Verbraak F., van Hecke M.V. i wsp.: Validation of automated screening for referable diabetic retinopathy with the IDx-DR device in the Hoorn Diabetes Care System. Acta Ophthalmol. (Copenh) 2018; 96(1): 63-68.
Współfinansowane ze środków Ministerstwa Edukacji i Nauki na podstawie umowy nr. POPUL/SN/0475/2023/01 w ramach projektu pt.: Kampania edukacyjna „Sztuczna inteligencja w okulistyce”