Co to jest uczenie transferowe się i dlaczego uważasz, że może przynieść korzyści w opiece zdrowotnej i okulistyce?
Uczenie transferowe (Transfer learning, TL) to rodzaj modelu głębokiego uczenia, który wykorzystuje inne, już dostępne modele głębokiego uczenia (DL) lub inne zbiory danych. TL może być używany do łatwiejszego opracowania modelu DL lub do poprawy dokładności modelu DL. Na przykład wiele dzisiejszych modeli zostało opracowanych na podstawie informacji przesłanych z ImageNet, który jest modelem open source dostępnym w Internecie. W okulistyce informacje z zestawów danych OCT można na przykład przenieść do odpowiednich zestawów danych kolorowych obrazów dna oka w celu opracowania modelu DL do przeprowadzania analizy zdjęć dna oka, który może zapewnić lepszą dokładność niż tradycyjne DL opracowane wyłącznie na podstawie danych zdjęć dna oka. Dzieje się tak, ponieważ model uczy się więcej zarówno z zestawów danych zdjęć dna oka, jak i OCT. Korzyści obejmowałyby więcej opracowanych modeli AI o lepszej wydajności.
Jakie są ograniczenia tradycyjnych modeli AI?
Tradycyjne modele sztucznej inteligencji mogą wymagać bardzo dużego zestawu danych opracowanego w celu osiągnięcia wystarczająco wysokiej wydajności. Ponadto dostępnych jest obecnie wiele danych z obrazowania multimodalnego w okulistyce, ale tradycyjna sztuczna inteligencja może być w stanie wykorzystywać jednocześnie tylko jeden rodzaj danych.
Czym są sieci generatywnei jak mogą pomóc okulistom?
Sieci generatywne (GAN, Generative adversarial network) to model DL opracowany w celu tworzenia nowych obrazów z istniejących obrazów, a zatem GAN jest z natury modelem TL. Istnieje wiele zastosowań GAN w branży filmowej i reklamowej, na przykład podczas tworzenia obrazu zebry z obrazu konia. W medycynie GAN są wykorzystywane do tworzenia obrazów mniej powszechnie stosowanych metod, takich jak MRI, z obrazów metod, które mogą być częściej stosowane, takich jak tomografia komputerowa. Nowe obrazy mogą być wykorzystywane w badaniach nad sztuczną inteligencją lub jako wskazówki dla lekarzy w badaniach klinicznych. W naszym badaniu wykorzystaliśmy GAN do stworzenia obrazów z biomikroskopii ultradźwiękowej (UBM) przedniego odcinka na podstawie odpowiednich obrazów OCT przedniego odcinka w celu wykrycia zespołu płaskiej tęczówki (iris plateau). W innym badaniu naukowcy wykorzystali GAN do stworzenia obrazów dna oka, aby odblokować czarną skrzynkę DL. Naukowcy biorący udział w tym badaniu opracowali model DL, aby wykryć, gdzie warstwa włókien nerwowych lub obwód nerwowo-siatkówkowy tarczy nerwu wzrokowego ulega przerzedzeniu na obrazach dna oka z jaskrą. Wykorzystali GAN do stworzenia obrazu dna oka, na którym ten cienki obszar miał normalną grubość i innego obrazu, w którym ten obszar był wyjątkowo cienki. Te nowe obrazy podkreśliły, gdzie na obrazach dna oka model DL używany do diagnozowania jaskry i okuliści mogli wykorzystać te obrazy utworzone przez GAN do oceny czy model wskazał prawidłowe obszary.