1/2003
vol. 7
An application of neural networks and 1H MR in vivo spectroscopy in brain tumors recognition
Współcz Onkol (2003) vol. 7, 1 (62-66)
Online publish date: 2003/04/08
Get citation
Wczesna diagnostyka wznowy procesu nowotworowego ma kolosalne znaczenie jako czynnik wydłużający przeżycie w przypadku chorych leczonych operacyjnie z powodu guza mózgu. Podstawowe narzędzia diagnostyczne, takie jak MRI i CT, są w tej grupie chorych zawodne, ze względu na wzmocnienie kontrastowe utrzymujące się przy loży pooperacyjnej do kilku tygodni po operacji. Spektroskopia MR dostarcza w takich przypadkach dodatkowych danych, które wspomagają diagnozowanie [1, 2].
Teoria sieci neuronowych znana jest od 50 lat. Jednak dopiero dzisiaj może być w łatwy sposób rozwijana. Postęp w technologii komputerowej zapewnił ogromną moc obliczeniową, niewyobrażalną dla pierwszych twórców sieci neuronowych. Jednocześnie technologia jest na tyle tania, że większość ośrodków może sobie na nią pozwolić [3–5].
W roku 1943 McCulloch i Pitts opracowali matematyczny model komórki nerwowej, który do dziś stanowi podstawowe ogniwo większości używanych sieci. Istotą modelu jest sumowanie sygnałów wejściowych z odpowiednią wagą i przeprowadzenie tej sumy przez nieliniową funkcję aktywacji. W wyniku otrzymujemy sygnał wyjściowy postaci:
(wzór w pdf)
gdzie
xi to sygnały wejściowe
Wij to odpowiednie współczynniki wagowe.
Dodatnie współczynniki wagowe powodują pobudzenie, ujemne – zahamowanie. W modelu pierwotnym jako funkcji aktywacji użyto funkcji Diraca, ale w ogólnym przypadku postać tej funkcji może być różna. Odpowiedni dobór wag połączeń powoduje właściwe działanie sieci. Ponieważ liczba wag jest znacznie większa niż neuronów, konieczny jest inteligentny sposób poszukiwania odpowiednich wag połączeń – algorytm uczący [6].
Niedostępność wystarczająco szybkich komputerów oraz pewne wady teorii spowodowały, że sieci neuronowe nie rozwijały się. Dopiero gwałtowny rozwój układów scalonych w latach 80. XX w. przywrócił zainteresowanie tą metodą.
W zależności od spełnianych funkcji sieć neuronowa może być siecią aproksymacyjną, klasyfikacyjną i rozpoznawania wzorców, predykcyjną, sterowania lub asocjacyjną.
Sieć aproksymująca odgrywa rolę uniwersalnego aproksymatora funkcji wielu zmiennych, realizując funkcję nieliniową y=f(x), gdzie x jest wektorem wejściowym, a y to szukana funkcja skalarna. Wiele zadań modelowania, identyfikacji i przetwarzania sygnałów da się sprowadzić do zagadnienia aproksymacyjnego.
Przy klasyfikacji i rozpoznawaniu wzorców sieć uczy się podstawowych cech i własności tych wzorców. W procesie nauczania podkreślane są różnice występujące w różnych wzorcach, stanowiące podstawę podjęcia odpowiedniej decyzji.
W zadaniu predykcyjnym sieć neuronowa na podstawie ciągu wartości opisujących daną sytuację w przeszłości oraz jej rozwój, stara się podać stan układu w chwili przyszłej. Uwzględniając powstały błąd estymacji można adaptować wagi neuronów tak, aby umożliwić lepszą predykcję w przyszłości.
W zagadnieniach sterowania sieć pełni rolę układu śledzącego warunki zewnętrzne i adaptującego się do zaistniałych problemów. Ważną rolę w sterowaniu pełni umiejętność klasyfikacji.
W dziedzinie asocjacji rolą sieci neuronowej jest pamięć asocjacyjna. Można tu wyróżnić pamięć autoasocjacyjną, gdzie skojarzenie dotyczy tylko poszczególnych składowych wektora wejściowego, oraz pamięć heteroasocjacyjną, której zadaniem jest skojarzenie ze sobą dwóch wektorów. W przypadku podania na wejście sieci wektora zaszumionego bądź pozbawionego pewnych fragmentów, sieć potrafi odtworzyć pełny wektor oryginalny pozbawiony szumów, generując przy tym pełną postać odpowiadającego mu wektora.
Sieci neuronowe wykazują cechy sztucznej inteligencji, potrafią się uczyć i uogólniać zdobytą wiedzę na przypadki spoza grupy uczącej [7].
Algorytm uczący narzuca właściwości sieci, sposób połączenia neuronów oraz sposoby przygotowania danych uczących. Jednym z najpowszechniejszych algorytmów uczących jest algorytm wstecznej propagacji błędu. Zakłada on, ze posiadamy pewną grupę przypadków, będącą reprezentatywną próbką z całej populacji, dla której znane są żądane odpowiedzi sieci neuronowej. Zbiór ten nazywany jest zbiorem uczącym.
W tym przypadku neurony ułożone są w rzędach, pierwszy rząd zawiera tyle neuronów, ile informacji wejściowych posiadamy w bazie danych, ostatni rząd zaś tyle neuronów, ile jest informacji wyjściowych. Warstwy pośrednie (ukryte) powinny zawierać liczbę neuronów pomiędzy liczbą neuronów wyjściowych i wyjściowych. Neurony z danej warstwy połączone są z następną, tak że każdy neuron połączony jest z każdym.
Istotą wstecznej projekcji błędów jest wprowadzenie pojęcia funkcji błędu. Wartości tej funkcji w danym punkcie ustala się jako błąd względny odpowiedzi sieci neuronowej względem zbioru uczącego. Stosując metody gradientowe, minimalizuje się funkcje błędu.
W punkcie minimum działanie sieci będzie najlepiej odwzorowywało zależności w zbiorze uczącym. Algorytm SFAM (Simplified Fuzzy Adaptive Resonance Map) zawiera warstwę ukrytą neuronów. Algorytm uczący może modyfikować liczbę neuronów w warstwie ukrytej. Każdy neuron warstwy ukrytej rezonuje z pewną grupą danych. Wagi neuronów dobierane są tak, aby grup było jak najmniej, następnie sygnał jest wyprowadzany przez warstwę wyjściową i zamieniany na postać wektora wyjściowego ze zbioru uczącego [6].
Materiał badawczy stanowiły widma 1H MRin vivo [8] zarejestrowane w Zakładzie Diagnostyki Obrazowej Centrum Onkologii w Gliwicach. Widma otrzymano przy użyciu sekwencji PRESS z obszarów o objętości 1,5 x 1,5 x 1,5 cm3 i przy zastosowaniu następujących parametrów: TR=1 500 ms, TE=35 ms i 100 Acq. Widma pochodziły najczęściej z loży po wycięciu guza (diagnozę ustalono na podstawie badania histopatologicznego).
Do opracowań wybrano 90 przypadków retrospektywnych: 48 gwiaździaków złośliwych (astrocytoma anaplasticum) oraz 24 guzy typu glejak wielopostaciowy (glioblastoma multiforme). Grupę porównawczą stanowiło 18 zdrowych ochotników. Widma NMR dla grupy kontrolnej rejestrowano z płata czołowego [9].
Z widm rozdzielonych metodą drugiej pochodnej [10] wybrano informacje dotyczące najważniejszych metabolitów mózgowych, takich jak: Mioinozytol (ml), Cholina (Cho), Kreatyna (Cr); N-acetyloasparaginian (NAA), Mleczan (Lac) i Lipidy (Lip).
Jako wektory wejściowe sieci neuronowych zastosowano proporcje najczęściej stosowane do prognozowania zmian nowotworowych:
(wzór w pdf)
oraz wartości integralne sygnałów. 41 przypadków zawierało tylko informacje o proporcjach, reszta zawierała informacje o wartościach całek, z których można w prosty sposób otrzymać proporcje. Testy przeprowadzono przy użyciu programu NEUNET 2.2 [11]. Lista przeprowadzonych testów została zaprezentowana w tab. 1.
Otrzymane wyniki zestawiono w tab. 2.
Sieci neuronowe potrafią znajdować i aproksymować nieliniowe funkcje. Szukane zależności pomiędzy wartościami integralnych intensywności sygnałów NMR lub między ich proporcjami wykazują wysoką nieliniowość, dlatego uzasadnione jest wykorzystanie sieci neuronowych do celów klasyfikowania fenotypów spektralnych guzów nowotworowych mózgu.
Jak wynika z przedstawionego w tab. 3. porównania, sieci neuronowe uczone algorytmem SFAM rozpoznają fenotyp guza nowotworowego z wyższą czułością i swoistością niż sieci uczone algorytmem propagacji wstecznej. W przeprowadzonych symulacjach uzyskano dla tej metody średnią czułość 90 proc. i swoistość wynoszącą 93 proc. Algorytm wstecznej propagacji błędów daje dobrą czułość i swoistość, potwierdzając tym samym swoją wszechstronność, jednak w zagadnieniach związanych z rozpoznawaniem typów guzów mózgu przy większej liczbie klas nie sprawdza się.
Sieci klasyfikujące oparte na logice rozmytej są nową alternatywą w zastosowaniach medycznych, gdzie częstszym problemem jest klasyfikacja, niż aproksymacja. Bardzo szybka zbieżność algorytmu uczącego zapewnia wysoki komfort pracy, a nieskomplikowane procedury przygotowania danych sprawiają, że metody sieci neuronowych stają się powszechnie dostępne.
Zastosowanie jako wektorów wejściowych dla sieci neuronowej wartości integralnych intensywności sygnałów nie wykazuje istotnych różnic w porównaniu do proporcji metabolitów.
Algorytmy uczenia sieci neuronowych wymagają czystych danych. Szczególnie wrażliwa na obecność danych sprzecznych lub niejednoznacznych jest metoda SFAM. Identyfikacja przypadków bazowała na wynikach pooperacyjnych analiz histopatologicznych, jednak należy pamiętać o tendencji gwiaździaków złośliwych do przechodzenia w bardziej złośliwą formę – glejaka wielopostaciowego. Cechą tych guzów jest więc heterogeniczność tkankowa, co oznacza obecność obok siebie obszarów tkankowych różniących się histologicznie. Niewątpliwie jest to czynnik zaburzający dane – widmo 1H MR rejestrowane zazwyczaj w kilka tygodni po operacji może odzwierciedlać nie tylko odrost, lecz i progresję guza. Kolejnym problemem istotnym z punktu widzenia czystości badań jest brak wyraźnej granicy guza – rozmyta i szeroka strefa guz-tkanka zdrowa może skutkować efektem uśrednienia objętościowego, tzn. zafałszowaniem wartości integralnych intensywności ze względu na udział sygnałów z obszarów zdrowych. Wreszcie niewielka objętość badanego w spektroskopii obszaru sprawia, że ruch pacjenta w trakcie badania może zmienić lokalizację pomiaru.
Wspomniane ograniczenia metody mogą jednak zostać uwzględnione w procesie uczenia – jest to zagadnienie, którym chcielibyśmy zająć się w przyszłości.
Dobrze nauczona sieć neuronowa może wspomagać proces diagnozowania skuteczności leczenia operacyjnego lub proces klasyfikacji złośliwości nowotworu.
PIŚMIENNICTWO
1. Poptani H. Diagnostic assessment of brain tumors and non-neoplastic brain disorders in vivo using proton nuclear magnetic spectroscopy and artificial neural networks. J Cancer Res Clin Oncol 1999; 125: 343-9.
2. Usenius JP. Automated classification of human brain tumors by neural network analysis using in vivo 1H magnetic resonance spectroscopic metabolite phenotypes. NeuroReport 7 1996; 1597-600.
3. Rutkowski L. Sieci neuronowe i neurokomputery. Wyd. Politechniki Częstochowskiej, Częstochowa 1996.
4. Rutkowska D. Sieci neuronowe, algorytmy genetyczne i systemy rozmyte. PWN, Warszawa 1997.
5. Tadeusiewicz R. Problemy biocybernetyki. PWN 1994.
6. Osowski S. Sieci w ujęciu algorytmicznym. WNT Warszawa 1996; Wyd. 2.
7. STATISTICA Neural Networks PL. Wprowadzenie do sieci neuronowych. StatSoft 2001.
8. Hennel JW. Podstawy magnetycznego rezonansu jądrowego. Wyd. NUAM Poznań 2000.
9. Sokół M, Maniakowski Z, Kupka T, Jarosz E, Sokol R. Radiotherapy monitoring by means of 1H NMR spectroscopy – in vitro and in vivo studies. Pol J Med Sci&Eng (w druku).
10. Sokół M. In vivo 1H MR spectra analysis by means of second derivative method. Magn RES Mat Phys Biol Med 2001; 12: 177-83.
11. http://www.cormactech.com/neunet/
ADRES DO KORESPONDENCJI
doc. dr hab. Maria Sokół
Zakład Fizyki Medycznej
Centrum Onkologii – Instytut
im. Marii Curie-Skłodowskiej
ul. Wybrzeże Armii Krajowej 15
44-101 Gliwice
tel. 0 (prefiks) 32 278 93 63
e-mail: mary@io.gliwice.pl
lic. Kamil Gorczewski
Zakład Medycyny Nuklearnej
i Endokrynologii Onkologicznej
Centrum Onkologii – Instytut
im. Marii Curie-Skłodowskiej
ul. Wybrzeże Armii Krajowej 15
44-101 Gliwice
tel. 0 (prefiks) 32 278 93 30
faks 0 (prefiks) 32 278 93 25
e-mail: milka@io.gliwice.pl
Copyright: © 2003 Termedia Sp. z o. o. This is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License ( http://creativecommons.org/licenses/by-nc-sa/4.0/), allowing third parties to copy and redistribute the material in any medium or format and to remix, transform, and build upon the material, provided the original work is properly cited and states its license.
|
|