Neural Network Approaches To Survival Analysis
Författare
Summary, in Swedish
Popular Abstract in Swedish
Denna avhandling behandlar artificiella neuron nätverk och deras
applikation inom medicin. Den utgår ifrån att det är viktigt att
kunna uppskatta en patients överlevnadschanser för att kunna erbjuda
rätt behandling för olika former av cancer. Generellt kan man säga
att ju värre prognos desto mer omfattande behandling behöver man sätta
in. Vissa patienter kan botas med enbart kirurgi eller strålbehandling
medan andra även kräver tilläggsbehandling så som cytostatika
(cellgifter). Eftersom behandlingen kan vara påfrestande är det
givetvis ett mål att inte överbehandla patienter. I vissa fall har man
endast tillräckligt med resurser för att erbjuda en viss andel av
patienterna den mer omfattande behandlingen. I båda fallen finns det
ett stort behov av att tillförlitligt kunna uppskatta en patients
prognos.
Det finns en uppsjö av olika faktorer som påverkar överlevnad och
eventuell risk. Till exempel ökar många gånger koncentrationen av PSA
(äggviteämne som produceras i prostatans körtelceller) i blodet vid
prostatacancer och höga halter av östrogen och progesteron (två
hormoner) kan ge ökad risk för bröstcancer. Att blodprov skulle
uppvisa förhöjda nivåer av PSA eller östrogen är dock långt ifrån ett
entydigt bevis på förekomsten av cancer. Bättre prediktion är möjlig
om man även tar hänsyn till andra faktorer så som ålder eller genetik,
men det blir snabbt ohanterligt att kombinera fler än ett fåtal
faktorer, speciellt om man måste göra det med hänsyn till tusentals
patienter.
I överlevnadsanalys försöker man lösa detta hjälp av statistiska
modeller som kan kombinera ett teoretiskt sätt obegränsat antal
faktorer. Ett sätt att skapa statistiska modeller är genom att använda
sig av maskininlärning, även kallat artificiell intelligens i vissa
sammanhang. Maskininlärning tillåter en dator att på egen hand lära
sig att identifiera mönster och samband. Det är med hjälp av
maskininlärning som en dator kan tyda dina röstkommandon, posten kan
sortera dina vykort och du kan söka efter bilder hos Google. I
avhandlingen ligger fokus på en speciell metod inom maskininlärning
kallad artificiella neuron nätverk (ANN) och på hur man kan träna
dessa nätverk för applikationer inom överlevnadsanalys. Ett ANN är en
förenklad modell av vår egen hjärna. Denna består av ett komplext nätverk
av miljarder nervceller kallade neuroner. I jämförelse består ett ANN
oftast av ett tiotal men ibland upp till flera tusen neuroner. Trots
den högst begränsade kapaciteten jämfört med en mänsklig hjärna är ANN
väldigt kapabla att lära sig att hitta mönster i data.
En annan maskininlärningsteknik som är inspirerad av naturen är
genetiska algoritmer. En genetisk algoritm är en simulering av
naturlig evolution där en population av modeller tillåts para sig och generera
nya modeller som är korsningar av sina "föräldrar". Precis som i
naturen förekommer det också slumpmässiga mutationer som introducerar
förändringar i avkommans "gener". Genom att låta strukturen hos ANN
representera generna kan datorn automatiskt utveckla egna modeller.
Konventionella träningsalgoritmer för ANN kräver ofta att den
felfunktion (ett mått på hur mycket fel modellen gör vid prediktion av
till exempel överlevnad) man försöker minimera kan deriveras, vilket
för prognostiska tillämpningar ofta innebär en
begränsning. Kombinationen av genetiska algoritmer och ANN gör det
möjligt att bygga prognostiska modeller på ett mer direkt sätt än vad
som annars hade varit möjligt. Detta eftersom en genetisk algoritm kan
minimera vilken felfunktion som helst.
Denna avhandling behandlar artificiella neuron nätverk och deras
applikation inom medicin. Den utgår ifrån att det är viktigt att
kunna uppskatta en patients överlevnadschanser för att kunna erbjuda
rätt behandling för olika former av cancer. Generellt kan man säga
att ju värre prognos desto mer omfattande behandling behöver man sätta
in. Vissa patienter kan botas med enbart kirurgi eller strålbehandling
medan andra även kräver tilläggsbehandling så som cytostatika
(cellgifter). Eftersom behandlingen kan vara påfrestande är det
givetvis ett mål att inte överbehandla patienter. I vissa fall har man
endast tillräckligt med resurser för att erbjuda en viss andel av
patienterna den mer omfattande behandlingen. I båda fallen finns det
ett stort behov av att tillförlitligt kunna uppskatta en patients
prognos.
Det finns en uppsjö av olika faktorer som påverkar överlevnad och
eventuell risk. Till exempel ökar många gånger koncentrationen av PSA
(äggviteämne som produceras i prostatans körtelceller) i blodet vid
prostatacancer och höga halter av östrogen och progesteron (två
hormoner) kan ge ökad risk för bröstcancer. Att blodprov skulle
uppvisa förhöjda nivåer av PSA eller östrogen är dock långt ifrån ett
entydigt bevis på förekomsten av cancer. Bättre prediktion är möjlig
om man även tar hänsyn till andra faktorer så som ålder eller genetik,
men det blir snabbt ohanterligt att kombinera fler än ett fåtal
faktorer, speciellt om man måste göra det med hänsyn till tusentals
patienter.
I överlevnadsanalys försöker man lösa detta hjälp av statistiska
modeller som kan kombinera ett teoretiskt sätt obegränsat antal
faktorer. Ett sätt att skapa statistiska modeller är genom att använda
sig av maskininlärning, även kallat artificiell intelligens i vissa
sammanhang. Maskininlärning tillåter en dator att på egen hand lära
sig att identifiera mönster och samband. Det är med hjälp av
maskininlärning som en dator kan tyda dina röstkommandon, posten kan
sortera dina vykort och du kan söka efter bilder hos Google. I
avhandlingen ligger fokus på en speciell metod inom maskininlärning
kallad artificiella neuron nätverk (ANN) och på hur man kan träna
dessa nätverk för applikationer inom överlevnadsanalys. Ett ANN är en
förenklad modell av vår egen hjärna. Denna består av ett komplext nätverk
av miljarder nervceller kallade neuroner. I jämförelse består ett ANN
oftast av ett tiotal men ibland upp till flera tusen neuroner. Trots
den högst begränsade kapaciteten jämfört med en mänsklig hjärna är ANN
väldigt kapabla att lära sig att hitta mönster i data.
En annan maskininlärningsteknik som är inspirerad av naturen är
genetiska algoritmer. En genetisk algoritm är en simulering av
naturlig evolution där en population av modeller tillåts para sig och generera
nya modeller som är korsningar av sina "föräldrar". Precis som i
naturen förekommer det också slumpmässiga mutationer som introducerar
förändringar i avkommans "gener". Genom att låta strukturen hos ANN
representera generna kan datorn automatiskt utveckla egna modeller.
Konventionella träningsalgoritmer för ANN kräver ofta att den
felfunktion (ett mått på hur mycket fel modellen gör vid prediktion av
till exempel överlevnad) man försöker minimera kan deriveras, vilket
för prognostiska tillämpningar ofta innebär en
begränsning. Kombinationen av genetiska algoritmer och ANN gör det
möjligt att bygga prognostiska modeller på ett mer direkt sätt än vad
som annars hade varit möjligt. Detta eftersom en genetisk algoritm kan
minimera vilken felfunktion som helst.
Publiceringsår
2015
Språk
Engelska
Fulltext
- Available as PDF - 403 kB
- Download statistics
Dokumenttyp
Doktorsavhandling
Förlag
Department of Astronomy and Theoretical Physics, Lund University
Ämne
- Biophysics
- Physical Sciences
Nyckelord
- Survival Analysis
- Artificial Neural Networks
- Machine Learning
- Genetic Algorithms
- Evolutionary Algorithms
- Fysicumarkivet:2015:Kalderstam
Status
Published
Handledare
ISBN/ISSN/Övrigt
- ISBN: 978-91-7623-307-8
- ISBN: 978-91-7623-308-5
Försvarsdatum
29 maj 2015
Försvarstid
13:15
Försvarsplats
Sal F, Fysikum, Sölvegatan 14A, 221 00 Lund
Opponent
- Azzam Taktak