Meny

Javascript verkar inte påslaget? - Vissa delar av Lunds universitets webbplats fungerar inte optimalt utan javascript, kontrollera din webbläsares inställningar.
Du är här

Neural Network Approaches To Survival Analysis

Författare:
  • Jonas Kalderstam
Publiceringsår: 2015
Språk: Engelska
Sidor:
Dokumenttyp: Doktorsavhandling
Förlag: Department of Astronomy and Theoretical Physics, Lund University

Sammanfattning

Popular Abstract in Swedish

Denna avhandling behandlar artificiella neuron nätverk och deras

applikation inom medicin. Den utgår ifrån att det är viktigt att

kunna uppskatta en patients överlevnadschanser för att kunna erbjuda

rätt behandling för olika former av cancer. Generellt kan man säga

att ju värre prognos desto mer omfattande behandling behöver man sätta

in. Vissa patienter kan botas med enbart kirurgi eller strålbehandling

medan andra även kräver tilläggsbehandling så som cytostatika

(cellgifter). Eftersom behandlingen kan vara påfrestande är det

givetvis ett mål att inte överbehandla patienter. I vissa fall har man

endast tillräckligt med resurser för att erbjuda en viss andel av

patienterna den mer omfattande behandlingen. I båda fallen finns det

ett stort behov av att tillförlitligt kunna uppskatta en patients

prognos.



Det finns en uppsjö av olika faktorer som påverkar överlevnad och

eventuell risk. Till exempel ökar många gånger koncentrationen av PSA

(äggviteämne som produceras i prostatans körtelceller) i blodet vid

prostatacancer och höga halter av östrogen och progesteron (två

hormoner) kan ge ökad risk för bröstcancer. Att blodprov skulle

uppvisa förhöjda nivåer av PSA eller östrogen är dock långt ifrån ett

entydigt bevis på förekomsten av cancer. Bättre prediktion är möjlig

om man även tar hänsyn till andra faktorer så som ålder eller genetik,

men det blir snabbt ohanterligt att kombinera fler än ett fåtal

faktorer, speciellt om man måste göra det med hänsyn till tusentals

patienter.



I överlevnadsanalys försöker man lösa detta hjälp av statistiska

modeller som kan kombinera ett teoretiskt sätt obegränsat antal

faktorer. Ett sätt att skapa statistiska modeller är genom att använda

sig av maskininlärning, även kallat artificiell intelligens i vissa

sammanhang. Maskininlärning tillåter en dator att på egen hand lära

sig att identifiera mönster och samband. Det är med hjälp av

maskininlärning som en dator kan tyda dina röstkommandon, posten kan

sortera dina vykort och du kan söka efter bilder hos Google. I

avhandlingen ligger fokus på en speciell metod inom maskininlärning

kallad artificiella neuron nätverk (ANN) och på hur man kan träna

dessa nätverk för applikationer inom överlevnadsanalys. Ett ANN är en

förenklad modell av vår egen hjärna. Denna består av ett komplext nätverk

av miljarder nervceller kallade neuroner. I jämförelse består ett ANN

oftast av ett tiotal men ibland upp till flera tusen neuroner. Trots

den högst begränsade kapaciteten jämfört med en mänsklig hjärna är ANN

väldigt kapabla att lära sig att hitta mönster i data.



En annan maskininlärningsteknik som är inspirerad av naturen är

genetiska algoritmer. En genetisk algoritm är en simulering av

naturlig evolution där en population av modeller tillåts para sig och generera

nya modeller som är korsningar av sina "föräldrar". Precis som i

naturen förekommer det också slumpmässiga mutationer som introducerar

förändringar i avkommans "gener". Genom att låta strukturen hos ANN

representera generna kan datorn automatiskt utveckla egna modeller.



Konventionella träningsalgoritmer för ANN kräver ofta att den

felfunktion (ett mått på hur mycket fel modellen gör vid prediktion av

till exempel överlevnad) man försöker minimera kan deriveras, vilket

för prognostiska tillämpningar ofta innebär en

begränsning. Kombinationen av genetiska algoritmer och ANN gör det

möjligt att bygga prognostiska modeller på ett mer direkt sätt än vad

som annars hade varit möjligt. Detta eftersom en genetisk algoritm kan

minimera vilken felfunktion som helst.
Predicting the probable survival for a patient can be very challenging

for many diseases. In many forms of cancer, the choice of treatment

can be directly impacted by the estimated risk for the patient. This

thesis explores different methods to predict the patient's survival

chances using artificial neural networks (ANN).



ANN is a machine learning technique inspired by how

neurons in the brain function. It is capable of learning to recognize

patterns by looking at labeled examples, so-called supervised

learning. Certain characteristics of medical data make it difficult to

use ANN methods and the articles in this thesis investigates different

methods of overcoming those difficulties.



One of the most prominent difficulties is the missing

data known as censoring. Survival data usually originates from medical

studies, which only are conducted during a limited time period for

example during five years. During this time, some patients will leave

the study for various reasons like death by unrelated causes. Some

patients will also survive the study without experiencing cancer

recurrence or death. These patients provide partial information about

the survival characteristics of the disease but are challenging to

include in statistical models.



Articles 1-3, and 5 utilize a genetic algorithm to train ANN

models to maximize (or minimize) non-differentiable functions, which

are impossible to combine with traditional ANN training techniques

which rely on gradient information. One of these functions is the

concordance index, which compares survival predictions in a pair-wise

fashion. This function is often used to compare prognostic models in

survival analysis, and is maximized directly using the genetic

algorithm approach. In contrast, Article 5

tries to produce the best grouping of the patients into low,

intermediate, or high risk by maximizing, or minimizing the area under

the survival curve.



Article 4 does not use a genetic

algorithm approach but instead takes the approach to modify the

underlying data. Regular gradient methods are used to train ANNs on

survival data where censored times are estimated in a maximum

likelihood framework.

Disputation

2015-05-29
13:15
Sal F, Fysikum, Sölvegatan 14A, 221 00 Lund
  • Azzam Taktak

Nyckelord

  • Biophysics
  • Physical Sciences
  • Survival Analysis
  • Artificial Neural Networks
  • Machine Learning
  • Genetic Algorithms
  • Evolutionary Algorithms
  • Fysicumarkivet:2015:Kalderstam

Övriga

Published
  • Mattias Ohlsson
  • ISBN: 978-91-7623-307-8
  • ISBN: 978-91-7623-308-5

Box 117, 221 00 LUND
Telefon 046-222 00 00 (växel)
Telefax 046-222 47 20
lu [at] lu [dot] se

Fakturaadress: Box 188, 221 00 LUND
Organisationsnummer: 202100-3211
Om webbplatsen