Integration of gene expressions with polymorphism data in systems biology: comparison with imaging techniques in gliomas.
Ολοκλήρωση εκφράσεων γονιδίων με δεδομένα πολυμορφισμών στη βιολογία συστημάτων: σύγκριση με απεικονιστικές τεχνικές σε δεδομένα γλοιώματος.
Date
2022-11-01Author
Iosifidis, Petros-Konstantinos
Ιωσηφίδης, Πέτρος-Κωνσταντίνος
Metadata
Show full item recordAbstract
The present work outlines core aspects of machine learning in the fields of radiomics, genomics, transcriptomics and radiogenomics. More specifically, it’s attempting through the usage of multi-type data (including medical images, gene expressions, trascriptome expressions) to advance the di-agnostic power of predictive models. In the same time, it’s trying to advance the survival rate met-rics using the same type of data in order to help with cancer correlations and treatment observation and evaluation.
Starting off the reader will understand core concepts of the biomedical field, the nature of the problem as well as the scope and target of this thesis. Continuing we will also give the reader the necessary computational knowledge needed to follow up with the experiments. Moving forward we perform a multi-type experiment attempting to merge radiogenomic classifiers with a better cancer survival rate. Lastly we present our results, give our outlook and discuss about the work done & problems we encountered and close off by pondering over future research.
The begin of the experiments starts with a lengthy preprocessing of approximately 4000 MRI blocks of multiple modalities (FLAIR, T1, T1CE, T2) and generation of custom input objects. Through the use of a DNN, namely a 3D CNN with modified inputs, we establish cancer classifica-tion and semantic segmentation into 4 major classes(background, necrotic core/non enhancing tumor, peritumoral edema, enhancing tumor) through the training and evaluation of multiple segmentation models.
Using the imaging data, we extract a plethora of imaging features that we later use in gradient boosting (XGBOOST) to approximate survival prediction from the imaging data analysis. Continu-ing with the genomic & trascriptomic data, we establish two major classes of “dead” or “alive for over 100 days” and generate classifiers based on the multi-omic profiling of our samples. Lastly we use the multi-omic data to generate powerful regressors for survival rate prediction. Η παρούσα εργασία σκιαγραφεί τις βασικές πτυχές της μηχανικής μάθησης στους τομείς της ραδιονομικής, της γονιδιωματικής, της μεταγραφτομικής και της ραδιογονιδιωματικής. Πιο συγκεκριμένα, επιχειρεί μέσω της χρήσης δεδομένων πολλαπλών τύπων (συμπεριλαμβανομένων ιατρικών εικόνων, εκφράσεων γονιδίων, εκφράσεων μεταγραφωμάτων) να προωθήσει τη διαγνωστική δύναμη των προγνωστικών μοντέλων. Ταυτόχρονα, προσπαθεί να προωθήσει τις μετρήσεις του ποσοστού επιβίωσης χρησιμοποιώντας τους ίδιους τύπους δεδομένων, προκειμένου να βοηθήσει με τις συσχετίσεις του καρκίνου και την παρατήρηση και αξιολόγηση της καρκινικής θεραπείας.
Ξεκινώντας ο αναγνώστης θα κατανοήσει τις βασικές έννοιες του βιοϊατρικού τομέα, θα κατανοήσει τη φύση του προβλήματος καθώς και το εύρος και τον στόχο αυτής της διατριβής. Συνεχίζοντας αποτυπώνουμε τον αναγνώστη τις υπολογιστικές γνώσεις που απαιτούνται για την παρακολούθηση των πειραμάτων. Προχωρώντας, πραγματοποιούμε ένα πείραμα πολλαπλών τύπων επιχειρώντας να συγχωνεύσουμε ραδιογονιδιωματικούς ταξινομητές με καλύτερο ποσοστό επιβίωσης από καρκίνο. Τέλος, παρουσιάζουμε τα αποτελέσματά μας, δίνουμε τις προοπτικές μας και συζητάμε για τη δουλειά που έχει γίνει και τα προβλήματα που αντιμετωπίσαμε και κλείνουμε με το στοχασμούς για μελλοντική έρευνα.
Η αρχή των πειραμάτων ξεκινά με μια μακρά προεπεξεργασία περίπου 4000 μπλοκ MRI πολλαπλών τύπων (FLAIR, T1, T1CE, T2) και δημιουργία προσαρμοσμένων αντικειμένων εισαγωγής. Μέσω της χρήσης ενός DNN, συγκεκριμένα ενός τρισδιάστατου CNN με τροποποιημένες εισόδους, καθιερώνουμε την ταξινόμηση του καρκίνου και τη σημασιολογική κατάτμηση σε 4 κύριες κατηγορίες (υπόβαθρο, νεκρωτικός πυρήνας/μη ενισχυτικός όγκος, περιογκικό οίδημα, ενισχυτικός όγκος) μέσω της εκπαίδευσης και της αξιολόγησης έξι μοντέλων πολλαπλής τμηματοποίησης εικόνας.
Χρησιμοποιώντας τα δεδομένα απεικόνισης μας, εξάγουμε μια πληθώρα χαρακτηριστικών απεικόνισης που αργότερα χρησιμοποιούμε στους ταξινομητές ενίσχυσης κλίσης (XGBOOST) για να προσεγγίσουμε την πρόβλεψη επιβίωσης από την ανάλυση δεδομένων απεικόνισης. Συνεχίζοντας με τα γονιδιωματικά και μεταγραφικά δεδομένα, καθιερώνουμε δύο κύριες κατηγορίες «νεκρών» ή «ζωντανών για περισσότερες από 100 ημέρες» και δημιουργούμε ταξινομητές με βάση το πολυ-ομικό προφίλ των δειγμάτων μας. Τέλος, χρησιμοποιούμε τα πολλυομικά δεδομένα για να δημιουργήσουμε έναν ισχυρό παλινδρομητή για την πρόβλεψη του ποσοστού επιβίωσης.
Collections
The following license files are associated with this item:
This website uses cookies to ensure you get the best browsing experience.
Continue
More info