Show simple item record

Ανάλυση εκφράσεων γονιδίων και ρυθμιστικών δικτύων γονιδίων με στατιστικές μεθόδους και αλγορίθμους μηχανικής μάθησης.

Dublin Core metadata

dc.creatorDroumalia, Foteinien
dc.creatorΔρουμαλιά, Φωτεινήel
dc.date.accessioned2023-04-10T08:52:59Z
dc.date.available2023-04-10T08:52:59Z
dc.date.issued2023-04-10
dc.identifier.urihttp://hdl.handle.net/20.500.12688/10531
dc.description.abstractDetermining the best approach and data type for Pathway Analysis is a significant difficulty for the field of diagnostic medicine. The findings of recent studies indicate their preference for Machine Learning algorithms and the utilization of continuous gene expression values rather than binary values. However, due to the limitations of Machine Learning and non-binary values, there were efforts to produce new hybrid techniques that exploit the benefits of statistical methods and discrete values. The purpose of this study was to identify the most effective approach for Pathway Analysis utilizing currently available tools and to compare the results to previous research. This was accomplished by implementing the scoring methodology for several Pathway Analysis tools and employing a Decision Tree algorithm to assess the outcomes. The tools selected for implementation were TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath and HiPathia, among which PRS displayed the highest rate of accuracy, while HiPathia, which performed equally well, achieved the shortest execution time; overall, Machine Learning-based techniques outperformed those based on statistics. The outcomes obtained are consistent with prior literature, which have shown that non-binary data hold more information and that Machine Learning methods offer new opportunities for use in health. Unfortunately, a major issue that prevented our re-search from extracting common significant sub-pathways among the tools is probably related to the fact that there are numerous genomic platforms available; as a result genes cannot be recognized across different datasets.en
dc.description.abstractΟ καθορισμός της καλύτερης προσέγγισης και του βέλτιστου τύπου δεδομένων για την ανάλυση μονοπατιών αποτελεί σημαντική δυσκολία για τον τομέα της διαγνωστικής ιατρικής. Τα ευρήματα πρόσφατων μελετών δείχνουν την προτίμησή τους για αλγορίθμους μηχανικής μάθησης και τη χρήση συνεχών τιμών γονιδιακής έκφρασης αντί για δυαδικές τιμές. Ωστόσο, λόγω των περιορισμών της Μηχανικής Μάθησης και των μη δυαδικών τιμών, έγιναν προσπάθειες για την παραγωγή νέων υβριδικών τεχνικών που εκμεταλλεύονται τα πλεονεκτήματα των στατιστικών μεθόδων και των διακριτών τιμών. Σκοπός της παρούσας μελέτης ήταν να προσδιοριστεί η πιο αποτελεσματική προσέγγιση για την ανάλυση μονοπατιών με τη χρήση διαθέσιμων εργαλείων και να συγκριθούν τα αποτελέσματα με προηγούμενες έρευνες. Αυτό επιτεύχθηκε με την υλοποίηση της μεθοδολογίας βαθμολόγησης των μονοπατιών που χρησιμοποιούν διάφορα εργαλεία ανάλυσης μονοπατιών και τη χρήση ενός αλγορίθμου δέντρων αποφάσεων για την αξιολόγηση των αποτελεσμάτων. Τα εργαλεία που επιλέχθηκαν για εφαρμογή ήταν τα TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath και HiPathia, μεταξύ των οποίων το PRS παρουσίασε το υψηλότερο ποσοστό ακρίβειας, ενώ το HiPathia, το οποίο είχε εξίσου καλές επιδόσεις, πέτυχε τον μικρότερο χρόνο εκτέλεσης- συνολικά, οι τεχνικές που βασίζονται στη Μηχανική Μάθηση υπερείχαν έναντι εκείνων που βασίζονται στη στατιστική. Τα αποτελέσματα που προέκυψαν συνάδουν με την υπάρχουσα βιβλιογραφία, η οποία έχει δείξει ότι τα μη δυαδικά δεδομένα περιέχουν περισσότερες πληροφορίες και ότι οι μέθοδοι μηχανικής μάθησης προσφέρουν νέες ευκαιρίες για χρήση στον τομέα της υγείας. Δυστυχώς, ένα σημαντικό ζήτημα που εμπόδισε την έρευνά μας να εξάγει σημαντικά κοινά υπο-μονοπάτια μεταξύ των διαφορετικών μεθόδων σχετίζεται πιθανώς με το γεγονός ότι υπάρχουν πολλές διαθέσιμες γονιδιωματικές πλατφόρμες- ως αποτέλεσμα, τα γονίδια δεν παρουσιάζουν αντιστοιχίσεις μεταξύ διαφορετικών συνόλων δεδομένων.el
dc.languageΑγγλικάel
dc.languageEnglishen
dc.publisherΕΛ.ΜΕ.ΠΑ., ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ (ΣΜΗΧ), Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
dc.publisherΗ.Μ.U, School of Engineering (ScENG), Electrical and Computer Engineering Depten
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.titleGene expression and gene regulatory network analysis with statistical methods and machine learning algorithms.en
dc.titleΑνάλυση εκφράσεων γονιδίων και ρυθμιστικών δικτύων γονιδίων με στατιστικές μεθόδους και αλγορίθμους μηχανικής μάθησης.el

healMeta

heal.creatorNameDroumalia, Foteinien
heal.creatorNameΔρουμαλιά, Φωτεινήel
heal.publicationDate2023-04-10
heal.identifier.primaryhttp://hdl.handle.net/20.500.12688/10531
heal.abstractDetermining the best approach and data type for Pathway Analysis is a significant difficulty for the field of diagnostic medicine. The findings of recent studies indicate their preference for Machine Learning algorithms and the utilization of continuous gene expression values rather than binary values. However, due to the limitations of Machine Learning and non-binary values, there were efforts to produce new hybrid techniques that exploit the benefits of statistical methods and discrete values. The purpose of this study was to identify the most effective approach for Pathway Analysis utilizing currently available tools and to compare the results to previous research. This was accomplished by implementing the scoring methodology for several Pathway Analysis tools and employing a Decision Tree algorithm to assess the outcomes. The tools selected for implementation were TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath and HiPathia, among which PRS displayed the highest rate of accuracy, while HiPathia, which performed equally well, achieved the shortest execution time; overall, Machine Learning-based techniques outperformed those based on statistics. The outcomes obtained are consistent with prior literature, which have shown that non-binary data hold more information and that Machine Learning methods offer new opportunities for use in health. Unfortunately, a major issue that prevented our re-search from extracting common significant sub-pathways among the tools is probably related to the fact that there are numerous genomic platforms available; as a result genes cannot be recognized across different datasets.en
heal.abstractΟ καθορισμός της καλύτερης προσέγγισης και του βέλτιστου τύπου δεδομένων για την ανάλυση μονοπατιών αποτελεί σημαντική δυσκολία για τον τομέα της διαγνωστικής ιατρικής. Τα ευρήματα πρόσφατων μελετών δείχνουν την προτίμησή τους για αλγορίθμους μηχανικής μάθησης και τη χρήση συνεχών τιμών γονιδιακής έκφρασης αντί για δυαδικές τιμές. Ωστόσο, λόγω των περιορισμών της Μηχανικής Μάθησης και των μη δυαδικών τιμών, έγιναν προσπάθειες για την παραγωγή νέων υβριδικών τεχνικών που εκμεταλλεύονται τα πλεονεκτήματα των στατιστικών μεθόδων και των διακριτών τιμών. Σκοπός της παρούσας μελέτης ήταν να προσδιοριστεί η πιο αποτελεσματική προσέγγιση για την ανάλυση μονοπατιών με τη χρήση διαθέσιμων εργαλείων και να συγκριθούν τα αποτελέσματα με προηγούμενες έρευνες. Αυτό επιτεύχθηκε με την υλοποίηση της μεθοδολογίας βαθμολόγησης των μονοπατιών που χρησιμοποιούν διάφορα εργαλεία ανάλυσης μονοπατιών και τη χρήση ενός αλγορίθμου δέντρων αποφάσεων για την αξιολόγηση των αποτελεσμάτων. Τα εργαλεία που επιλέχθηκαν για εφαρμογή ήταν τα TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath και HiPathia, μεταξύ των οποίων το PRS παρουσίασε το υψηλότερο ποσοστό ακρίβειας, ενώ το HiPathia, το οποίο είχε εξίσου καλές επιδόσεις, πέτυχε τον μικρότερο χρόνο εκτέλεσης- συνολικά, οι τεχνικές που βασίζονται στη Μηχανική Μάθηση υπερείχαν έναντι εκείνων που βασίζονται στη στατιστική. Τα αποτελέσματα που προέκυψαν συνάδουν με την υπάρχουσα βιβλιογραφία, η οποία έχει δείξει ότι τα μη δυαδικά δεδομένα περιέχουν περισσότερες πληροφορίες και ότι οι μέθοδοι μηχανικής μάθησης προσφέρουν νέες ευκαιρίες για χρήση στον τομέα της υγείας. Δυστυχώς, ένα σημαντικό ζήτημα που εμπόδισε την έρευνά μας να εξάγει σημαντικά κοινά υπο-μονοπάτια μεταξύ των διαφορετικών μεθόδων σχετίζεται πιθανώς με το γεγονός ότι υπάρχουν πολλές διαθέσιμες γονιδιωματικές πλατφόρμες- ως αποτέλεσμα, τα γονίδια δεν παρουσιάζουν αντιστοιχίσεις μεταξύ διαφορετικών συνόλων δεδομένων.el
heal.languageΑγγλικάel
heal.languageEnglishen
heal.academicPublisherΕΛ.ΜΕ.ΠΑ., ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ (ΣΜΗΧ), Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
heal.academicPublisherΗ.Μ.U, School of Engineering (ScENG), Electrical and Computer Engineering Depten
heal.titleGene expression and gene regulatory network analysis with statistical methods and machine learning algorithms.en
heal.titleΑνάλυση εκφράσεων γονιδίων και ρυθμιστικών δικτύων γονιδίων με στατιστικές μεθόδους και αλγορίθμους μηχανικής μάθησης.el
heal.typeΠτυχιακή Εργασίαel
heal.typeBachelor thesisen
heal.keywordalgorithm, machine learning, gene regulatory networks, gene expressionen
heal.keywordαλγόριθμος, μηχανική μάθηση, γονιδιακά ρυθμιστικά δίκτυα, γονιδιακή έκφρασηel
heal.accessfreeel
heal.advisorNameTsiknakis, Emmanouilen
heal.advisorNameΤσικνάκης, Εμμανουήλel
heal.academicPublisherIDΕΛ.ΜΕ.ΠΑ. Ελληνικό Μεσογειακό Πανεπιστήμιοel
heal.academicPublisherIDΗ.Μ.U Hellenic Mediterranean University‎en
heal.fullTextAvailabilitytrueel
tcd.distinguishedfalseel
tcd.surveyfalseel


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States