Gene expression and gene regulatory network analysis with statistical methods and machine learning algorithms.
Ανάλυση εκφράσεων γονιδίων και ρυθμιστικών δικτύων γονιδίων με στατιστικές μεθόδους και αλγορίθμους μηχανικής μάθησης.
Προβολή/ Άνοιγμα
Ημερομηνία
2023-04-10Συγγραφέας
Droumalia, Foteini
Δρουμαλιά, Φωτεινή
Μεταδεδομένα
Εμφάνιση πλήρους εγγραφήςΕπιτομή
Determining the best approach and data type for Pathway Analysis is a significant difficulty for the field of diagnostic medicine. The findings of recent studies indicate their preference for Machine Learning algorithms and the utilization of continuous gene expression values rather than binary values. However, due to the limitations of Machine Learning and non-binary values, there were efforts to produce new hybrid techniques that exploit the benefits of statistical methods and discrete values. The purpose of this study was to identify the most effective approach for Pathway Analysis utilizing currently available tools and to compare the results to previous research. This was accomplished by implementing the scoring methodology for several Pathway Analysis tools and employing a Decision Tree algorithm to assess the outcomes. The tools selected for implementation were TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath and HiPathia, among which PRS displayed the highest rate of accuracy, while HiPathia, which performed equally well, achieved the shortest execution time; overall, Machine Learning-based techniques outperformed those based on statistics. The outcomes obtained are consistent with prior literature, which have shown that non-binary data hold more information and that Machine Learning methods offer new opportunities for use in health. Unfortunately, a major issue that prevented our re-search from extracting common significant sub-pathways among the tools is probably related to the fact that there are numerous genomic platforms available; as a result genes cannot be recognized across different datasets. Ο καθορισμός της καλύτερης προσέγγισης και του βέλτιστου τύπου δεδομένων για την ανάλυση μονοπατιών αποτελεί σημαντική δυσκολία για τον τομέα της διαγνωστικής ιατρικής. Τα ευρήματα πρόσφατων μελετών δείχνουν την προτίμησή τους για αλγορίθμους μηχανικής μάθησης και τη χρήση συνεχών τιμών γονιδιακής έκφρασης αντί για δυαδικές τιμές. Ωστόσο, λόγω των περιορισμών της Μηχανικής Μάθησης και των μη δυαδικών τιμών, έγιναν προσπάθειες για την παραγωγή νέων υβριδικών τεχνικών που εκμεταλλεύονται τα πλεονεκτήματα των στατιστικών μεθόδων και των διακριτών τιμών. Σκοπός της παρούσας μελέτης ήταν να προσδιοριστεί η πιο αποτελεσματική προσέγγιση για την ανάλυση μονοπατιών με τη χρήση διαθέσιμων εργαλείων και να συγκριθούν τα αποτελέσματα με προηγούμενες έρευνες. Αυτό επιτεύχθηκε με την υλοποίηση της μεθοδολογίας βαθμολόγησης των μονοπατιών που χρησιμοποιούν διάφορα εργαλεία ανάλυσης μονοπατιών και τη χρήση ενός αλγορίθμου δέντρων αποφάσεων για την αξιολόγηση των αποτελεσμάτων. Τα εργαλεία που επιλέχθηκαν για εφαρμογή ήταν τα TAPPA, PRS, TEAK, DEAP, GraphiteWeb, MinePath και HiPathia, μεταξύ των οποίων το PRS παρουσίασε το υψηλότερο ποσοστό ακρίβειας, ενώ το HiPathia, το οποίο είχε εξίσου καλές επιδόσεις, πέτυχε τον μικρότερο χρόνο εκτέλεσης- συνολικά, οι τεχνικές που βασίζονται στη Μηχανική Μάθηση υπερείχαν έναντι εκείνων που βασίζονται στη στατιστική. Τα αποτελέσματα που προέκυψαν συνάδουν με την υπάρχουσα βιβλιογραφία, η οποία έχει δείξει ότι τα μη δυαδικά δεδομένα περιέχουν περισσότερες πληροφορίες και ότι οι μέθοδοι μηχανικής μάθησης προσφέρουν νέες ευκαιρίες για χρήση στον τομέα της υγείας. Δυστυχώς, ένα σημαντικό ζήτημα που εμπόδισε την έρευνά μας να εξάγει σημαντικά κοινά υπο-μονοπάτια μεταξύ των διαφορετικών μεθόδων σχετίζεται πιθανώς με το γεγονός ότι υπάρχουν πολλές διαθέσιμες γονιδιωματικές πλατφόρμες- ως αποτέλεσμα, τα γονίδια δεν παρουσιάζουν αντιστοιχίσεις μεταξύ διαφορετικών συνόλων δεδομένων.
Συλλογές
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:
Αυτός ο ιστότοπος χρησιμοποιεί cookies για την λειτουργία του.
Συνέχεια
Περισσότερες πληροφορίες