Advanced search and data management services in Life Sciences Full text

Thanasis Vergoulis
National Technical University of Athens, Greece
2014
Διδακτορική Διατριβή
Περίληψη. Η ανάγκη για προσεγγίσεις διαχείρισης και επεξεργασίας δεδομένων στις βιοεπιστήμες γίνεται εντονότερη λόγω των συνεχών τεχνολογικών εξελίξεων στις μηχανές που παράγουν δεδομένα από βιολογικά δείγματα. Στη σημερινή εποχή, αυτές οι μηχανές παράγουν τεράστιους όγκους δεδομένων τα οποία οφείλουν να επεξεργαστούν. Η πλειοψηφία αυτών των δεδομένων αναπαρίστανται ως ακολουθίες και η επεξεργασία τους συνίσταται, κυρίως, στην εφαρμογή αλγορίθμων στοίχισης ακολουθιών πάνω σε αυτές. Οι αλγόριθμοι αιχμής για στοίχιση ακολουθιών αποτυγχάνουν να αποδώσουν καλά για τόσο μεγάλα δεδομένα, έτσι, η εισαγωγή νέων προσεγγίσεων είναι απαραίτητη. Η κατάσταση γίνεται ακόμα δυσκολότερη καθώς νέα ευρήματα μερικές φορές δημιουργούν καινούριες ανάγκες επεξεργασίας που δεν μπορούν να ικανοποιηθούν μετασχηματίζοντας τις ήδη υπάρχουσες προσεγγίσεις. Και πάλι νέες μέθοδοι απαιτούνται. Τέλος, νέα ραγδαία εξελισσόμενα πεδία στις βιοεπισ τήμες, όπως αυτό των μορίων miRNA παρουσιάζουν έλλειψη από κεντρικές υπηρεσίες πληροφόρησης. Η γνώση σε αυτά τα πεδία είναι διασκορπισμένη σε ένα μεγάλο πλήθος επιστημονικών δημοσιεύσεων επιβραδύνοντας την εργασία των ερευνητών.