Implementation of suffix tree construction using Hadoop MapReduce Full text

Alexandros Konstantinakis - Karmis
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, ΕΜΠ
2010
Διπλωματική Εργασία
Περίληψη. Τα δέντρα επιθεμάτων χρησιμοποιούνται ως ευρετήρια για ακολουθίες βιολογικών δεδομένων. Η χρήση τους είναι απαραίτητη σε αλγορίθμους αναζήτησης που χρησιμοποιούνται στη βιολογία. Τα τελευταία χρόνια ο όγκος των βιολογικών δεδομένων αυξάνεται συνεχώς λόγω των εξελίξεων της επιστήμης. Στο πλαίσιο της διπλωματικής μελετήθηκαν οι κυριότεροι αλγόριθμοι για κατασκευή δέντρων επιθεμάτων στη μνήμη, στον σκληρό δίσκο και σε παράλληλους υπολογιστές. Έπειτα, υλοποιήθηκαν αλγόριθμοι παράλληλης κατασκευής δέντρων επιθεμάτων με χρήση της τεχνολογίας Hadoop MapReduce έχοντας ως βάση τη μέθοδο Trellis, της πιο αποτελεσματικής τεχνικής κατασκευής δέντρων επιθεμάτων στο σκληρό δίσκο. Τέλος πραγματοποιήθηκαν μετρήσεις, οι οποίες δείχνουν τη συμπεριφορά των αλγορίθμων σε παράλληλη εκτέλεση.