Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Προγραμματισμός Υπολογιστών Γλώσσες

Εισαγωγή στις τεχνικές ταξινόμησης στη Βιοπληροφορική

Βιοπληροφορική είναι η εφαρμογή των τεχνικών της επιστήμης των υπολογιστών στο πεδίο της βιολογίας . Οι στόχοι της βιοπληροφορικής είναι να βοηθήσει τους επιστήμονες ζωή στην οργάνωση βιολογικών δεδομένων και την ανάπτυξη των απαραίτητων εργαλείων πληροφορικής για την ανακάλυψη νέων επιστημονικών υποθέσεων . Τεχνικές ταξινόμησης , επίσης γνωστή ως τεχνικές ομαδοποίησης , είναι σημαντικές στη βιοπληροφορική , όπως αυτές επιτρέπουν την διαχωριστική διαφόρων βιολογικών δεδομένων με παρόμοιες ιδιότητες σε διακριτές ομάδες . Ιστορία
Η

Το μέγεθος των βιολογικών δεδομένων αυξάνεται με γεωμετρική πρόοδο, με το διπλασιασμό των πληροφοριών που παρατηρείται κάθε 15 μήνες. Ως αποτέλεσμα , τα επιστήμη των υπολογιστών και της πληροφορικής τεχνικές που χρησιμοποιούνται εντατικά στην επεξεργασία και τη διαχείριση των βιολογικών δεδομένων . Η πιο θεμελιώδης έννοια στη βιοπληροφορική είναι ότι τα περισσότερα βιολογικά δεδομένα έχουν κοινά χαρακτηριστικά και μπορούν να χωριστούν σε ομάδες . Για παράδειγμα , τα γονίδια ενός οργανισμού μπορούν να ταξινομηθούν σε λειτουργικές ομάδες τους ή μεταβολικές οδούς . Πρωτεΐνες μπορούν επίσης να ταξινομούνται με βάση τα γονίδια που εκφράζονται . Τεχνικές ταξινόμησης ή ομαδοποίησης είναι αναγκαίες για τη διαχείριση των τεράστιων βάσεων δεδομένων των γενετικών και βιολογικών δεδομένων . Υπάρχουν δύο βασικοί τύποι των τεχνικών ταξινόμησης στη βιοπληροφορική : . Το ιεραρχικό και οι τεχνικές ταξινόμησης k - Μέσα
εικόνων Ιεραρχική Ταξινόμηση
Η

Η τεχνική ιεραρχικής ταξινόμησης οργανώνει βιολογικών δεδομένων σε ένα δενδροειδή δομή δεδομένων . Τα γονίδια εκφράζονται ως κόμβοι στο δέντρο , ενώ κάθε υπο - δέντρο των κόμβων αποτελεί ένα σύμπλεγμα ή ομαδοποίηση των γονιδίων . Το δέντρο μπορεί να είναι είτε ριζωμένα ή μη ριζικά . Ένα δέντρο με ρίζα ορίζεται ως ένα δέντρο με ένα μόνο κόμβο στην κορυφή . Αντίθετα, μια μη ριζικά δέντρο έχει πολλούς κορυφαίους κόμβους .

Η k -Means Ταξινόμηση
Η

Μια τεχνική πιο περίπλοκη ταξινόμηση είναι η ταξινόμηση k -Means , η οποία επιχειρεί να βρείτε μια σειρά από κέντρα που ελαχιστοποιούν την πλατεία παραμόρφωση σφάλματος μεταξύ των συνόλων δεδομένων στο πολυδιάστατο χώρο . Ένα σύμπλεγμα χαρακτηρίζεται από την ομαδοποίηση των σχετικών σημείων στο πλησιέστερο κέντρο τους . Ο αλγόριθμος Lloyd συχνά χρησιμοποιείται στην τεχνική ταξινόμησης k- Μέσα . Σε αυτόν τον αλγόριθμο , τα σημεία δεδομένων τυχαία τοποθετημένα σε ξεχωριστές δέσμες , οι οποίες στη συνέχεια βελτιστοποιημένος για να παράγει τις ελάχιστες τοπικές στρεβλώσεις τετραγωνικό σφάλμα .
Εικόνων Σημασία
Η

Μετά από σχετικές πρωτεΐνες έχουν κατατάσσονται σε παρόμοιες ομάδες , οι επιστήμονες της ζωής μπορεί να χρησιμοποιήσει αυτές τις πληροφορίες για να προβλέψει τις ιδιότητες ορισμένων λιγότερο μελετηθεί πρωτεΐνες . Αυτό ισχύει επίσης και σε άλλες πτυχές της δομής των πρωτεϊνών. Μία άλλη χρήση των τεχνικών ταξινόμησης είναι να λύσει το πρόβλημα του προσδιορισμού της εξελικτικό δέντρο ορισμένων οργανισμών με βάση γενετικές αλληλουχίες τους. Το εξελικτικό δέντρο που κατασκευάζεται από την αλληλουχία του DNA του οργανισμού χρησιμοποιώντας είτε ιεραρχική ή τεχνικές ταξινόμησης k -Means .
Εικόνων Εκτιμήσεις
Η

Ιεραρχική τεχνική ταξινόμησης είναι μια σχετικά απλή και αποτελεσματική τον τρόπο ομαδοποίησης των βιολογικών δεδομένων . Σε αντίθεση , δεν υπάρχει αποτελεσματική αλγόριθμος υφίσταται κατά τη στιγμή της γραφής που είναι σε θέση να εκτελέσει την τεχνική ταξινόμησης k- ουσιαστικά σημαίνει , όπως το μέγεθος των βιολογικών δεδομένων αυξάνεται . Αυτό υποδεικνύει ότι μια μεγάλη υπολογιστική ισχύ είναι συχνά απαιτείται για την εκτέλεση ταξινόμηση k -Means , η οποία είναι ένας σημαντικός παράγοντας για να εξετάσει κατά την επιλογή της τεχνικής ταξινόμησης για χρήση σε εφαρμογές βιοπληροφορικής .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα