Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Perl Προγραμματισμός

Τρόπος εξαγωγής των εγγραφών από πολλαπλές Fasta

ΡΑδΤΑ είναι μια μορφή κειμένου με βάση χρησιμοποιούνται στη βιοπληροφορική για την αναπαράσταση ακολουθιών , ιδιαίτερα εκείνων των νουκλεοτιδίων και πεπτιδίων , με ζεύγη βάσεων αντιπροσωπεύεται από ένα μόνο γράμμα . Μία αλληλουχία FASTA αποτελείται από μια περιγραφή μίας γραμμής, διακρίνεται από ένα " μεγαλύτερο από" σύμβολο στην πρώτη γραμμή , που ακολουθείται από ένα νουκλεοτίδιο πολλαπλών γραμμών ή πεπτιδική αλληλουχία . Μπορείτε να εξαγάγετε πολλαπλές σειρές από ένα αρχείο ΡΑδΤΑ χρήση ειδικών μονάδων , ή add- ons , με τη γλώσσα προγραμματισμού Perl , που είναι γνωστή ως BioPerl , που έχουν αναπτυχθεί ειδικά για να χειριστεί τη μορφή FASTA . Μπορείτε επίσης να κωδικοποιήσει το χέρι ένα σενάριο Perl για να ταιριάζει με τα πρότυπα σε ένα αρχείο ή να χρησιμοποιήσετε άλλα διαθέσιμα εργαλεία για να εξαγάγετε αλληλουχιών FASTA . Τα πράγματα που θα χρειαστείτε
αρχείο ΡΑδΤΑ
Perl συντάκτης
BioPerl
ActiveState Perl
Biopieces
Η Εμφάνιση Περισσότερες οδηγίες
Η 1

Εκκίνηση Perl σας εφαρμογή επεξεργασίας . Μπορείτε να χρησιμοποιήσετε ένα απλό επεξεργαστή κειμένου , όπως το Notepad . Θα πρέπει να αποθηκεύσετε το αρχείο με ένα " . Pl " επέκταση για να δείξει ότι είναι ένα πρόγραμμα Perl . 2

Απόσπασμα μια αλληλουχία από ένα αρχείο πολλαπλών ΡΑδΤΑ εκτελώντας πρότυπο αντιστοίχισης σε Perl , πληκτρολογώντας τον ακόλουθο κώδικα στον επεξεργαστή !

# /usr /bin /perlmy $ fasta_seq = στροφή ? $ μου ακολουθία = βάρδια ? $ μου workfile = ` cat $ fasta_seq ` ? μου ( fasta_seq $ ) = $ workfile = ~ /( > $ ακολουθία [ ^ > ] + ) /s ? εκτυπώσετε $ fasta_seq ?
εικόνων 3

Απόσπασμα τις αλληλουχίες από το αρχείο χρησιμοποιώντας FASTA BioPerl . Μπορείτε να εξαγάγετε πολλαπλές ακολουθίες πληκτρολογώντας τον ακόλουθο κώδικα στον επεξεργαστή :

# /bin /perl -w

χρησιμοποιούν Βιογραφικό :: SeqIO ?

$ Sequenceobject = Bio ! :: SeqIO - > νέο ( - file = > " fasta_file_path " , - format = > " fasta ")?

Το Βιογραφικό :: μονάδα SeqIO παρέχει απρόσκοπτη επεξεργασία ακολουθίας . Μπορείτε να ανακτήσετε μια ενιαία ακολουθία χρησιμοποιώντας την ακόλουθη δήλωση :

$ retrievedsequence = $ sequenceobject - > next_seq ?

Μπορείτε να βρόχο μέσα από το αντικείμενο και να ανακτήσετε πολλαπλές ακολουθίες , ως εξής :

ενώ ( $ retrievedsequence = $ sequenceobject - > next_seq ) {print $ retrievedsequence - > επ. , " \\ n" ? }
Η 4

Απόσπασμα τις αλληλουχίες από το αρχείο ΡΑδΤΑ χρησιμοποιώντας το " Biopieces " εφαρμογή , η οποία είναι ένα πλαίσιο που περιέχει σύνολο αρθρωτών εργαλείων για το χειρισμό των δεδομένων βιοπληροφορικής . Μπορείτε να εκτελέσετε Biopieces σας εντολή στη γραμμή εντολών

read_fasta -i fasta_file

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα