Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Python Προγραμματισμός

Πώς να ανιχνεύσει Ουσιαστικά σε Python

Ανίχνευση ουσιαστικά στην Python καλεί τις ικανότητες ενός προγραμματιστή και γλωσσολόγος . Η ίδια η αγγλική γλώσσα καθορίζει παγίδες για τους ατρόμητους υπολογιστική γλωσσολόγος με πλούσια μορφολογικά η αμφισημία της . Για παράδειγμα , η λέξη " διασχίζει " θα μπορούσε να είναι ένα ουσιαστικό στον πληθυντικό ή σε ένα τρίτο πρόσωπο σημερινή τεταμένη ρήμα . Ευτυχώς , οι δημιουργοί της Φυσικής Γλώσσας Ενότητα Python Toolkit έχουν αναπτύξει μια επισημειωτή μερών του λόγου που αντιπροσωπεύει γι 'αυτές τις δυσκολίες και να επισημάνετε τις λέξεις της αγγλικής φράσεις με αντίστοιχα μέρη του λόγου , συμπεριλαμβανομένης ουσιαστικά . Τα πράγματα που θα χρειαστείτε
Python 2.4 , 2.5 , 2.6 ή
Φυσικής Γλώσσας Toolkit Python Module
Η Εμφάνιση Περισσότερες οδηγίες
Η

1 Κατεβάστε και εγκαταστήστε τη μονάδα Python Φυσικής Γλώσσας Toolkit από την ιστοσελίδα του προγράμματος ntlk.org . Μπορεί να χρειαστεί να εγκαταστήσετε πρόσθετες ενότητες για την υποστήριξη NLTK . 2

Ανοίξτε ένα παράθυρο τερματικού και να ξεκινήσετε μια συνεδρία Python Python πληκτρολογώντας στη γραμμή εντολών . Όταν η Python είναι σε πλήρη λειτουργία , να επικαλείται την ενότητα NLTK με την εντολή NLTK εισαγωγής . Οι προτροπές και εντολές μοιάζει με αυτό στο Mac OS X :

My - MacBook -Pro : ~ ΡΝΑ1 $ python

Python 2.6.1 ( r261 : 67515 , 24 Ιουνίου, 2010 , 21:47 : 49 )

[ GCC 4.2.1 ( την Apple Inc οικοδομήσουμε 5646 ) ] για darwin

τύπου " βοήθεια " , " πνευματικής ιδιοκτησίας" , " μονάδες " ή "άδεια " για περισσότερες πληροφορίες .

>>> εισαγωγής NLTK

>>>
εικόνων 3

Επικαλεστείτε το μέρος του λόγου tagger και εισάγετε την ποινή που θέλετε να εντοπίσετε ουσιαστικά πληκτρολογώντας τις ακόλουθες εντολές και τα δεδομένα στη γραμμή Python : >>>

text = nltk.word_tokenize ( " . Ο άνθρωπος διασχίζει το δρόμο για την πώληση σταυρούς " )

>>> nltk.pos_tag (κείμενο )
Η

4 Πατήστε το πλήκτρο επιστροφής μετά >>> nltk.pos_tag (κείμενο )

[ ,">

>>> nltk.pos_tag (keímeno )

4 Patí̱ste to plí̱ktro epistrofí̱s metá >>> nltk.pos_tag (keímeno )

[ ( «Η » , « DT » ) , ( «άνθρωπος» , « ΝΝ » ) , ( « διασχίζει » , « VBZ » ) , ( «η» , « DT » ) , ( « του δρόμου» , « ΝΝ » ) , ( 'σε' , 'TO ' ) , ( « sell » , « VB » ) , ( « διασχίζει » , « NNS ' ) , ( '. ' , '. ' ) ] Ξενοδοχεία

>> >

NLTK έχει ετικέτα σωστά κάθε λέξη στην πρόταση . Συγκεκριμένα , έχει εντοπίσει τα ουσιαστικά και τα χαρακτηρισμένες ως μοναδική ουσιαστικά με NN ( άνθρωπος , οδός) και ουσιαστικά πληθυντικού αριθμού πληθυντικού με NNS ( σταυρούς ) και έχει σημαδέψει σωστά την πρώτη εμφάνιση των σταυρών ως ρήμα με το VBZ ετικέτα .


εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα