1 Κατεβάστε και εγκαταστήστε τη μονάδα Python Φυσικής Γλώσσας Toolkit από την ιστοσελίδα του προγράμματος ntlk.org . Μπορεί να χρειαστεί να εγκαταστήσετε πρόσθετες ενότητες για την υποστήριξη NLTK . 2
Ανοίξτε ένα παράθυρο τερματικού και να ξεκινήσετε μια συνεδρία Python Python πληκτρολογώντας στη γραμμή εντολών . Όταν η Python είναι σε πλήρη λειτουργία , να επικαλείται την ενότητα NLTK με την εντολή NLTK εισαγωγής . Οι προτροπές και εντολές μοιάζει με αυτό στο Mac OS X :
My - MacBook -Pro : ~ ΡΝΑ1 $ python
Python 2.6.1 ( r261 : 67515 , 24 Ιουνίου, 2010 , 21:47 : 49 )
[ GCC 4.2.1 ( την Apple Inc οικοδομήσουμε 5646 ) ] για darwin
τύπου " βοήθεια " , " πνευματικής ιδιοκτησίας" , " μονάδες " ή "άδεια " για περισσότερες πληροφορίες .
>>> εισαγωγής NLTK
>>>
εικόνων 3
Επικαλεστείτε το μέρος του λόγου tagger και εισάγετε την ποινή που θέλετε να εντοπίσετε ουσιαστικά πληκτρολογώντας τις ακόλουθες εντολές και τα δεδομένα στη γραμμή Python : >>>
text = nltk.word_tokenize ( " . Ο άνθρωπος διασχίζει το δρόμο για την πώληση σταυρούς " )
>>> nltk.pos_tag (κείμενο )
Η
4 Πατήστε το πλήκτρο επιστροφής μετά >>> nltk.pos_tag (κείμενο )
[ ,">
>>> nltk.pos_tag (keímeno )
I̱
4 Patí̱ste to plí̱ktro epistrofí̱s metá >>> nltk.pos_tag (keímeno )
[ ( «Η » , « DT » ) , ( «άνθρωπος» , « ΝΝ » ) , ( « διασχίζει » , « VBZ » ) , ( «η» , « DT » ) , ( « του δρόμου» , « ΝΝ » ) , ( 'σε' , 'TO ' ) , ( « sell » , « VB » ) , ( « διασχίζει » , « NNS ' ) , ( '. ' , '. ' ) ] Ξενοδοχεία
>> >
NLTK έχει ετικέτα σωστά κάθε λέξη στην πρόταση . Συγκεκριμένα , έχει εντοπίσει τα ουσιαστικά και τα χαρακτηρισμένες ως μοναδική ουσιαστικά με NN ( άνθρωπος , οδός) και ουσιαστικά πληθυντικού αριθμού πληθυντικού με NNS ( σταυρούς ) και έχει σημαδέψει σωστά την πρώτη εμφάνιση των σταυρών ως ρήμα με το VBZ ετικέτα .
εικόνων
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα