Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Python Προγραμματισμός

Πώς να γράψετε ένα e-mail για Miner Python

Mining ηλεκτρονικού ταχυδρομείου είναι ένα μέσο άντλησης πληροφοριών , όπως τον αριθμό των λέξεων , προτάσεων , ή τον πλούτο του λεξιλογίου ανταποκριτή σας , από το κείμενο του e-mail . Γράφοντας ένα e-mail με ανθρακωρύχος Python απαιτεί πολλές " κινούμενα μέρη " , με τη μορφή των επεκτάσεων Python , που ονομάζονται πακέτα , ότι τα μηνύματα λήψη αλληλογραφίας εκτός των servers . Τα μηνύματα μετατρέπονται σε strings , έτσι ώστε άλλα πακέτα Python μπορεί να τα αναλύσει και να εμφανίσει ό, τι βρίσκουν . Πρόκειται για μια εξαιρετικά πολύπλοκη εργασία που απαιτεί κάτι περισσότερο από μια περαστική περιστασιακή γνώση προγραμματισμού Python . Ως εκ τούτου , να προχωρήσει με προσοχή και υπομονή . Τα πράγματα που θα χρειαστείτε
σύνδεση Internet Ξενοδοχεία Python 2.6 ή νεότερη έκδοση
NLTK Πακέτο Python
Η Εμφάνιση Περισσότερες οδηγίες
Η

1 Ανοίξτε μια περίοδο λειτουργίας τερματικού και πληκτρολογήστε python - v στη γραμμή για να βεβαιωθείτε ότι έχετε την Python 2.6 ή νεότερη έκδοση , αλλά όχι 3.0 ή νεότερη έκδοση . Οι εκδόσεις 2.6 ή 2.7 είναι ιδανικά , επειδή είναι συμβατές με NLTK και PyYAML . Επισκεφθείτε τη σελίδα ευρετηρίου πακέτων Python ? Βρείτε και να κατεβάσετε τα πακέτα PyYAML και NLTK . Αποσυμπιέστε /untar τους . Αλλάξτε τον κατάλογο σας στον κατάλογο PyYAML . Στη γραμμή εντολών τύπου προτροπή σε : sudo python setup.py εγκατάσταση . Θα πρέπει να μοιάζει κάπως έτσι :

My- Computer : PyYAML - 3.2.0 Me $ sudo python setup.py εγκαταστήσετε

Θα σας ζητηθεί ένας κωδικός πρόσβασης . Πληκτρολογήστε το και πατήστε το πλήκτρο επιστροφής . Ακολουθήστε αυτή τη διαδικασία για κάθε πακέτο που εγκαθιστάτε Python 2

Λήψη μηνυμάτων ηλεκτρονικού ταχυδρομείου για την ανάλυση με τις παρακάτω γραμμές κώδικα : . !

# /Usr /local /bin /python

poplib εισαγωγής , GETPASS , sys , mailconfig

mailserver = mailconfig.popservername

MailUser = mailconfig.popusername

mailpasswd = getpass.getpass ( « κωδικό πρόσβασης για % s ; % mailserver )

διακομιστή = msgBytes = server.stat ( )

print (' Υπάρχουν » , msgCount , « μηνύματα ηλεκτρονικού ταχυδρομείου σε ' , msgBytes , « bytes )

εκτύπωσης ( server.list ( ) )

print (' - ' * 80 )

input (' [ Πατήστε το πλήκτρο Enter ] » )

για i in range ( msgCount ) :

hdr , μήνυμα , οκτάδες = server.retr ( i +1 )

για τη γραμμή στο μήνυμα : print ( line.decode ( ) )

διαβάσει («-» * 80 )

αν i

Αυτό το σενάριο θα συνδεθεί με pop3 e-mail server σας , σας ζητήσει το όνομα χρήστη και τον κωδικό πρόσβασής σας , μετρήστε τον αριθμό των μηνυμάτων στο διακομιστή και να τα διαβάσετε στη μνήμη

Η 3

Mine μηνύματα ηλεκτρονικού ταχυδρομείου σας με τη μετατροπή κάθε μήνυμα σε μια σειρά , μια εγγενή τύπο δεδομένων σε Python , που μπορούν να αναζητηθούν με τις μεθόδους της Python εγχόρδων , κανονική μηχανή έκφρασης , και φυσικά Toolkit Γλώσσα :

m = msgCount [ 1 ] Ξενοδοχεία

s = str ( m )

από email.parser Parser εισαγωγής

εισαγωγή NLTK

εκ νέου εισαγωγής
Η 4

Mine το πρώτο μήνυμα για κάθε πληροφορία που μας ενδιαφέρει. Ανακαλύψτε πώς τα πολλά λόγια είναι σε αυτό το μήνυμα πληκτρολογώντας την ακόλουθη εντολή :

>>>> len ( s )

θα επιστρέψει μια ακέραια τιμή για τον αριθμό των λέξεων . Για να βρείτε κάθε πρόταση με τη λέξη υποθήκη , πληκτρολογήστε την ακόλουθη εντολή NLTK :

>>>> s.concordance ( « υποθήκη » )

Αυτό θα επιστρέψει κάθε πρόταση με την λέξη υποθήκη σε αυτό? πολύ χρήσιμο για ντετέκτιβ διερεύνηση της απάτης υποθηκών
Η
εικόνων .

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα