λογισμικό

* Γνώση Υπολογιστών >> λογισμικό >> Ανοικτού κώδικα

Ο κώδικας σε MATLAB για OCR

MATLAB είναι ένα αρκτικόλεξο για " εργαστήριο μήτρα» και αναφέρεται σε μια υψηλού επιπέδου γλώσσα προγραμματισμού και το περιβάλλον προγραμματισμού που αναπτύχθηκε από την τεχνική MathWorks εταιρεία λογισμικού ηλεκτρονικών υπολογιστών . OCR είναι μια συντομογραφία για το « οπτικής αναγνώρισης χαρακτήρων » και αναφέρεται στη διαδικασία της ανάγνωσης δεδομένων σε έντυπη μορφή και τον εντοπισμό οπτικά μοτίβα που αντιστοιχούν σε γράμματα, αριθμούς και άλλους χαρακτήρες . OCR
Η

Όλα τα βήματα που εμπλέκονται στην OCR - κατάτμηση, εξαγωγή χαρακτηριστικών και ταξινόμηση - μπορεί να υλοποιηθεί με τη χρήση του MATLAB . Τμηματοποίηση , η οποία περιλαμβάνει τον έλεγχο της σύνδεσης των σχημάτων , καθώς και την επισήμανση και την απομόνωση τους , είναι το πιο σημαντικό στάδιο διότι δεν επιτρέπει στο πρόγραμμα OCR για να εξαγάγετε στοιχεία από κάθε ατομικό χαρακτήρα . Κατάτμηση των χειρόγραφο κείμενο είναι ιδιαίτερα δύσκολη λόγω χειρόγραφες χαρακτήρες τείνουν να συνδέονται μεταξύ τους . Εξαγωγή χαρακτηριστικών εξάγει τα πιο χρήσιμα χαρακτηριστικά , όσον αφορά την αναγνώριση , από κάθε χαρακτήρα και ταξινόμηση εκχωρεί αυτά τα χαρακτηριστικά στις κατηγορίες χαρακτήρων .
Εικόνων Capture Image
Η

Σύμφωνα με ένα έγγραφο που παρουσιάστηκε σε ένα σεμινάριο δίνεται από LASIN Εργαστήριο Synergetics στο Πανεπιστήμιο της Λιουμπλιάνα , OCR μπορεί να υλοποιηθεί σε MATLAB με τη χρήση του Neural Network Toolbox και Επεξεργασία Εικόνας Toolbox add- ons . Το πρώτο στάδιο περιλαμβάνει την ανάγνωση της εικόνας στο χώρο εργασίας MATLAB ως αρχείο bitmap . Αυτό είναι ένα είδος αρχείο γραφικών στο οποίο κάθε στοιχείο εικόνας , ή εικονοστοιχείο αντιστοιχεί σε μία ή περισσότερες δυαδικό ψηφίο, ή λίγο , στη μνήμη. Ο ακόλουθος κώδικας χρησιμοποιείται για το έργο αυτό

I = imread ( « training.bmp ') ? . Imshow (Ι )
Η
εικόνων Μετατροπή εικόνας

το επόμενο στάδιο είναι να μετατρέψει την έγχρωμη εικόνα , η οποία αποθηκεύεται ως χωριστές κόκκινο, πράσινο και μπλε επικαλύψεις, σε μια ασπρόμαυρη εικόνα , η οποία αποτελείται από διακριτά αποχρώσεις του γκρι. . Ο παρακάτω κώδικας MATLAB μετατρέπει την εικόνα RGB σε μια ασπρόμαυρη φωτογραφία του ξενοδοχείου

Igray = rgb2gray ( Ι) ? Imshow ( Igray )
εικόνων αλώνισμα
Η

συνέχεια , μια τεχνική γνωστή ως « αλώνισμα » χρησιμοποιείται για να μετατρέψει την ασπρόμαυρη εικόνα σε μία δυαδική εικόνα . Το κύτταρο των κωδικών MATLAB απαιτείται για να μετατρέψει την εικόνα κλίμακας του γκρι σε μια δυαδική εικόνα μοιάζει κάπως έτσι :

ΙΣΒ = im2bw ( Igray , graythresh ( Igray ) ) ? Imshow ( IBW )
Η
Edge Detection
Η

Αφού δημιουργηθεί η δυαδική εικόνα , μεμονωμένων χαρακτήρων κόβονται σε subimages . Αυτά παρέχουν τα ανεπεξέργαστα δεδομένα για τη συνήθη λειτουργία εξόρυξης . Οι subimages πρέπει να περικοπεί δραστικά στα σύνορα του κάθε χαρακτήρα , εάν πρόκειται να είναι κανονικού μεγέθους , έτσι η ανίχνευση την άκρη του κάθε χαρακτήρα είναι σημαντική . Η άκρη μιας εικόνας μπορεί να ανιχνευθεί χρησιμοποιώντας τον παρακάτω κώδικα MATLAB

iEDGE = ακμή ( uint8 ( IBW ) ) ? . Imshow ( iEDGE )
εικόνων Αντικείμενα
Η .

Όλα τα αντικείμενα σε μια εικόνα - και οι ιδιότητες του κάθε αντικειμένου - μπορεί να καθοριστεί χρησιμοποιώντας τον ακόλουθο κώδικα MATLAB

[ Ilabel num ] = bwlabel ( Ifill ) ? disp ( αριθμός ) ? Iprops = regionprops ( Ilabel ) ? Ibox = [ Iprops.BoundingBox ] ? Ibox = αναμορφώσει ( Ibox , [ 4 50 ] ) ? imshow (Ι )
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα