Υλικό υπολογιστών

* Γνώση Υπολογιστών >> Υλικό υπολογιστών >> Σαρωτές

Τι είναι ένα σαρωτή OCR

; Optical Character Recognition ( OCR ) είναι μια τεχνική για την καταχώρηση δεδομένων που χρησιμοποιεί ένα συγκεκριμένο είδος γραμματοσειράς και ένα σαρωτή OCR για να διαβάσετε το σύνολο χαρακτήρων και να το στείλετε στον υπολογιστή σας . Το Αμερικανικό Εθνικό Ινστιτούτο Προτύπων , ή ANSI , καθορίζει τον τύπο της γραμματοσειράς ως ένα σύνολο χαρακτήρων 0-9 , A έως Z , και μερικές ειδικούς χαρακτήρες , που το καθένα περιέχει ένα ορισμένο μέγεθος και σχήμα . Γραμματοσειρές OCR είναι να αναπαραχθούν , και τους ανθρώπους και σαρωτές OCR μπορεί να διαβάσει και να τα διακρίνει . Κατηγορίες
Η

σαρωτές OCR είναι είτε εισαγωγής κειμένου ή συλλογής δεδομένων σαρωτές . Σαρωτές εισαγωγής κειμένου διαβάσετε ολόκληρο το έγγραφο , ή τουλάχιστον μεγάλα τμήματά του . Η εισαγωγή των δεδομένων μπορεί να είναι το χέρι που τρέφονται ή ο σαρωτής μπορεί να έχει αυτόματη τροφοδοσία δεδομένων , την ανάγνωση , τη διαλογή και στοίβαγμα δυνατότητες . Όταν χρησιμοποιείτε ένα σαρωτή εισαγωγής κειμένου , επεξεργασία λαμβάνει χώρα είτε κατά τη διάρκεια ή μετά τη σάρωση . Συλλογής δεδομένων σαρωτές σύλληψη και τη μορφή των δεδομένων κατά τη διαδικασία σάρωσης , και κανένας άνθρωπος δεν την επεξεργασία των δεδομένων λαμβάνει χώρα . Εξαιτίας αυτού , Data Capture σαρωτές θα πρέπει να είναι πιο ακριβείς .

Η Τύποι

τύποι Scanner μπορεί να είναι σταθερή ή φορητή . Σταθερός scanners , όπως καρότσα , τροφοδοσία φύλλων και τύμπανο σαρωτές χρησιμοποιούν κυρίως εισαγωγής κειμένου για να διαβάσετε , να επεξεργάζονται και να αποθηκεύουν τα δεδομένα εικόνων στον υπολογιστή σας , όπου μπορείτε , στη συνέχεια, να επεξεργαστείτε ή να μορφοποιήσετε το κείμενο συλλαμβάνονται . Χειρός σαρωτές , όπως ψηφιακές πένες ή σαρωτές bar code , χρησιμοποιήστε είτε εισαγωγής κειμένου ή συλλογής δεδομένων για να διαβάσετε και επεξεργασία πληροφοριών δεδομένων και στη συνέχεια να τις αποθηκεύει για μελλοντική επεξεργασία ή "κλειδώσει " τα δεδομένα για αποτροπή επεξεργασίας της .
Η
Η Μέθοδοι
Η

Εν συντομία , ένας σαρωτής OCR παίρνει μια εικόνα του εγγράφου και, στη συνέχεια, το λογισμικό του σαρωτή OCR εξετάζει το OCR γραμματοσειρά η εικόνα περιέχει , και στη συνέχεια διαβάζει και το μετατρέπει σε κείμενο χρησιμοποιώντας είτε Matching Matrix ή τη μέθοδο Εξαγωγή Χαρακτηριστικών . Matching Matrix είναι μια μορφή της εύρεσης προτύπου , όπου ο σαρωτής κοιτάζει ένα χαρακτήρα και να ταιριάζει με ένα στη βιβλιοθήκη του χαρακτήρες ή πρότυπα χαρακτήρα . Εξαγωγή Χαρακτηριστικών δεν βασίζονται σε μια προκαθορισμένη βιβλιοθήκη , αλλά σε γενικά χαρακτηριστικά, όπως ανοικτούς χώρους , κλειστά σχήματα , και τεμνόμενες γραμμές όταν αποκρυπτογράφηση χαρακτήρες . Εξαγωγή Χαρακτηριστικών πηγαίνει επίσης από το όνομα Intelligent Character Recognition , ή ICR .
Εικόνων Οφέλη
Η

Το πιο σημαντικό όφελος από τη χρήση ενός σαρωτή OCR είναι η εξάλειψη των ανθρώπινων λαθών εισαγωγής δεδομένων . Σαρωτές OCR διαβάσει δεδομένα σε ταχύτητες που μπορεί να φτάσει πάνω από 200 χαρακτήρες ανά δευτερόλεπτο . Το ποσοστό ακρίβειας ενός σαρωτή OCR είναι 99,9975 τοις εκατό, ή ένας αντιλαμβάνεται εσφαλμένα χαρακτήρα σε 40.000 , σε σύγκριση με ένα ανθρώπινο ρυθμό αντιλαμβάνεται εσφαλμένα από ένα στα 300 χαρακτήρων. Αυτόματος έλεγχος ψηφίο επικύρωσης μπορεί να φέρει το ποσοστό ακρίβειας OCR σε λιγότερες από μία στις 3.000.000 .
Εικόνων Εκτιμήσεις
Η

Poor πρωτότυπα ποιότητας θα οδηγήσει σε λιγότερο ακριβή έγγραφα OCR . Χειρόγραφα έγγραφα, τα έγγραφα που περιέχουν στυλ κειμένου , παλαιότερα έγγραφα , φωτοτυπίες και τα περισσότερα έγγραφα φαξ δεν λειτουργούν καλά με σαρωτές OCR . Συστάσεις για τα αποδεκτά έγγραφα περιλαμβάνουν τυπωμένο κείμενο σε ένα μέγεθος γραμματοσειράς μικρότερο από 72 πόντους , laser και το μελάνι του εκτυπωτή jet κειμένου , έγγραφα φαξ με 200 κουκκίδες ανά ίντσα ( dpi ) ή μεγαλύτερη ανάλυση και εμπορικά έντυπο υλικό , όπως βιβλία , φυλλάδια και περιοδικά .


Η

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα