Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Προγραμματισμός Java

Πώς να χρησιμοποιήσετε Tesseract OCR σε Java

βιβλιοθήκες αναγνώρισης οπτικών χαρακτήρων Tesseract προσφέρουν στους προγραμματιστές μια μέθοδο για τη σάρωση εγγράφων και το κείμενο σε μια εικόνα . Μπορείτε να χρησιμοποιήσετε τις βιβλιοθήκες Tesseract να αποθηκεύσετε εικόνες από έγγραφα που δεν χρειάζεστε πλέον σε έντυπη μορφή . Μπορείτε να χρησιμοποιήσετε Tesseract βιβλιοθήκες σε Java από τη μεταγωγή κάθε χαρακτήρα και το γράψιμο του χαρακτήρα σε ένα αρχείο . Για να χρησιμοποιήσετε τις βιβλιοθήκες , θα πρέπει να περιλαμβάνει το namespace Java για τις λειτουργίες OCR . Οδηγίες
Η

1 Κάντε δεξί κλικ στο αρχείο Java που θέλετε να χρησιμοποιήσετε για να δημιουργήσετε το έγγραφο OCR . Κάντε κλικ στο " Άνοιγμα με " και επιλέξτε editor προτιμάτε Java . 2

Προσθέστε τη βιβλιοθήκη ονομάτων OCR στην κορυφή του αρχείου . Αντιγράψτε και επικολλήστε τον παρακάτω κώδικα στο αρχείο του πηγαίου κώδικα σας :

com.tplan.robot.imagecomparison.tesseractocr
εικόνων 3

Δημιουργήστε τον κώδικα που σαρώνει χαρακτήρες στο αρχείο . Για παράδειγμα , ο παρακάτω κώδικας διέρχεται μέσω κάθε χαρακτήρα σε ένα αρχείο και το γράφει σε ένα αρχείο εικόνας :

γραμμές Var = μέθοδος 0Compareto = " tocr " cmparea = " x : 33 , y : 2 , w : 200 , h : 22 " για ( i = 1 ? { i } <{ γραμμές } +1 ? i = { i } +1) { Typeline " { { _TOCR_LINE i } } " }

4

Κάντε κλικ στο κουμπί " Αποθήκευση " του συντάκτη Java και κάντε κλικ στο " Run" για να εκτελέσει τον κώδικα σε ένα πρόγραμμα εντοπισμού σφαλμάτων Java .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα