In quest'area troverai:

tutte le news aggiornate sugli eventi e gli avvenimenti rilevanti per l'ADV.


Notizie

Archivio notizie

OCR Riconoscimento Ottico dei Caratteri in Biblos - Novità

OCR Riconoscimento Ottico dei Caratteri in Biblos - Novità

di Giuseppe Di Grande  

Da quando Biblos è nato, nel lontano 2004, ho cercato sempre un componente che potesse dargli la capacità di riconoscere il testo delle immagini. In gergo si chiama OCR, è un acronimo che in italiano significa Riconoscimento Ottico dei Caratteri.

Finalmente oggi in Biblos 5 ho aggiunto gli strumenti OCR. In unione alle funzionalità di scansione consente di scandire e riconoscere il testo di documenti cartacei. Da Biblos 5.27 in poi dentro il menù Strumenti di Biblos si trova il sottomenù OCR. Contiene i comandi: Scandisci documento, Lettura documento e Imposta OCR.

La finestra Scandisci documento permette di acquisire immagini da scanner e riconoscerne il testo. Ha un'interfaccia molto semplice in cui è possibile acquisire più pagine, gestirle, leggerne immediatamente il contenuto. In più il testo riconosciuto può essere inserito nel documento di Biblos, al fine di editarlo, salvarlo, convertirlo in audiolibro, stamparlo in braille.

La finestra Impostazioni OCR permette di scegliere la lingua predefinita con cui riconoscere il testo delle immagini. Possono essere attivate anche più lingue. Una lingua può essere spostata sopra o sotto a un'altra, per stabilirne la priorità. La casella Alta qualità consente di avere una qualità di riconoscimento maggiore, perché utilizza l'intelligenza artificiale offerta dal motore OCR. L'alta qualità di riconoscimento comporta una perdita di velocità, perciò ho preferito far scegliere all'utente se attivare o meno questa caratteristica.

Le lingue per ora disponibili sono quelle delle interfacce utente di Biblos. In più ho aggiunto le lingue di riconoscimento: Esperanto, Greco antico e Latino. Se in futuro si aggiungeranno altre interfacce utente e altri collaboratori stabili, provvederò ad aggiungere le relative lingue OCR.

La funzionalità di Lettura ad alta voce per ora non è disponibile, in attesa di capire se sia superflua o meno.

Per avere questa nuova funzionalità, è necessario installare il modulo OCR che ho predisposto e aggiunto tra i download di Biblos. Pertanto nel sito www.digrande.it ora sono presenti due moduli OCR, a 32bit e a 64bit. Bisogna installare solo quello della propria versione di Biblos.

Il motore OCR che ho utilizzato è sviluppato e mantenuto da Google e si chiama Tesseract. E' un OCR open source che ha raggiunto una qualità accettabile, tanto da farmi decidere ad aggiungerlo in Biblos. Tuttavia non garantisce gli stessi risultati dei motori OCR più conosciuti (a pagamento), non possiede tutte le loro funzionalità, ma in qualche modo il suo lavoro lo fa e riesce a produrre buoni risultati. Ci sono dei limiti, come l'impossibilità di identificare e correggere automaticamente l'orientamento della pagina o di dividere automaticamente le pagine doppie. Per ora non è possibile rimediare a queste mancanze. Man mano che il componente di Google rimedierà a queste lacune, Biblos ne acquisirà tutti i benefici.

 

L'impegno e lo sforzo che in questi anni sto dedicando a Biblos si manifestano nella qualità di tutta la serie di strumenti e funzionalità che oggi Biblos possiede ed offre. Molte volte sono costretto a rinunciare a delle soluzioni, per il loro costo insostenibile da me privo di risorse economiche esterne, altre volte trovo soluzioni che mi consentono di programmare e includere strumenti che seguono la mia personale idea di solidarietà, quella che aiuta le persone nella loro autonomia personale.

 

Questo ultimo strumento che ho aggiunto va proprio in questa direzione. Immagino che sarà utile a persone, studenti, insegnanti e scuole, all'insegna della crescita personale e professionale.

 

La collaborazione da parte degli utenti è sempre ben gradita. La contribuzione economica da parte di organizzazioni o aziende sarebbe ben accetta, per dare a Biblos la forza di offrire strumenti sempre più performanti, visto che Biblos raggiunge oggi persone e organizzazioni in più di 80 paesi del mondo che si avvalgono dei suoi strumenti.

 

  • segnala la pagina

    Grazie per aver deciso di segnalare i contenuti pubblicati dall'Associazione Disabili Visivi.

    Ti ricordiamo che, per segnalare un articolo, dovrai inserire nell'apposito form il tuo indirizzo e-mail.

    Questo verrà utilizzato esclusivamente per consentire alla persona che riceverà il messaggio di identificarti.

    Non riceverai alcun tipo di Spam e non conserveremo il tuo indirizzo email nei nostri archivi.

    Autorizzazione alla privacy
    * I campi contrassegnati dall'asterisco sono obbligatori
    Letta l'informativa sulla Privacy ai sensi dell’articolo 13 del Codice in materia di protezione dei dati personali (D.Lgs 196/03),

    al trattamento dei dati personali.