Google ha introdotto in dotazione standard una nuova funzione all’interno di Google Docs. Il servizio consta di un convertitore automatico in grado di prelevare un file PDF e di archiviarlo su Google Docs come semplice file testuale risalendo all’origine del documento e permettendone l’editing.
Trattasi di una funzione che Google aveva introdotto ormai da mesi, ma in semplice applicazione sperimentale. Ora la conversione avviene invece su semplice richiesta, anche se al momento i problemi di funzionamento sembrano ancora essere elevanti. Semplicemente, Google non fa altro che applicare a Google Docs quella tecnologia OCR già adottata nel processo di scannerizzazione dei libri nelle biblioteche americane: il file viene analizzato dall’OCR, l’immagine diventa testo ed il testo diventa un file sul quale (tramite Google Docs) è possibile intervenire parola per parola, lettera per lettera. Per essere analizzato il file viene caricato direttamente dall’utente per l’archiviazione, ed è in questo passaggio che il sistema richiede la volontà all’utente relativa ad una eventuale conversione in formato modificabile.
PDF a Google Docs tramite OCR
Le prime prove sul campo indicano una fallacia dell’OCR strettamente dipendente dalla qualità del file PDF originale e dunque ogni valutazione va effettuata su singoli casi e sulle singole condizioni qualitative dei file. La qualità complessiva del servizio è comunque sufficiente e del tutto paragonabile ad altri software dedicati.
L’opzione “Convert text from PDF or image files to Google Docs documents” permette a Google di effettuare un’operazione a parte, per la quale viene richiesta specifica volontà: non viene pertanto salvata una copia del file caricato, ma soltanto abilitata la conversione per l’editing, il controllo e la fruizione su Google Docs. Il file caricato può essere al massimo di 10MB e con una risoluzione di 25 megapixel. Con tanto di avviso: «più è grande il file, più tempo ci impiegherà l’OCR».
Per una prova diretta del nuovo strumento è possibile collegarsi all’apposita url e caricare un file PDF a scelta.