Van úgy, hogy olyan szöveget kapunk PDF formátumban, ami gyakorlatilag kép. Függetlenül attól, hogy géppel írt az anyag, a fájlból nem tudunk kimásolni semmit. Pedig időt spórolnánk meg azzal, ha szövegként is használható lenne a dokumentum. Ismerős a probléma?

 

 

Erre egyébként már létezik megoldás. A karakterfelismerő, OCR, azaz Optical Character Recognition programok segítenek. Az ilyen alkalmazások a betűk íveit ismerik fel és alakítják át tényleges szöveggé úgy, hogy gyakorlatilag egy az egyben másolhatjuk, szerkeszthetjük azokat. Elsőre egyébként sokan kételkednek az ilyen programok sikerességében, de nem érdemes, mert tényleg jók. Persze a végeredmény függ attól, hogy milyen volt az eredeti PDF, kép fájl minősége. De összességében azt lehet mondani, hogy a legtöbb ilyen alkalmazás megbízható. Legalább annyira segítenek, hogy nem kell bepötyögni a szöveget. Bár átolvasni mindig tanácsos az átfordított szöveget, mert előfordulhat, hogy valamelyik karakter nem tökéletes. De összességében elfogadható minőség lesz a munka vége.

 

Amúgy ez a technológia nem csak kész dokumentumoknál vethető be. Már szkenneléskor is digitalizálhatunk úgy szöveget, hogy a rendszer felismerje a dokumentumunk karaktereit. Ez egyrészt azért jó, mert könnyen szerkeszthetjük és dolgozhatunk vele, másrészt kereshetővé válik a szöveg. Így egy komolyabb terjedelmű anyagot nem kell végigolvasni, ha csak egy szövegrészre lennénk később kíváncsiak.

 

Visszatérve az eredeti PDF fájl átfordításos kérdésre: ha OCR-rel próbálkoznánk, ügyeljünk arra, hogy a nyelv be legyen állítva. Az ékezetes betűk miatt ez fontos.

 

Érdemes továbbá azt is tudni, hogy a letölthető szoftverek mellett számos online (nem kell telepíteni) elérhető program is kínál karakterfelismerő lehetőséget. Viszont nehéz ezek közül kiemelni bármelyiket is, de talán a Google fejlesztését mégis megemlítenénk. A docs.google.com alkalmazásában a Google felhő tárhelyére (Google Drive-ba) feltöltött PDF fájlokat pillanatok alatt felismeri a rendszer, s ha szeretnénk, át is konvertálja szerkeszthető formátumba. De ezt külön célszerű “kérni”. Annyit kell csak tenni, hogy a drive.google.com tárhelyünkre feltöltjük az adott fájlt. Jobb egérrel rákattintunk és kiadjuk neki, hogy dokumentumként nyissa meg. Ezután pár másodperc alatt megnyílik a docs.google.com, a Google online szövegszerkesztője, és már használhatjuk is a korábbi kép formátumú PDF-ünket. Ha nem teljesen világos így, íme egy kis plusz segítség.

 

Látszik tehát, hogy létezik megoldás a képszerű PDF dokumentumok szöveggé alakítására - viszont ez sok időt vesz el. A legjobb megoldás ezért az, ha már eleve úgy szkennelünk, hogy a dokumentumunk szöveges fájl legye. Mi ehhez megfelelő szkennereket kínálunk az Írókéz irodaszer webáruházban. Nézzen körül itt!

Vinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo Slider