A Google mostantól - szinkronban azzal az elképzelésével, hogy a világ összes neten elérhető információját indexelni akarja - képes arra, hogy a webre feltöltött, szkennelt anyagok szövegében is keressen.
A módszer a következő: karakterfelismerő (OCR) programot futtat le minden olyan, Adobe PDF formátumban elmentett dokumentumon, amelyre a keresőrobotok rátalálnak.
Korábban az ilyen, képet tartalmazó dokumentumokban nem tudott keresni a Google, csupán a cím alapján indexelte. Bár az OCR-technológia korlátai ismertek, a Google könyvdigitalizálási tapasztalata a garancia az ily módon indexelt dokumentumok használhatóságára, melyeket - hasonlóan a hagyományos PDF-dokumentumokhoz - a „View as HTML” (a magyar oldalon „HTML-változat”) linkre kattintva lehet megnézni.
A módszer a következő: karakterfelismerő (OCR) programot futtat le minden olyan, Adobe PDF formátumban elmentett dokumentumon, amelyre a keresőrobotok rátalálnak.
Korábban az ilyen, képet tartalmazó dokumentumokban nem tudott keresni a Google, csupán a cím alapján indexelte. Bár az OCR-technológia korlátai ismertek, a Google könyvdigitalizálási tapasztalata a garancia az ily módon indexelt dokumentumok használhatóságára, melyeket - hasonlóan a hagyományos PDF-dokumentumokhoz - a „View as HTML” (a magyar oldalon „HTML-változat”) linkre kattintva lehet megnézni.
Forrás: IT Café
0 megjegyzés:
Megjegyzés küldése