Informatikai szemle: Már a szkennelt fájlokban is "olvas" a Google

A Google mostantól - szinkronban azzal az elképzelésével, hogy a világ összes neten elérhető információját indexelni akarja - képes arra, hogy a webre feltöltött, szkennelt anyagok szövegében is keressen.

A módszer a következő: karakterfelismerő (OCR) programot futtat le minden olyan, Adobe PDF formátumban elmentett dokumentumon, amelyre a keresőrobotok rátalálnak.

Korábban az ilyen, képet tartalmazó dokumentumokban nem tudott keresni a Google, csupán a cím alapján indexelte. Bár az OCR-technológia korlátai ismertek, a Google könyvdigitalizálási tapasztalata a garancia az ily módon indexelt dokumentumok használhatóságára, melyeket - hasonlóan a hagyományos PDF-dokumentumokhoz - a „View as HTML” (a magyar oldalon „HTML-változat”) linkre kattintva lehet megnézni.

Forrás: IT Café

Informatikai szemle

Már a szkennelt fájlokban is "olvas" a Google

0 megjegyzés:

Blog Archive

Followers

Traffic

About Me

Labels

Ads

Recent Posts