Pomagajte razvoju spletnega mesta, delite članek s prijatelji!

Pozdrav vsem bralcem spletnega dnevnika!

Mislim, da se morajo tisti, ki pogosto delajo na računalniku (ne igrajo, to je, delajo), spopadati s prepoznavanjem besedila. No, na primer, skenirali ste del knjige in zdaj morate vstaviti ta del v svoj dokument. Toda skenirani dokument je slika in potrebujemo besedilo - za to so potrebni posebni programi in spletne storitve za prepoznavanje besedila iz slik.

O programu za priznanje sem že napisal v prejšnjih objavah:

- skeniranje besedila in prepoznavanje v programu FineReader (plačan program);

- delo v analognem FineReader - CuneiForm (brezplačni program).

V istem članku se želim osredotočiti na spletne storitve za prepoznavanje besedila. Konec koncev, če morate hitro dobiti besedilo z 1-2 slikami - ni smisla v težavah z namestitvijo različnih programov …

Pomembno! Kakovost prepoznavanja (število napak, berljivost itd.) Je zelo odvisna od prvotne kakovosti slike. Zato pri skeniranju (fotografiranju itd.) Izberite kakovost, ki je čim višja. V večini primerov bo kakovost 300-400 dpi zadostna (dpi je parameter, ki označuje kakovost slike.) V nastavitvah skoraj vseh optičnih bralnikov je ta parameter običajno označen.

Spletne storitve

Da bi prikazal delo storitev, sem naredil posnetek zaslona enega od mojih člankov. Ta posnetek zaslona bo prenesen na vse storitve, opisane spodaj.

1) http://www.ocrconvert.com/

To storitev mi je zelo všeč zaradi njene preprostosti. Spletna stran, čeprav tudi angleško, vendar dobro deluje in z ruskim. Ni vam treba registrirati. Za začetek prepoznavanja morate storiti 3 dejanja:

- naložite svojo sliko;

- izberite jezik besedila, ki je na sliki;

- Pritisnite gumb za začetek prepoznavanja.

Podprte oblike: PDF, GIF, BMP, JPEG.

Rezultat je prikazan spodaj na sliki. Moram reči, da je bilo besedilo dobro prepoznavno. Poleg tega zelo hitro - sem dobesedno čakal 5-10 sekund.

2) http://www.i2ocr.com/

Ta storitev deluje podobno zgoraj. Tukaj morate tudi naložiti datoteko, izbrati jezik prepoznavanja in kliknite gumb za ekstrakcijo. Storitev je zelo hitra: 5-6 sekund. za eno stran.

Podpira formate: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Rezultat te spletne storitve je veliko bolj priročen: takoj vidite dve okni - prvi je rezultat prepoznave, v drugem - izvirna slika. Zato je v času urejanja preprosto urediti spremembe. Mimogrede, vam ni treba registrirati za storitev.

3) http://www.newocr.com/

Ta storitev je edinstvena na več načinov. Prvič, podpira format "newfangled" DJVU (mimogrede, popoln seznam formatov: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Drugič, podpira izbiro besedilnih področij na sliki. To je zelo uporabno, če imate na sliki ne le besedilna področja, ampak tudi grafično, ki jih vam ni treba prepoznati.

Kakovost prepoznavanja je nadpovprečna, vam ni treba registrirati.

4) http://www.free-ocr.com/

Zelo preprosta storitev za prepoznavanje: prenesite sliko, določite jezik, vnesite captcha (mimogrede, edina storitev v tem članku, kjer je to treba storiti) in pritisnite gumb, da prevedete sliko v besedilo. Pravzaprav vse!

Podprte oblike: PDF, JPG, GIF, TIFF, BMP.

Rezultat priznanja je povprečen. Obstajajo napake, vendar jih ni veliko. Če pa bi bila kakovost prvotnega posnetka večja, bi bile napake manjše od velikosti.

PS

To je vse za danes. Če poznate bolj zanimive storitve za prepoznavanje besed - delež v komentarjih, bom hvaležen. Eden od pogojev: zaželeno je, da se ni bilo treba registrirati, storitev pa je bila brezplačna.

Vse najboljše!

Pomagajte razvoju spletnega mesta, delite članek s prijatelji!

Kategorija: