Pomagajte razvoju spletnega mesta, delite članek s prijatelji!

Ta članek bo dodatek k prejšnjemu (https://pcpro100.info/skanirovanie-teksta/) in podrobneje bo razkril bistvo neposrednega prepoznavanja besedila.

Začnimo s samim bistvom, ki ga mnogi uporabniki ne razumejo popolnoma.

Ko optično preberete knjigo, časopise, revije itd., Dobite nabor slik (npr. Grafičnih datotek, ne tekstovnih datotek), ki jih morate prepoznati v posebnem programu (eden od najboljših za to je ABBYY FineReader). Priznanje je in je proces pridobivanja besedila iz grafike in to je proces, ki ga bomo podrobneje napisali.

V mojem primeru bom vzel posnetek zaslona te spletne strani in poskusil dobiti besedilo iz njega.

1) Odpiranje datoteke

Odpremo slike, ki jih nameravamo prepoznati.

Mimogrede, tukaj je treba opozoriti, da lahko odprete ne le oblike slik, temveč tudi na primer datoteke DJVU in PDF. To vam bo omogočilo, da hitro prepoznate celotno knjigo, ki je v omrežju običajno razdeljena v te oblike.

2) Urejanje

Hkrati se ne strinjam s samodejno prepoznavanjem velikega pomena. Če imate seveda knjigo, v kateri lahko samo besedilo, slike in tablične računalnike ter skenirane v odlični kakovosti. V drugih primerih je najbolje, da se vsa področja ročno nastavijo.

Najpogosteje morate najprej odstraniti nepotrebna področja s strani. Če želite to narediti, kliknite gumb za urejanje na plošči.

Potem morate zapustiti samo področje, s katerim želite delati dlje. Za to obstaja orodje za obrezovanje nepotrebnih meja. Na desni strani stolpca izberite način obrezovanja .

Nato izberite območje, ki ga želite obdržati. Na sliki spodaj je označena rdeča.

Mimogrede, če imate več slik odprtih, lahko obrezovanje uporabite za vse slike hkrati! Primerno je, da se ne ločite ločeno. Bodite pozorni, na dnu te plošče je še eno čudovito orodje - brisanje . Če ga uporabljate s slike, lahko izbrišete nepotrebne madeže, številke strani, pike, nepotrebne posebne znake in posamezna področja.

Ko kliknete za obrezovanje robov, se mora izvirna slika spremeniti: ostane samo delovni prostor.

Nato lahko zapustite urejevalnik slik.

3) Izbiranje področij

Na plošči nad odprto sliko so majhni pravokotniki, ki določajo območja skeniranja. Obstaja več jih, naj na kratko razmislimo o najpogostejših.

Slika - to področje ne prepozna programa, bo preprosto kopiral določeni pravokotnik in ga prilepil v prepoznani dokument.

Besedilo je glavno področje, na katerem lahko program osredotočite in poskušate dobiti besedilo iz slike. To območje izberemo v našem primeru.

Po izbiri je površina naslikana v svetlo zeleni barvi. Potem lahko preidete na naslednji korak.

4) prepoznavanje besedila

Ko so vsa področja nastavljena, kliknite na ukaz menija, ki ga želite prepoznati. Na srečo, v tem koraku, nič več ni treba storiti, je nepotrebno.

Čas prepoznavanja je odvisen od števila strani vašega dokumenta in moči računalnika.

V povprečju je ena celovita stran skenirana v dobri kakovosti traja 10-20 sekund. na povprečno moč računalnika (po današnjih standardih).

5) Preverjanje napak

Ne glede na kakovost prvotne slike, ponavadi vedno obstajajo napake po prepoznavnosti. Vseeno pa do sedaj noben program ne more popolnoma izključiti dela osebe.

Kliknite na možnost preverjanja in ABBYY FineReader vam bo začel prikazovati izmenično tista mesta v dokumentu, kjer je imel dvom. Vaša naloga, ki primerja izvirno sliko (mimogrede, ta kraj vam bo pokazal v razširjeni različici) z različico prepoznavanja - odgovor pritrdilno, ali popravite in potrdite. Nato se bo program premaknil na naslednjo kompleksno lokacijo in tako naprej, dokler ne bo preverjen celoten dokument.

Na splošno je ta proces lahko dolg in dolgočasen …

6) Ohranjanje

ABBYY FineReader ponuja več možnosti za shranjevanje vašega dela. Najpogosteje uporabljena je "natančna kopija". Torej. celoten dokument, besedilo v njem bo prav tako formatirano, kot v izvorni kodi. Primerna možnost za prenos v Word. Torej smo storili v tem primeru.

Po tem boste videli vaše prepoznavno besedilo v znani dokument Word. Mislim, da še nadoknadite kaj storiti z njo, ni smiselno …

Tako smo na konkretnem primeru analizirali, kako prevesti sliko v golo besedilo. Ta proces ni vedno preprost in hiter.

V vsakem primeru bo vse odvisno od prvotne kakovosti slike, izkušenj in hitrosti računalnika.

Uspešno delo!

Pomagajte razvoju spletnega mesta, delite članek s prijatelji!

Kategorija: