Anonim

Vienas iš dalykų, kurie mane dažnai nuvylė, yra nesugebėjimas lengvai nukopijuoti teksto iš vaizdų ir tam tikrų PDF failų (pvz., Tų, kurie galbūt buvo sukurti iš nuskaitytų dokumentų). Laimei, laikui bėgant buvo sukurti programinės įrangos sprendimai, skirti spręsti šią problemą, leidžianti sutaupyti daug laiko, jei priešingu atveju būtų buvę praleista rankiniu būdu nukopijuoti ir įvesti tekstą. Šiandienos patarime aš kalbėsiu apie nemokamą programinės įrangos įrankį, vadinamą „Capture2Text“, kuris naudoja optinio simbolių atpažinimo (OCR) algoritmą, kuris leis jums užfiksuoti tekstą iš vaizdo ir PDF failų.

Diegimas ir sąranka

Norėdami pradėti, eikite į projekto „SourceForge“ puslapį ir atsisiųskite naujausią „Capture2Text“ versiją. Programinė įranga tiekiama kaip ZIP archyvas, o tuo metu joje nėra specialios diegimo programos. Atsisiuntę išpakuokite archyvą ir paleiskite „Capture2Text.exe“ failą. Tai paleis programinę įrangą ir įleis piktogramą į sistemos dėklą:

Pirma, ką jūs norite padaryti, tai nustatyti programinės įrangos nuostatas, konkrečiai, kuriuos karštuosius klavišus (arba sparčiuosius klavišus) naudoti norint pradėti ir sustabdyti fotografavimą:

Mano atveju aš pasirinkau naudoti klavišus „Windows + q“, kad pradėčiau fiksuoti, ir „Enter“, kad sustabdyčiau. Šias parinktis galite pritaikyti prie to, kas jums labiausiai tinka. Atminkite, kad klavišas „Windows + s“ dažnai naudojamas jau ekrano fiksavimui (pvz., Tokiose programose kaip „Microsoft One Note“).

Kitame skirtuke galima sukonfigūruoti OCR parinktis, įskaitant įvesties kalbą (šiuo metu palaikomos septynios kalbos) ir tai, ar naudoti OCR išankstinį apdorojimą tikslumui pagerinti (labai rekomenduojama). Galiausiai, skirtuke Išvestis, be kitų parinkčių, galima pasirinkti, ar tiesiog išsaugoti užfiksuotą tekstą iškarpinėje, ar atidaryti atskirą iššokantį langą.

Programinės įrangos naudojimas

Įdiegę ir sukonfigūravę programinę įrangą, galite pradėti ją naudoti naudodami karštųjų klavišų paleidimo pradžios kombinaciją. Naudodamiesi pele pasirinkite paveikslėlio sritį, kurioje yra tekstas, kurį norite užfiksuoti. Norėdami sustabdyti fiksavimą, tiesiog paspauskite pasirinktą greitąjį klavišą, kad sustabdytumėte fiksavimą. Tada tekstas bus nukopijuotas į mainų sritį, išvestinį langą arba į abu. Pavyzdį galima pamatyti žemiau.

Greitai išbandęs įrankį su vaizdais, radau, kad jo tikslumas yra tinkamas. Akivaizdu, kad tokioms priemonėms kaip ši ir OCR apskritai yra apribojimų. Pvz., Smarkiai modifikuotas tekstas (labai keiksmažodis, kursyvas arba modernus) gali neveikti taip gerai, o kartais ir visai ne. Be to, kai kuriais atvejais tai padės šiek tiek pakoreguoti fotografavimo dėžės matmenis arba žaisti su paties vaizdo mastelio keitimu, kad gautumėte tikslesnį rezultatą.

Fiksuojant tekstą iš nuskaitytų PDF dokumentų, tikslumas yra geras. Padarytoje išvestyje vis dar reikia atlikti keletą galutinių pakeitimų (atsižvelgiant į pradinio nuskaitymo kokybę). Taip pat pastebėjau, kad programinės įrangos apdorojimas gali užtrukti keletą sekundžių, ypač kai paprašoma konvertuoti didelius teksto kiekius.

Visą tai kalbant, manau, kad įrankis daro gerą darbą, juo labiau, kad jis yra laisvai prieinamas - raginu išbandyti.

Priedas 2015 11 16:

Kita galimybė tiems, kurie turi „Google“ paskyras, taip pat galima naudoti „Google“ OCR galimybes įkeliant failą į „Google“ diską (daugiau informacijos galite rasti čia). Be to, „Google Chrome“ vartotojams taip pat prieinamas OCR papildinys, vadinamas Copyfish, kurį taip pat galite patikrinti.

Kaip užfiksuoti tekstą iš vaizdų naudojant ocr programinę įrangą