OCR

Jak spustit tesseract na soubor GIF v Linuxu

Jak spustit tesseract na soubor GIF v Linuxu
Tesseract je systém OCR (Optical Character Recognition), jeden z nejlepších. Software OCR je schopen porozumět textu z obrázků a naskenovaných dokumentů (včetně rukopisu, pokud ho trénujete). Systém OCR může být užitečný pro mnoho úkolů, jako je počítání naskenovaných dokumentů, automatický přepis, převod znaků z obrázku na text a další.

LinuxHint již publikoval výukový program vysvětlující, jak nainstalovat a porozumět tréninku Tesseractu.

Tento výukový program ukazuje proces instalace Tesseractu v systémech Debian / Ubuntu, ale nebude rozšířen o tréninkové funkce, pokud nejste obeznámeni s tímto softwarem, čtení zmíněného článku může být dobrým úvodem.  Poté vám ukážeme, jak zpracovat obrázek GIF pomocí Tesseractu, abyste z něj dostali text.

Instalace Tesseract:

Běh:

apt install tesseract-ocr

Nyní musíte nainstalovat imagemagick, což je převaděč obrázků.

Po instalaci už můžeme Tesseract otestovat, abych to otestoval, našel jsem gif s licencí pro opětovné použití.

Nyní se podívejme, co se stane, když spustíme tesseract na obrázku gif:

tesseract 2002NY40.gif 1výsledek

Nyní udělejte „méně“ na 1 výsledek.txt

méně 1 výsledek.txt

Tady je obrázek s jeho textem:

V této aplikaci jsou výchozí nastavení Tesseractu docela přesná, obvykle k získání takové přesnosti je zapotřebí školení. Vyzkoušejte další bezplatný obrázek, který jsem našel na Wiki Commons, po stažení spustit:

tesseract Actualizar_GNULinux_Terminal_apt-get.gif 2výsledek

Nyní zkontrolujte obsah souboru.

méně 2 výsledek.txt


To byl výsledek, zatímco obsah původního obrázku byl:

Abychom vylepšili rozpoznávání znaků, máme k dispozici mnoho možností a kroků, které jsme podrobně popsali v našem předchozím tutoriálu: odstranění okrajů, odstranění šumu, optimalizace velikosti a rotace stránky mezi dalšími funkcemi, jako je oříznutí.

Pro tento tutoriál použijeme textcleaner, skript vyvinutý Fred's ImageMagick Scripts.

Stáhněte si skript a spusťte:

./ textcleaner -g -e stretch -f 25 -o 10 -s 1
Actualizar_GNULinux_Terminal_apt-get.test gif.gif

Poznámka: před spuštěním skriptu mu udělejte oprávnění ke spuštění spuštěním “chmod + x textcleaner„Jako root nebo s sudo předpona.

Kde:

textový čistič: volá program

-G: Převeďte obrázek na stupně šedi

-E: enache

-F: filtrovat

-s: sharpamt, množství doostření pixelů, které se použije na výsledek.

Informace a příklady použití s ​​textcleanerem naleznete na adrese http: // www.fmwconcepts.com / imagemagick / textcleaner / index.php

Jak vidíte, textcleaner změnil barvu pozadí a zvýšil kontrast mezi písmem a pozadím.

Pokud spustíme tesseract, pravděpodobně bude výsledek jiný:

tesseract test.testovací výstup gif

menší testovací výstup

Jak vidíte, výsledek se opravdu zlepšil, i když není úplně přesný.

Příkaz konvertovat poskytované imagemagick nám umožňuje extrahovat snímky z obrázků GIF, které budou později zpracovány Tesseractem, což je užitečné, pokud je v různých rámcích obrázku GIF extrahovatelný obsah.

Syntaxe je jednoduchá:

konvertovat

Výsledek bude vygenerován jako počet souborů jako rámců v gifu, v uvedeném příkladu budou výsledky: výstup-0.jpg, výstup-1.jpg, výstup-2.jpg, atd.

Pak je můžete zpracovat pomocí tesseractu a dát mu pokyn, aby zpracoval všechny soubory se zástupným znakem a uložil výsledek do jednoho souboru spuštěním:

pro i ve výstupu- *; dělat tesseract $ i outputresult; Hotovo;

Imagemagick má obrovskou škálu možností pro optimalizaci obrázků a neexistuje obecný režim, pro každý druh scénáře byste si měli přečíst manuálovou stránku převodu.

Doufám, že vám tento návod na Tesseractu připadal užitečný.

Hry Zdarma a open source herní motory pro vývoj linuxových her
Zdarma a open source herní motory pro vývoj linuxových her
Tento článek pokryje seznam bezplatných a otevřených herních enginů, které lze použít pro vývoj 2D a 3D her v systému Linux. Existuje mnoho takových h...
Hry Výukový program Shadow of the Tomb Raider pro Linux
Výukový program Shadow of the Tomb Raider pro Linux
Shadow of the Tomb Raider je dvanáctý přírůstek do série Tomb Raider - série akčních adventur vytvořená Eidosem Montrealem. Tato hra byla docela dobře...
Hry Jak zvýšit FPS v Linuxu?
Jak zvýšit FPS v Linuxu?
FPS znamená Snímků za sekundu. Úkolem FPS je měřit snímkovou frekvenci při přehrávání videa nebo herních výkonech. Jednoduše řečeno, počet nepřerušova...