LinuxHint již publikoval výukový program vysvětlující, jak nainstalovat a porozumět tréninku Tesseractu.
Tento výukový program ukazuje proces instalace Tesseractu v systémech Debian / Ubuntu, ale nebude rozšířen o tréninkové funkce, pokud nejste obeznámeni s tímto softwarem, čtení zmíněného článku může být dobrým úvodem. Poté vám ukážeme, jak zpracovat obrázek GIF pomocí Tesseractu, abyste z něj dostali text.
Instalace Tesseract:
Běh:
apt install tesseract-ocr
Nyní musíte nainstalovat imagemagick, což je převaděč obrázků.
Po instalaci už můžeme Tesseract otestovat, abych to otestoval, našel jsem gif s licencí pro opětovné použití.
Nyní se podívejme, co se stane, když spustíme tesseract na obrázku gif:
tesseract 2002NY40.gif 1výsledek
Nyní udělejte „méně“ na 1 výsledek.txt
méně 1 výsledek.txt
Tady je obrázek s jeho textem:
V této aplikaci jsou výchozí nastavení Tesseractu docela přesná, obvykle k získání takové přesnosti je zapotřebí školení. Vyzkoušejte další bezplatný obrázek, který jsem našel na Wiki Commons, po stažení spustit:
tesseract Actualizar_GNULinux_Terminal_apt-get.gif 2výsledek
Nyní zkontrolujte obsah souboru.
méně 2 výsledek.txt
To byl výsledek, zatímco obsah původního obrázku byl:
Abychom vylepšili rozpoznávání znaků, máme k dispozici mnoho možností a kroků, které jsme podrobně popsali v našem předchozím tutoriálu: odstranění okrajů, odstranění šumu, optimalizace velikosti a rotace stránky mezi dalšími funkcemi, jako je oříznutí.
Pro tento tutoriál použijeme textcleaner, skript vyvinutý Fred's ImageMagick Scripts.
Stáhněte si skript a spusťte:
./ textcleaner -g -e stretch -f 25 -o 10 -s 1Actualizar_GNULinux_Terminal_apt-get.test gif.gif
Poznámka: před spuštěním skriptu mu udělejte oprávnění ke spuštění spuštěním “chmod + x textcleaner„Jako root nebo s sudo předpona.
Kde:
textový čistič: volá program
-G: Převeďte obrázek na stupně šedi
-E: enache
-F: filtrovat
-s: sharpamt, množství doostření pixelů, které se použije na výsledek.
Informace a příklady použití s textcleanerem naleznete na adrese http: // www.fmwconcepts.com / imagemagick / textcleaner / index.php
Jak vidíte, textcleaner změnil barvu pozadí a zvýšil kontrast mezi písmem a pozadím.
Pokud spustíme tesseract, pravděpodobně bude výsledek jiný:
tesseract test.testovací výstup gifmenší testovací výstup
Jak vidíte, výsledek se opravdu zlepšil, i když není úplně přesný.
Příkaz konvertovat poskytované imagemagick nám umožňuje extrahovat snímky z obrázků GIF, které budou později zpracovány Tesseractem, což je užitečné, pokud je v různých rámcích obrázku GIF extrahovatelný obsah.
Syntaxe je jednoduchá:
konvertovatVýsledek bude vygenerován jako počet souborů jako rámců v gifu, v uvedeném příkladu budou výsledky: výstup-0.jpg, výstup-1.jpg, výstup-2.jpg, atd.
Pak je můžete zpracovat pomocí tesseractu a dát mu pokyn, aby zpracoval všechny soubory se zástupným znakem a uložil výsledek do jednoho souboru spuštěním:
pro i ve výstupu- *; dělat tesseract $ i outputresult; Hotovo;Imagemagick má obrovskou škálu možností pro optimalizaci obrázků a neexistuje obecný režim, pro každý druh scénáře byste si měli přečíst manuálovou stránku převodu.
Doufám, že vám tento návod na Tesseractu připadal užitečný.