kočičí duplikát.txt | třídit -k 2 | uniq -f 1
Pokud vás zajímá příznak „třídění“, je třeba říci „třídění“, aby se třídělo podle druhého sloupce.
Zobrazit všechny řádky kromě samostatných duplikátů
Podle všech výše zmíněných příkladů udržuje „uniq“ pouze první výskyt duplikovaného obsahu a zbytek odstraní. Co takhle odstranit duplicitní obsah úplně? Ano, pomocí příznaku „-u“ můžeme vynutit „uniq“, aby ponechal pouze neopakující se řádky.
kočičí duplikát.txt | třídit
kočičí duplikát.txt | třídit | uniq -u
Hmm, příliš mnoho duplikátů je nyní pryč ..
Přeskočit počáteční znaky
Diskutovali jsme o tom, jak říci „uniq“, aby dělal svou práci pro jiná pole, správně? Je čas zahájit kontrolu po několika počátečních znacích. Z tohoto důvodu bude příznak „-s“ doprovázený počtem znaků říkat „uniq“, aby vykonal práci.
kočičí duplikát.txt | třídit -k 2 | uniq -s 2
Je to podobné jako v příkladu, kdy měl „uniq“ dělat svůj úkol pouze ve druhém poli. Uvidíme další příklad s tímto trikem.
kočičí duplikát.txt | třídit | uniq -s 5
POUZE zkontrolujte počáteční znaky
Stejně jako jsme řekli „uniq“, aby přeskočil prvních pár znaků, je také možné říct „uniq“, aby omezil kontrolu u prvních pár znaků. Pro tento účel existuje vyhrazený příznak „-w“.
kočičí duplikát.txt | třídit | uniq -w 5
Tento příkaz říká „uniq“, aby provedl kontrolu jedinečnosti během prvních 5 znaků.
Podívejme se na další příklad tohoto příkazu.
kočičí duplikát.txt | třídit | uniq -w 5
Vymaže všechny ostatní instance „duplicitních“ záznamů, protože zkontrolovalo jedinečnost části „dupli“.
Necitlivost na velká a malá písmena
Při kontrole jedinečnosti zkontroluje „uniq“ také velikost písmen. V některých situacích nezáleží na citlivosti na velká a malá písmena, takže můžeme použít příznak „-i“ tak, aby „uniq“ nerozlišoval velká a malá písmena.
Zde vám představuji ukázkový soubor.
Některé opravdu chytré duplikace se směsí velkých a malých písmen, správně? Je čas vyzvat sílu „uniq“ k očištění nepořádku!
kočičí duplikát.txt | třídit | uniq -i
Přání uděleno!
Výstup zakončený NULL
Výchozí chování „uniq“ je ukončení výstupu novým řádkem. Výstup však lze ukončit také NULL. To je docela užitečné, pokud ho budete používat ve skriptování. Zde funguje příznak „-z“.
kočičí duplikát.txt | třídit | uniq -z
Kombinace více příznaků
Naučili jsme se řadu vlajek „uniq“, správně? Co takhle je spojit dohromady?
Například kombinuji necitlivost na velká a malá písmena a počet opakování dohromady.
Pokud někdy plánujete smíchat více vlajek dohromady, nejprve se ujistěte, že společně fungují správně. Někdy prostě věci nefungují tak, jak by měly.
Závěrečné myšlenky
„Uniq“ je zcela jedinečný nástroj, který Linux nabízí. Díky tolika výkonným funkcím může být užitečný mnoha způsoby. Seznam všech příznaků a jejich vysvětlení najdete na manuálových a informačních stránkách „uniq“.
muž uniq
info uniq
Užívat si!