Data Science

Výukový program pro Python Seaborn

Výukový program pro Python Seaborn
V této lekci o knihovně Python Seaborn se podíváme na různé aspekty této knihovny vizualizace dat, kterou můžeme pomocí Pythonu použít ke generování krásných a intuitivních grafů, které dokážou vizualizovat data ve formě, kterou chce podnik z platformy. Aby byla tato lekce kompletní, probereme následující části:

Vypadá to, že je toho hodně k pokrytí. Pojďme začít hned.

Co je knihovna Python Seaborn?

Seaborn library je balíček Pythonu, který nám umožňuje vytvářet infografiky založené na statistických datech. Protože je vytvořen nad matplotlib, je s ním ve své podstatě kompatibilní. Kromě toho podporuje datovou strukturu NumPy a Pandas, takže vykreslování lze provádět přímo z těchto sbírek.

Vizualizace komplexních dat je jednou z nejdůležitějších věcí, o které se Seaborn stará. Pokud bychom měli porovnat Matplotlib se Seabornem, Seaborn je schopen usnadnit ty věci, které je obtížné dosáhnout pomocí Matplotlibu. Je však důležité si to uvědomit Seaborn není alternativou k Matplotlibu, ale jeho doplňkem. V této lekci budeme využívat funkce Matplotlib také ve fragmentech kódu. Se společností Seaborn se rozhodnete pracovat v následujících případech použití:

Před spuštěním je třeba poznamenat, že pro tuto lekci používáme virtuální prostředí, které jsme vytvořili pomocí následujícího příkazu:

python -m virtualenv seaborn
zdroj seaborn / bin / aktivovat

Jakmile je virtuální prostředí aktivní, můžeme nainstalovat knihovnu Seaborn do virtuálního prostředí, aby bylo možné provést příklady, které vytvoříme dále:

pip nainstalujte seaborn

Anacondu můžete také použít ke spuštění těchto příkladů, což je jednodušší. Chcete-li jej nainstalovat na svůj počítač, podívejte se na lekci, která popisuje „Jak nainstalovat Anaconda Python na Ubuntu 18.04 LTS ”a podělte se o svůj názor. Pojďme nyní k různým typům grafů, které lze sestavit pomocí Python Seaborn.

Používání datové sady Pokemon

Abychom tuto lekci udrželi, použijeme datovou sadu Pokemon, kterou si můžete stáhnout z Kaggle. K importu této datové sady do našeho programu budeme používat knihovnu Pandas. Tady jsou všechny importy, které provádíme v našem programu:

importovat pandy jako pd
z matplotlib importovat pyplot jako plt
importovat seaborn jako sns

Nyní můžeme importovat datovou sadu do našeho programu a ukázat některá ukázková data pomocí Pandas jako:

df = pd.read_csv ('Pokémon.csv ', index_col = 0)
df.hlava()

Chcete-li spustit výše uvedený fragment kódu, datová sada CSV by měla být přítomna ve stejném adresáři jako samotný program. Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup (v notebooku Anaconda Jupyter):

Vynesení křivky lineární regrese

Jednou z nejlepších věcí na Seabornu jsou inteligentní vykreslovací funkce, které poskytuje a které nejen vizualizují datovou sadu, kterou jí poskytujeme, ale také kolem ní konstruují regresní modely. Například je možné sestrojit lineární regresní graf s jediným řádkem kódu. Postup je následující:

sns.lmplot (x = 'Attack', y = 'Defense', data = df)

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Ve výše uvedeném fragmentu kódu jsme si všimli několika důležitých věcí:

Nebojte se, pokud jste si mysleli, že bez této regresní čáry nemůžeme mít spiknutí. Můžeme ! Zkusme nyní nový fragment kódu, podobný tomu poslednímu:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)

Tentokrát neuvidíme regresní čáru v našem grafu:

Nyní je to mnohem jasnější (pokud nepotřebujeme lineární regresní linii). Ale to ještě neskončilo. Seaborn nám umožňuje odlišit tuto zápletku a to budeme dělat.

Vytváření grafů polí

Jednou z největších vlastností Seabornu je to, jak snadno přijímá strukturu datových rámců Pandas pro vykreslování dat. Můžeme jednoduše předat Dataframe knihovně Seaborn, aby z ní mohla sestavit boxplot:

sns.boxplot (data = df)

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Můžeme odstranit první čtení celkem, protože to vypadá trochu trapně, když zde skutečně vykreslujeme jednotlivé sloupce:

stats_df = df.pokles (['Celkem'], osa = 1)
# Nový boxplot pomocí stats_df
sns.boxplot (data = stats_df)

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Roj pozemek s Seaborn

Můžeme vytvořit intuitivní design Swarm plot s Seaborn. Znovu použijeme datový rámec z Pandas, který jsme načetli dříve, ale tentokrát budeme volat funkci zobrazení Matplotlib, abychom ukázali děj, který jsme vytvořili. Zde je fragment kódu:

sns.set_context ("paper")
sns.swarmplot (x = "Útok", y = "Obrana", data = df)
plt.ukázat()

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Použitím kontextu Seaborn umožňujeme Seabornu přidat osobní nádech a plynulý design zápletky. Tento graf je možné ještě více přizpůsobit vlastní velikostí písma použitou pro popisky v grafu, aby bylo čtení snazší. K tomu předáme více parametrů funkci set_context, která funguje stejně jako to, co zní. Například k úpravě velikosti písma štítků použijeme písmo.parametr velikosti. Zde je úryvek kódu, který provede úpravu:

sns.set_context ("paper", font_scale = 3, rc = "font.velikost ": 8," osy.labelsize ": 5)
sns.swarmplot (x = "Útok", y = "Obrana", data = df)
plt.ukázat()

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Velikost písma pro štítek byla změněna na základě parametrů, které jsme poskytli, a hodnoty přidružené k písmu.parametr velikosti. Jednou z věcí, na které je Seaborn odborníkem, je vytvořit graf velmi intuitivní pro praktické použití, což znamená, že Seaborn není jen praktický balíček Pythonu, ale ve skutečnosti něco, co můžeme použít v našich produkčních nasazeních.

Přidání názvu k grafům

Je snadné přidávat tituly k našim plánům. Musíme jen postupovat podle jednoduchého postupu používání funkcí na úrovni os, kde budeme volat set_title () funkce, kterou zobrazujeme ve fragmentu kódu zde:

sns.set_context ("paper", font_scale = 3, rc = "písmo.velikost ": 8," osy.labelsize ": 5)
my_plot = sns.swarmplot (x = "Útok", y = "Obrana", data = df)
my_plot.set_title ("LH Swarm Plot")
plt.ukázat()

Jakmile spustíme výše uvedený fragment kódu, uvidíme následující výstup:

Tímto způsobem můžeme k našim pozemkům přidat mnohem více informací.

Seaborn vs Matplotlib

Když jsme se podívali na příklady v této lekci, můžeme zjistit, že Matplotlib a Seaborn nelze přímo porovnávat, ale lze je považovat za vzájemně se doplňující. Jednou z funkcí, která Seaborn posune o krok vpřed, je způsob, jakým může Seaborn statisticky vizualizovat data.

Abychom parametry Seaborn využili co nejlépe, důrazně doporučujeme nahlédnout do dokumentace Seaborn a zjistit, jaké parametry použít, aby byl váš pozemek co nejblíže obchodním potřebám.

Závěr

V této lekci jsme se podívali na různé aspekty této knihovny vizualizace dat, kterou můžeme pomocí Pythonu použít ke generování krásných a intuitivních grafů, které dokážou vizualizovat data ve formě, kterou chce podnik z platformy. Seaborm je jednou z nejdůležitějších vizualizačních knihoven, pokud jde o datové inženýrství a prezentaci dat ve většině vizuálních forem, což je určitě dovednost, kterou musíme mít pod opaskem, protože nám umožňuje vytvářet modely lineární regrese.

Sdělte nám svůj názor na lekci na Twitteru s @sbmaggarwal a @LinuxHint.

Ubuntu Změnit pozadí obrazovky přihlášení
Kdykoli se přihlásíte do počítače, zobrazí se obrazovka s dotazem na vaše pověření k ověření, že jste to vy. Po zadání hesla jste ve svém světě. Pokaž...
Ubuntu Změňte heslo
Z hlediska bezpečnosti je Linux rozhodně jedním z nejpřísnějších. Systém hesel je jednou z nejdůležitějších částí. Bez hesla nemáte přístup do zabezpe...
Jak přidat a odebrat PPA na Ubuntu
Pokud používáte Ubuntu, jste již seznámeni se softwarovým úložištěm. Je to OBROVSKÁ sbírka všech potřebných nástrojů, které Ubuntu potřebuje ke spuště...