pandy

Jak používat Boxplot v Pythonu

Jak používat Boxplot v Pythonu
Krabicový graf se používá k shrnutí datových sad pomocí metody boxového a vláskového vykreslení. Tato funkce pomáhá uživatelům správně pochopit souhrn dat. Krabicové grafy mohou být velmi užitečné, když chceme vědět, jak jsou data distribuována a šířena. V grafu pole se k vykreslení dat používají tři typy kvartilů. Tyto hodnoty zahrnují medián, maximum, minimum, horní kvartil a statistické hodnoty dolního kvartilu. Krabicový graf shrnuje tato data do 25th, 50th, a 75th percentily. Tento tutoriál vám ukáže, jak pomocí políčka vytvořit grafy polí na základě dané datové sady pandy a mořský knihovny Pythonu.

Předpoklad

Pokud jste novým uživatelem Pythonu, budete muset nejprve nastavit prostředí tak, aby zobrazovalo výstup grafu pole. K provedení kódu můžete použít libovolného tlumočníka Pythonu. V tomto tutoriálu použiji spyder3 provést kód. Pokud jste nenainstalovali pandy a mořský libraries before, then you should run the following command from the terminal to install these libraries:

$ pip3 nainstalujte pandy Seaborn

Krabice s pandami

The boxplot () metoda pandy se používá ke generování údajů o krabicovém vykreslení na základě datového rámce. Tato metoda obsahuje mnoho argumentů; některé z těchto argumentů jsou použity v níže uvedených příkladech. Tato část tutoriálu bude obsahovat dva příklady, které vám ukážou, jak v něm vytvořit grafy polí pandy. Náhodně generovaná data v knihovně NumPy nebo data ze souboru CSV můžete použít ke generování grafu pole v pandy.

Příklad 1: Krabicové grafy založené na náhodných hodnotách

Krabicové grafy v následujícím příkladu byly generovány pomocí NumPy a pandy. Knihovna NumPy se ve skriptu používá k vytvoření objektu datového rámce generováním dvourozměrného pole náhodných hodnot, které obsahují 5 řádků a 5 sloupců. Obsah datového rámečku bude vytištěn pomocí hlava() metoda. Dále boxplot () metoda se používá ke generování grafů pole s modrou barvou, velikostí písma 10 a 30stupňovým úhlem otočení pro zobrazení hodnot sloupce.

#!/ usr / bin / env python3
# Importovat knihovnu pand
importovat pandy jako pd
# Importujte knihovnu NumPy a vytvořte náhodná čísla pro pole
importovat numpy jako np
"
Generujte datovou sadu na základě náhodně vytvořeného pole NumPy
a pět hodnot sloupců
"
dataframe = pd.DataFrame (np.náhodný.randn (5,5), columns = ['2016', '2017', '2018',
'2019', '2020'])
 
# Vytiskněte hodnoty datového rámce
tisk (datový rámec.hlava())
# Zobrazte graf pole na základě hodnot datového rámce
datový rámec.boxplot (mřížka = 'false', barva = 'modrá', velikost písma = 10, rotace = 30)

Výstup

Po provedení kódu se zobrazí následující výstup.

Příklad 2: Krabicové grafy založené na datech CSV

Krabicové grafy v následujícím příkladu byly generovány z dat CSV. Vytvořte soubor CSV s názvem banka.CSV pomocí následujících údajů.

banka.CSV

SL, Client_Name, Account_Type, Gender, Balance
1, Maria Hernandez, Saving, Female, 120000
2, Mary Smith, aktuální, žena, 40000
3, David Smith, aktuální, muž, 379000
4, Maria Rodriguez, Saving, Female, 56000
5, Mark Lee, Saving, Muž, 93500
6, Jonathan Bing, aktuální, muž, 5900
7, Daniel Williams, Saving, Muž, 2300
8, Mike Brown, Current, Male, 124888
9, Paul Smith, Current, Male, 59450
10, Maria Lopez, Saving, Female, 487600

V následujícím skriptu je matplotlib Knihovna byla použita k nastavení velikosti obrázku grafu pole a k zobrazení výstupního řádku. Všechny záznamy o banka.CSV soubor byl načten pomocí read_csv () metoda pandy. Prvních 8 záznamů datového rámce bylo poté vytištěno pomocí hlava() metoda. The boxplot () metoda byla použita v následujícím prohlášení k nakreslení obrázku pole pomocí červené barvy založené na 'Typ účtu' se sloupcem s názvem 'Zůstatek.''

#!/ usr / bin / env python3
# Importujte pandy pro generování grafu pole
importovat pandy jako pd
# Importujte matplotlib pro nastavení velikosti obrázku grafu pole
import matplotlib.pyplot jako plt
# Import get_ipython pro formátování výstupního řádku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastavte velikost obrázku
plt.rcParams ['obrázek.figsize '] = (8,4)
# Načtěte datovou sadu ze souboru CSV
df = pd.read_csv ("banka.csv ")
# Vytiskněte prvních 8 řádků načtených dat
tisk (srov.hlava (8))
# Zobrazte políčka na základě použitého parametru
df.boxplot (podle = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')

Výstup

Po provedení kódu se zobrazí následující výstup.

Krabice s mořským narozením

Další knihovnou Pythonu, která se běžně používá ke kreslení grafů polí, je knihovna mořský.  Jednou z důležitých funkcí této knihovny je, že má mnoho předdefinovaných ukázkových datových sad pro testování různých úkolů. Následující dva příklady se budou zabývat použitím dvou různých vzorových datových sad pro kreslení grafů polí pomocí mořský knihovna.

Příklad 3: Krabicové grafy založené na parametru x

Následující příklad používá ukázkovou datovou sadu s názvem 'diamanty, ' z Seaborn knihovna pro generování grafu pole. Zde je styl mřížky definován pomocí set_style () metoda. The load_dataset () metoda se používá k načtení datdiamanty datová sada. Prvních pět záznamů je vytištěno z datové sady a souboru boxplot () metoda se poté použije k vykreslení rámečkového grafu na základě sloupce s názvem 'hloubka,„s modrou barvou.

# Importovat Seaborn knihovnu pro generování pole plot
importovat seaborn jako sns
# Importujte matplotlib pro nastavení velikosti obrázku grafu pole
import matplotlib.pyplot jako plt
# Import get_ipython pro formátování výstupního řádku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastavit styl mřížky
sns.set_style ("whitegrid")
# Nastavte velikost obrázku
plt.rcParams ['obrázek.figsize '] = (8,4)
# Načtěte ukázkovou datovou sadu
diamond_dataset = sns.load_dataset ('diamonds')
# Zobrazit prvních 5 záznamů datové sady
print (diamond_dataset.hlava())
# Nakreslete obrázek políčka
sns.boxplot (x = diamond_dataset ['depth'], color = 'blue')

Výstup

Po provedení kódu se zobrazí následující výstup.

Příklad 4: Krabicové grafy založené na parametrech xay

Následující příklad používá ukázkovou datovou sadu s názvem 'lety'nakreslit krabicový graf. Zde jsou parametry xa y boxplot () k nakreslení obrázku se používá metoda. Ostatní příkazy jsou podobné předchozímu příkladu.

# Importovat Seaborn knihovnu pro generování pole plot
importovat seaborn jako sns
# Importujte matplotlib pro nastavení velikosti obrázku grafu pole
import matplotlib.pyplot jako plt
# Import get_ipython pro formátování výstupního řádku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Nastavit styl mřížky
sns.set_style ("darkgrid")
# Nastavte velikost obrázku
plt.rcParams ['obrázek.figsize '] = (12,4)
 
# Načtěte ukázkovou datovou sadu
flight_dataset = sns.load_dataset ('lety')
# Zobrazit prvních 5 záznamů datové sady
tisk (let_dataset.hlava())
 
# Nakreslete obrázek políčka
sns.boxplot (x = 'měsíc', y = 'cestující', data = letová_datazet, barva = 'modrá')

Výstup

Po provedení kódu se zobrazí následující výstup.

Závěr

Při práci s velkým množstvím dat budete možná chtít data shrnout pomocí diagramu, například rámečkového vykreslení. Tento výukový program použil několik příkladů, aby vám ukázal, jak generovat grafy polí se dvěma knihovnami Pythonu.

Hry SuperTuxKart pro Linux
SuperTuxKart pro Linux
SuperTuxKart je skvělý titul navržený tak, aby vám ve vašem systému Linux přinesl zážitek Mario Kart zdarma. Je to docela náročné a zábavné hrát, je n...
Hry Výukový program Battle for Wesnoth
Výukový program Battle for Wesnoth
The Battle for Wesnoth je jednou z nejpopulárnějších strategických her s otevřeným zdrojovým kódem, které si v tuto chvíli můžete zahrát. Tato hra se ...
Hry 0 A.D. Tutorial
0 A.D. Tutorial
Z mnoha strategických her venku je 0 A.D. dokáže vyniknout jako komplexní titul a velmi hluboká, taktická hra, přestože je otevřeným zdrojem. Vývoj hr...