Ubuntu

Začínáme s Rstudio na Ubuntu Linux

Začínáme s Rstudio na Ubuntu Linux
Tento výukový program ilustruje, jak nainstalovat Rstudio na Ubuntu 20.04.

Rstudio poskytuje integrované vývojové prostředí pro zpracování bezplatného programovacího jazyka „R“, který je k dispozici na základě licence GNU. Rstudio je ideální výpočetní prostředí pro generování podrobných statistických vizualizací a jako takové je využíváno statistiky z celého světa.

RStudio je také k dispozici jako softwarový program a jako serverová aplikace, která se používá v různých distribucích Linuxu a pro Windows a macOS.

Stáhněte si programovací jazyk R. (Předpoklady)

Desktopová aplikace Rstudio potřebuje pro práci na distribucích Linuxu programovací jazyk R. Je nutné stáhnout verzi R, která je kompatibilní s vaším operačním systémem Linux. Můžete si jej stáhnout pomocí softwarového úložiště.

1- Stahování R pomocí webového prohlížeče

Pokud nemůžete získat R ze softwarového centra, znamená to, že je třeba nejprve aktualizovat úložiště. Stačí to všechno přeskočit a stáhnout z webu zadáním tohoto odkazu:

https: // cran.studio.com

Do vyhledávacího pole ve vašem webovém prohlížeči. Jejich domovská stránka by měla připomínat snímek obrazovky níže:

2- Stahování R z terminálu Linux

Spusťte terminál CLI, zadejte níže uvedený příkaz a stiskněte klávesu Enter:

Poté spusťte aktualizaci pomocí níže uvedených příkazů:

$ sudo apt-get aktualizace

Tento příkaz načte aktualizace R a získá všechny příslušné soubory z hlavního úložiště Ubuntu.

Potom zadejte následující příkaz k instalaci R:

Výše uvedený příkaz projde výpisem balíku, odhalí, kolik místa na disku zaplní, a poté požádá o potvrzení. Pokračujte v instalaci stisknutím klávesy „Y“ na klávesnici.

Výstup s největší pravděpodobností instalaci potvrdí.

Můžete jej vyhledat ve vyhledávacím poli, jak je znázorněno níže:

Instalace Rstudio na Ubuntu 20.04 s příkazovým terminálem

S nainstalovaným hostitelským programovacím jazykem můžeme nyní pokračovat v instalaci Rstudio. Abychom předvedli instalaci, použijeme terminál příkazového řádku.

Zapněte terminál a vydejte následující

$ sudo apt-get nainstalovat gdebi-core

Budete vyzváni k zadání hesla root. Po zadání hesla bude zahájena instalace balíčku

$ wget https: // download1.rstudio.org / desktop / bionic / amd64 / rstudio-1.3.1093-amd64.deb

Online balíček Rstudio je nyní připojen a přenáší se na váš pevný disk.

Budete požádáni o opětovné zadání hesla root. Zadejte heslo, aby se seznam balíků přečetl a načetl.

Nainstalovaný požádá o povolení pokračovat, stiskněte klávesu y na klávesnici.

Výstup ověří instalaci, jak je znázorněno níže.

Začínáme s RStudio:

Chcete-li spustit RStudio, přejděte do vyhledávacího pole a vyhledejte Rstudio. Uvidíte jej v jednom ze seznamů, jak je uvedeno níže:

Spusťte jej kliknutím na ikonu Rstudio.

Vyšetřování datových sad pomocí RStudio

S Rstudio můžete vizualizovat libovolná data ve formě grafů, tabulek a grafů.

Abychom pochopili, jak jsou data v Rstudiu vizuálně reprezentována, vezměme si jako příklad ukázkovou populaci sčítání lidu 2010 pro každé PSČ.

Proces analýzy dat lze nejasně zredukovat na následující čtyři kroky:

1 - Import surových dat

Nezpracovaná data můžete importovat přímo z webu do Rstudia tak, že to provedete systematicky v okně konzoly pomocí níže uvedeného příkazu:

$ CPD <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Po provedení příkazu získá Rstudio data jako soubor CSV z webu a obsah bude přiřazen proměnné cpd.

Dalším způsobem importu dat do Rstudia je ruční stažení datové sady na pevný disk a následné otevření obsahu pomocí funkce importu dat Rstudia.

Přejděte na možnost importu datové sady na kartě Prostředí a vyberte soubor datové sady, který chcete nahrát. Klikněte na OK a zobrazí se dialogové okno o datové sadě. Zde určíte parametry, stejně jako jména a desetinná místa. Až budete hotovi, stačí kliknout na import a datová sada bude přidána do Rstudia a k jejímu názvu bude přiřazena proměnná.

Chcete-li zjistit, jaké datové sady se používají, zadejte níže uvedený příkaz s proměnnou přiřazenou datové sadě:

$ Pohled (CPD)

2 - Manipulace s údaji

Nyní, když jste importovali datovou sadu, můžete pro transformaci těchto dat udělat hodně. S daty se manipuluje prostřednictvím transformačních funkcí. Předpokládejme, že chcete procházet určitým polem v rámci datové sady. Pokud bychom měli jít do sloupce s celkovým počtem obyvatel v naší datové sadě, zadali bychom následující příkaz:

$ cpd $ Celkový počet obyvatel

Data lze také získat ve formě vektoru:

$ cpd [1,3]

Funkce podmnožiny v Rstudiu nám umožňuje dotazovat se na datovou sadu. Řekněme, že musíme zvýraznit řádky, kde je poměr mužů a žen kladný. Chcete-li tyto řádky vybrat, vydáte následující příkaz:

$ a <- subset(cpd , Total Males > Celkem samic)

Ve výše uvedeném příkazu musel být prvním parametrem, který jsme přiřadili, proměnná přiřazená datové sadě, na kterou jsme funkci použili. Booleovská podmínka je považována za druhý parametr. Booleovský stav musí být také posouzen pro každý řádek. Slouží jako rozhodující faktor pro to, zda má být řádek součástí výstupu.

3 - Použití průměrných funkcí v datové sadě

Rstudio má specifické funkce pro výpočet průměrů v datové sadě:

$ průměr (cpd $ celkem muži) - vypočítá jednoduchý průměr
$ median (cpd $ Total Females) - udává medián pro sloupec
$ quantile (cpd $ Total Population) - dává kvantil pro sloupec
$ var (cpd $ celkem muži) - vypracuje rozptyl pro sloupec
$ sd (cpd $ celkem žen) - udává standardní odchylku

Chcete-li získat souhrnnou zprávu o datové sadě, můžete spustit libovolnou z těchto funkcí také na celé datové sadě.

$ souhrn (CPD)

4 - Vytvoření grafu pro datovou sadu

Pokud budete s Rstudiem často pracovat, najdete jeho vizualizační nástroj velmi vynalézavý. Z jakékoli importované datové sady můžete vytvořit graf pomocí grafu a dalších vizualizačních funkcí v Rstudiu.

Chcete-li vygenerovat scatterplot pro datovou sadu, vydáte následující příkaz:

$ plot (x = s $ celkem muži, y = s $ celkem ženy, typ = 'p')

Nyní pojďme diskutovat o zde zahrnutých parametrech. V každém parametru s odkazuje na podmnožinu původní datové sady a přidáním „p“ naznačujete, že chcete, aby byl výstup vykreslen.

Svou datovou sadu můžete také reprezentovat ve formě histogramu:

$ hist (cpd $ celkem domácností)

Podobně pro získání sloupcového grafu importované datové sady:

$ se počítá <- table(cpd$Total Population)
$ barplot (počty, main = "Celková distribuce populace"),
$ xlab = "Number of TotalPopulation")

Správa dat v nerovnoměrně rozmístěných časových řadách

Chcete-li spravovat data s nerovnoměrně rozmístěnými časovými řadami, měli byste integrovat balíček zoo s Rstudio. Balíček zoo získáte tak, že přejdete do pravého dolního rohu obrazovky v Rstudiu a do komponenty balíčku. Balíček zoo převádí data nepravidelných časových řad na objekty zoo. Argumenty vložené k vytvoření objektů zoo jsou data, která jsou na prvním místě, následovaná hodnotou, kterou je třeba objednat.

Objekty zoo poskytují podporu snadného použití. Vše, co musíte udělat, je napsat „plot“ a zobrazí se vám všechny metody vykreslení, které můžete použít s tímto balíčkem zoo.

Pokud se vám zdá, že máte nejasnosti ohledně toho, co určitá funkce Rstudio nabízí, zadejte název této funkce a řiďte se slovy „?”Pro zobrazení výzvy v nabídce nápovědy. Stisknutím klávesy ctrl + mezera za názvem funkce se také vytvoří okno automatického dokončování.

Balení

Tento výukový program ilustroval, jak můžete nastavit Rstudio na Ubuntu 20.04 a pokryli základy statistické reprezentace a manipulace s Rstudiem. Pokud si přejete Rstudio lépe využívat, měl by být dobrým prvním krokem seznámení se základy programování v R. Rstudio je výkonný nástroj a má aplikace v mnoha průmyslových odvětvích po celém světě: umělou inteligenci a dolování dat, abychom jmenovali alespoň některé.

Seznámení se s programováním R je trochu křivkou učení, ale stojí za to.

Hry Top 10 her k hraní na Ubuntu
Top 10 her k hraní na Ubuntu
Platforma Windows byla jednou z dominujících platforem pro hraní her kvůli velkému procentu her, které se dnes vyvíjejí, aby nativně podporovaly Windo...
Hry 5 nejlepších arkádových her pro Linux
5 nejlepších arkádových her pro Linux
V dnešní době jsou počítače vážné stroje používané k hraní her. Pokud nemůžete získat nové vysoké skóre, budete vědět, co tím myslím. V tomto příspěvk...
Hry Battle For Wesnoth 1.13.6 Vývoj uvolněn
Battle For Wesnoth 1.13.6 Vývoj uvolněn
Battle For Wesnoth 1.13.6 vydané minulý měsíc, je šestým vývojovým vydáním v 1.13.série x a přináší řadu vylepšení, zejména do uživatelského rozhraní,...