Top 20 algoritmů, metod a technik AI a strojového učení

Když jsem začal pracovat s problémy se strojovým učením, cítil jsem paniku, jaký algoritmus bych měl použít? Nebo který z nich je snadno použitelný? Pokud jste jako já, pak vám tento článek může pomoci dozvědět se o algoritmech, metodách nebo technikách umělé inteligence a strojového učení k řešení jakýchkoli neočekávaných nebo dokonce očekávaných problémů.

Strojové učení je tak výkonná technika AI, která dokáže efektivně vykonat úkol bez použití explicitních pokynů. Model ML se může učit ze svých dat a zkušeností. Aplikace pro strojové učení jsou automatické, robustní a dynamické. Pro řešení této dynamické povahy problémů v reálném životě je vyvinuto několik algoritmů. Obecně existují tři typy algoritmů strojového učení, jako je supervizované učení, nekontrolované učení a posilovací učení.

Nejlepší algoritmy umělé inteligence a strojového učení

Výběr vhodné techniky nebo metody strojového učení je jedním z hlavních úkolů vývoje projektu umělé inteligence nebo strojového učení. Protože existuje několik algoritmů, všechny mají své výhody a užitečnost. Níže vyprávíme 20 algoritmů strojového učení pro začátečníky i profesionály. Pojďme se tedy na to podívat.

1. Naivní Bayes

Naivní Bayesův klasifikátor je pravděpodobnostní klasifikátor založený na Bayesově větě s předpokladem nezávislosti mezi funkcemi. Tyto funkce se liší od aplikace k aplikaci. Je to jedna z pohodlných metod strojového učení pro začátečníky.

Naivní Bayes je model podmíněné pravděpodobnosti. Daný problémový případ, který má být klasifikován, reprezentovaný vektorem X = (Xi … Xn) představující několik n funkcí (nezávislé proměnné), přiřadí aktuální instanci pravděpodobnosti pro každý z K potenciálních výsledků:

Problém s výše uvedenou formulací spočívá v tom, že pokud je počet znaků n významný nebo pokud prvek může nabývat velkého počtu hodnot, je založení takového modelu na pravděpodobnostních tabulkách nemožné. Proto model přestavujeme, aby byl více přitažlivý. Použitím Bayesovy věty lze podmíněnou pravděpodobnost zapsat jako,

Použitím Bayesovské pravděpodobnostní terminologie lze výše uvedenou rovnici napsat jako:

Tento algoritmus umělé inteligence se používá při klasifikaci textu, tj.E., analýza sentimentu, kategorizace dokumentů, filtrování spamu a klasifikace zpráv. Tato technika strojového učení funguje dobře, pokud jsou vstupní data kategorizována do předdefinovaných skupin. Vyžaduje také méně dat než logistická regrese. Překonává v různých oblastech.

2. Podporujte vektorový stroj

Support Vector Machine (SVM) je jedním z nejčastěji používaných algoritmů strojového učení pod dohledem v oblasti klasifikace textu. Tato metoda se také používá pro regresi. Lze jej také označit jako Support Vector Networks. Cortes & Vapnik vyvinuli tuto metodu pro binární klasifikaci. Model supervizovaného učení je přístup strojového učení, který odvozuje výstup z označených tréninkových dat.

Stroj podpory vektor konstruuje nadrovinu nebo sadu nadrovin ve velmi vysoké nebo nekonečně rozměrné oblasti. Vypočítá lineární separační povrch s maximální rezervou pro danou tréninkovou sadu.

Pouze podmnožina vstupních vektorů ovlivní výběr okraje (na obrázku zakroužkovaný); takové vektory se nazývají podpůrné vektory. Pokud lineární separační plocha neexistuje, například za přítomnosti hlučných dat, jsou vhodné algoritmy SVM s proměnnou rezervou. Tento klasifikátor se pokusí rozdělit datový prostor pomocí lineárních nebo nelineárních vymezení mezi různými třídami.

SVM byl široce používán v problémech klasifikace vzorů a nelineární regrese. Je to také jedna z nejlepších technik pro provádění automatické kategorizace textu. Nejlepší na tomto algoritmu je, že nedává žádné silné předpoklady o datech.

Implementace Support Vector Machine: Data Science Libraries v Pythonu - SciKit Learn, PyML, SVM^Struct Knihovny Python, LIBSVM a datové vědy v R-Klar, e1071.

3. Lineární regrese

Lineární regrese je přímý přístup, který se používá k modelování vztahu mezi závislou proměnnou a jednou nebo více nezávislými proměnnými. Pokud existuje jedna nezávislá proměnná, nazývá se to jednoduchá lineární regrese. Pokud je k dispozici více než jedna nezávislá proměnná, pak se tomu říká vícenásobná lineární regrese.

Tento vzorec se používá k odhadu skutečných hodnot, jako je cena domů, počet hovorů, celkový prodej na základě průběžných proměnných. Zde je vztah mezi nezávislými a závislými proměnnými stanoven přizpůsobením nejlepší čáry. Tato nejlépe vyhovující přímka je známá jako regresní přímka a je představována lineární rovnicí

Y = a * X + b.

tady,

Y - závislá proměnná
a - sklon
X - nezávislá proměnná
b - zachytit

Tato metoda strojového učení se snadno používá. Provádí se rychle. To lze použít v podnikání pro prognózy prodeje. Lze jej také použít při hodnocení rizik.

4. Logistická regrese

Zde je další algoritmus strojového učení - logistická regrese nebo logitová regrese, která se používá k odhadu diskrétních hodnot (binární hodnoty jako 0/1, ano / ne, pravda / nepravda) na základě dané sady nezávislé proměnné. Úkolem tohoto algoritmu je předpovědět pravděpodobnost incidentu přizpůsobením dat logitové funkci. Jeho výstupní hodnoty leží mezi 0 a 1.

Vzorec lze použít v různých oblastech, jako je strojové učení, vědecká disciplína a lékařské obory. Lze jej použít k předpovědi nebezpečí výskytu dané nemoci na základě pozorovaných charakteristik pacienta. Logistickou regresi lze využít k predikci přání zákazníka koupit produkt. Tato technika strojového učení se používá v předpovědi počasí k předpovědi pravděpodobnosti deště.

Logistickou regresi lze rozdělit do tří typů -

Binární logistická regrese
Multi-nominální logistická regrese
Ordinální logistická regrese

Logistická regrese je méně komplikovaná. Je také robustní. Zvládne nelineární efekty. Pokud jsou však tréninková data řídká a vysoce dimenzionální, může tento algoritmus ML překonat. Nemůže předvídat průběžné výsledky.

5. K-nejbližší soused (KNN)

K-nejbližší soused (kNN) je dobře známý statistický přístup pro klasifikaci a byl v průběhu let široce studován a na úkoly kategorizace byl použit brzy. Funguje jako neparametrická metodika pro klasifikaci a regresní problémy.

Tato metoda AI a ML je docela jednoduchá. Určuje kategorii zkušebního dokumentu t na základě hlasování sady k dokumentů, které jsou nejblíže k t, pokud jde o vzdálenost, obvykle euklidovskou vzdálenost. Základní rozhodovací pravidlo dané testovacím dokumentem t pro klasifikátor kNN je:

Kde y (xi, c) je binární klasifikační funkce pro tréninkový dokument xi (který vrací hodnotu 1, pokud je xi označeno c, nebo 0 jinak), toto pravidlo označuje t s kategorií, která má v k největší počet hlasů - nejbližší sousedství.

Můžeme být mapováni KNN do našich skutečných životů. Například pokud byste chtěli zjistit několik lidí, o kterých nemáte žádné informace, pravděpodobně byste raději rozhodli o jeho blízkých přátelích a tedy kruzích, ve kterých se pohybuje, a získat přístup k jeho / jejím informacím. Tento algoritmus je výpočetně nákladný.

6. K-znamená

k-means clustering je metoda učení bez dohledu, která je přístupná pro klastrovou analýzu v dolování dat. Účelem tohoto algoritmu je rozdělit n pozorování na k shluky, kde každé pozorování patří k nejbližšímu průměru shluku. Tento algoritmus se používá v segmentaci trhu, počítačovém vidění a astronomii mezi mnoha dalšími doménami.

7. Rozhodovací strom

Rozhodovací strom je nástroj pro podporu rozhodování, který používá grafické znázornění, tj.E., stromový graf nebo model rozhodnutí. To se běžně používá v rozhodovací analýze a také populární nástroj ve strojovém učení. Rozhodovací stromy se používají v operačním výzkumu a řízení provozu.

Má strukturu podobnou vývojovému diagramu, ve kterém každý vnitřní uzel představuje ‚test 'na atributu, každá větev představuje výsledek testu a každý listový uzel představuje označení třídy. Cesta od kořene k listu je známá jako klasifikační pravidla. Skládá se ze tří typů uzlů:

Rozhodovací uzly: obvykle reprezentovány čtverci,
Šance uzly: obvykle reprezentovány kruhy,
Koncové uzly: obvykle představované trojúhelníky.

Rozhodovací strom je snadno pochopitelný a interpretovatelný. Používá model bílé skříňky. Může se také kombinovat s jinými rozhodovacími technikami.

8. Náhodný les

Náhodný les je oblíbená technika učení se souborům, která funguje tak, že se v době tréninku vytvoří řada rozhodovacích stromů a vytvoří se kategorie, která je režimem kategorií (klasifikace) nebo střední predikce (regrese) každého stromu.

Runtime tohoto algoritmu strojového učení je rychlé a je schopné pracovat s nevyváženými a chybějícími daty. Když jsme to však použili pro regresi, nemůže předpovídat mimo rozsah tréninkových dat a může to přesahovat data.

9. VOZÍK

Classification and Regression Tree (CART) je jeden druh rozhodovacího stromu. Rozhodovací strom funguje jako rekurzivní přístup k rozdělení a CART rozděluje každý ze vstupních uzlů na dva podřízené uzly. Na každé úrovni rozhodovacího stromu algoritmus identifikuje podmínku - která proměnná a úroveň se mají použít pro rozdělení vstupního uzlu na dva podřízené uzly.

Kroky algoritmu CART jsou uvedeny níže:

Vezměte vstupní data
Nejlepší Split
Nejlepší proměnná
Rozdělte vstupní data na levý a pravý uzel
Pokračujte krokem 2-4
Prořezávání rozhodovacích stromů

10. Algoritmus strojového učení Apriori

Algoritmus Apriori je kategorizační algoritmus. Tato technika strojového učení se používá pro třídění velkého množství dat. Lze jej také použít k sledování vývoje vztahů a vytváření kategorií. Tento algoritmus je metoda učení bez dozoru, která generuje pravidla přidružení z dané datové sady.

Algoritmus Apriori Machine Learning funguje jako:

Pokud se sada položek vyskytuje často, často se také vyskytují všechny podmnožiny sady položek.
Pokud se sada položek vyskytuje jen zřídka, pak se všechny nadmnožiny sady položek vyskytují také zřídka.

Tento algoritmus ML se používá v různých aplikacích, jako je detekce nežádoucích účinků léků, analýza tržního koše a aplikace automatického dokončování. Je to jednoduché implementovat.

11. Analýza hlavních komponent (PCA)

Analýza hlavních komponent (PCA) je algoritmus bez kontroly. Nové funkce jsou ortogonální, to znamená, že nejsou korelované. Před provedením PCA byste měli vždy normalizovat datovou sadu, protože transformace závisí na měřítku. Pokud tak neučiníte, budou funkce, které jsou v nejvýznamnějším měřítku, dominovat novým hlavním komponentám.

PCA je univerzální technika. Tento algoritmus je snadný a snadno implementovatelný. Lze jej použít při zpracování obrazu.

12. CatBoost

CatBoost je algoritmus strojového učení s otevřeným zdrojem, který pochází z Yandexu. Název „CatBoost“ pochází ze dvou slov „Kategorie“ a „Posílení.„Může se kombinovat s rámci pro hluboké učení, tj.E., Google TensorFlow a Apple Core ML. CatBoost může při řešení několika problémů pracovat s mnoha datovými typy.

13. Iterativní dichotomizátor 3 (ID3)

Iterativní Dichotomiser 3 (ID3) je algoritmus pro učení algoritmu učení rozhodovacího stromu, který předložil Ross Quinlan a který se používá k dodání rozhodovacího stromu ze sady dat. Je předchůdcem C4.5 algoritmický program a používá se v doménách procesu strojového učení a jazykové komunikace.

ID3 může překonat tréninková data. Toto algoritmické pravidlo je těžší použít na spojitá data. Nezaručuje optimální řešení.

14. Hierarchické shlukování

Hierarchické shlukování je způsob clusterové analýzy. V hierarchickém klastrování je pro ilustraci dat vyvinut strom klastru (dendrogram). V hierarchickém klastrování každá skupina (uzel) odkazuje na dvě nebo více následnických skupin. Každý uzel ve stromu clusteru obsahuje podobná data. Skupina uzlů v grafu vedle dalších podobných uzlů.

Algoritmus

Tuto metodu strojového učení lze rozdělit do dvou modelů - zdola nahoru nebo vzhůru nohama:

Zdola nahoru (hierarchické aglomerativní shlukování, HAC)

Na začátku této techniky strojového učení vezměte každý dokument jako jeden klastr.
V novém klastru sloučeny dvě položky najednou. Způsob sloučení kombajnů zahrnuje výpočet rozdílu mezi každým začleněným párem, a tedy i alternativními vzorky. Existuje mnoho možností, jak toho dosáhnout. Někteří z nich jsou:

A. Kompletní propojení: Podobnost nejvzdálenějšího páru. Jedno omezení je, že odlehlé hodnoty mohou způsobit sloučení blízkých skupin později, než je optimální.

b. Jednoduché propojení: Podobnost nejbližšího páru. Může to způsobit předčasné sloučení, i když tyto skupiny jsou zcela odlišné.

C. Skupinový průměr: podobnost mezi skupinami.

d. Centroidní podobnost: každá iterace sloučí shluky s nejpřednějším podobným středovým bodem.

Dokud se všechny položky nespojí do jednoho klastru, probíhá proces párování.

Shora dolů (rozdělující shlukování)

Data začínají kombinovaným klastrem.
Klastr se rozděluje na dvě odlišné části, podle určité míry podobnosti.
Klastry se znovu a znovu dělí na dvě, dokud klastry neobsahují pouze jeden datový bod.

15. Zpětná propagace

Zpětná propagace je algoritmus učení pod dohledem. Tento algoritmus ML pochází z oblasti ANN (Artificial Neural Networks). Tato síť je vícevrstvá dopředná síť. Tato technika má za cíl navrhnout danou funkci úpravou vnitřních vah vstupních signálů tak, aby vytvářely požadovaný výstupní signál. Může být použit pro klasifikaci a regresi.

Algoritmus zpětného šíření má některé výhody, tj.E., jeho snadné provedení. Matematický vzorec použitý v algoritmu lze použít na jakoukoli síť. Pokud jsou váhy malé, může se doba výpočtu zkrátit.

Algoritmus zpětného šíření má některé nevýhody, například může být citlivý na hlučná data a odlehlé hodnoty. Jedná se o přístup zcela založený na matici. Skutečný výkon tohoto algoritmu zcela závisí na vstupních datech. Výstup může být nečíselný.

16. AdaBoost

AdaBoost znamená Adaptive Boosting, metodu strojového učení, kterou představují Yoav Freund a Robert Schapire. Jedná se o meta-algoritmus a může být integrován do jiných algoritmů učení, aby se zlepšil jejich výkon. Tento algoritmus je rychlý a snadno použitelný. Funguje dobře s velkými datovými sadami.

17. Hluboké učení

Hluboké učení je sada technik inspirovaných mechanismem lidského mozku. Dva primární hluboké učení, tj.E., Při klasifikaci textu se používají konvoluční neuronové sítě (CNN) a rekurentní neurální sítě (RNN). Algoritmy hlubokého učení, jako je Word2Vec nebo GloVe, se také používají k získání vysoce hodnotných vektorových reprezentací slov a ke zlepšení přesnosti klasifikátorů, které jsou trénovány tradičními algoritmy strojového učení.

Tato metoda strojového učení vyžaduje místo tradičních algoritmů strojového učení hodně tréninkového vzorku, tj.E., minimálně miliony označených příkladů. Na druhou stranu tradiční techniky strojového učení dosahují přesné prahové hodnoty všude tam, kde přidání dalšího tréninkového vzorku celkově nezlepší jejich přesnost. Klasifikátory hlubokého učení překonávají lepší výsledky s více daty.

18. Algoritmus zvyšování přechodu

Gradient boosting je metoda strojového učení, která se používá pro klasifikaci a regresi. Je to jeden z nejsilnějších způsobů vývoje prediktivního modelu. Algoritmus pro zvýšení gradientu má tři prvky:

Funkce ztráty
Slabý žák
Aditivní model

19. Hopfieldova síť

Síť Hopfield je jedním druhem opakující se umělé neurální sítě dané Johnem Hopfieldem v roce 1982. Tato síť si klade za cíl uložit jeden nebo více vzorů a vyvolat úplné vzory na základě částečného vstupu. V síti Hopfield jsou všechny uzly vstupy i výstupy a jsou plně propojeny.

20. C4.5

C4.5 je rozhodovací strom, který vynalezl Ross Quinlan. Je to upgradovaná verze ID3. Tento algoritmický program zahrnuje několik základních případů:

Všechny vzorky v seznamu patří do podobné kategorie. Vytvoří listový uzel pro rozhodovací strom, který říká, že má rozhodnout o dané kategorii.
Vytvoří rozhodovací uzel výše na stromě pomocí očekávané hodnoty třídy.
Vytvoří rozhodovací uzel výše ve stromu pomocí očekávané hodnoty.

Končící myšlenky

K vývoji efektivního projektu strojového učení je velmi důležité použít správný algoritmus založený na vašich datech a doméně. Pochopení kritického rozdílu mezi každým algoritmem strojového učení je také důležité řešit, když si vyberu který.„Protože v přístupu strojového učení se stroj nebo zařízení naučilo prostřednictvím algoritmu učení. Pevně věřím, že tento článek vám pomůže porozumět algoritmu. Pokud máte jakýkoli návrh nebo dotaz, neváhejte se zeptat. Čti dál.