Rozdíl Mezi Strojovým Učením Pod Dohledem A Bez Dozoru

Rozdíl Mezi Strojovým Učením Pod Dohledem A Bez Dozoru
Rozdíl Mezi Strojovým Učením Pod Dohledem A Bez Dozoru

Video: Rozdíl Mezi Strojovým Učením Pod Dohledem A Bez Dozoru

Video: Rozdíl Mezi Strojovým Učením Pod Dohledem A Bez Dozoru
Video: Inside the mind of a master procrastinator | Tim Urban 2025, Leden
Anonim

Klíčový rozdíl - supervidované a nekontrolované strojové učení

Učení pod dohledem a učení bez dozoru jsou dva základní pojmy strojového učení. Supervised Learning je strojové učení, jehož úkolem je naučit se funkci, která mapuje vstup na výstup na základě vzorových párů vstup-výstup. Unsupervised Learning je úkolem Machine Learning vyvodit funkci popisující skrytou strukturu z neoznačených dat. Klíčovým rozdílem mezi supervizovaným a nekontrolovaným strojovým učením je to, že supervizované učení používá označená data, zatímco neřízené učení používá neoznačená data.

Machine Learning je obor v informatice, který umožňuje počítačovému systému učit se z dat, aniž by byl výslovně naprogramován. Umožňuje analyzovat data a předvídat vzorce v nich. Existuje mnoho aplikací strojového učení. Některé z nich jsou rozpoznávání obličeje, rozpoznávání gest a rozpoznávání řeči. Se strojovým učením souvisejí různé algoritmy. Některé z nich jsou regrese, klasifikace a shlukování. Nejběžnější programovací jazyky pro vývoj aplikací založených na strojovém učení jsou R a Python. Lze použít i jiné jazyky, jako je Java, C ++ a Matlab.

OBSAH

1. Přehled a klíčový rozdíl

2. Co je supervidované učení

3. Co je supervidované učení

4. Podobnosti mezi supervizovaným a nekontrolovaným strojovým učením

5. Porovnání vedle sebe - supervidované vs. nekontrolované strojové učení ve formě tabulky

6. Shrnutí

Co je supervidované učení?

V systémech založených na strojovém učení model funguje podle algoritmu. V supervizovaném učení je model supervizován. Nejprve je nutné model trénovat. Se získanými znalostmi dokáže předvídat odpovědi pro budoucí instance. Model se trénuje pomocí označené datové sady. Když je systému poskytnuta data ze vzorku, může předpovědět výsledek. Následuje malý výňatek z populární datové sady IRIS.

Rozdíl mezi supervizovaným a nekontrolovaným učením Obrázek 02
Rozdíl mezi supervizovaným a nekontrolovaným učením Obrázek 02

Podle výše uvedené tabulky se Sepal délka, Sepal šířka, Patel délka, Patel šířka a Species nazývají atributy. Sloupce jsou známé jako funkce. Jeden řádek obsahuje data pro všechny atributy. Jeden řádek se proto nazývá pozorování. Data mohou být číselná nebo kategorická. Modelu jsou přidělena pozorování s odpovídajícím názvem druhu jako vstupem. Při novém pozorování by měl model předpovědět typ druhu, ke kterému patří.

V supervizovaném učení existují algoritmy pro klasifikaci a regresi. Klasifikace je proces klasifikace označených dat. Model vytvořil hranice, které oddělily kategorie dat. Když jsou modelu poskytnuta nová data, lze je kategorizovat podle toho, kde daný bod existuje. K-Nearest Neighbors (KNN) je klasifikační model. V závislosti na hodnotě k se rozhodne o kategorii. Například když k je 5, pokud se konkrétní datový bod blíží osmi datovým bodům v kategorii A a šesti datovým bodům v kategorii B, bude datový bod klasifikován jako A.

Regrese je proces predikce trendu předchozích dat k predikci výsledku nových dat. V regresi může výstup sestávat z jedné nebo více spojitých proměnných. Predikce se provádí pomocí čáry, která pokrývá většinu datových bodů. Nejjednodušší regresní model je lineární regrese. Je to rychlé a nevyžaduje vyladění parametrů jako v KNN. Pokud data ukazují parabolický trend, není lineární regresní model vhodný.

Rozdíl mezi učením pod dohledem a bez dozoru
Rozdíl mezi učením pod dohledem a bez dozoru

To je několik příkladů algoritmů učení pod dohledem. Výsledky generované metodami učení pod dohledem jsou obecně přesnější a spolehlivější, protože vstupní data jsou dobře známá a označená. Proto musí stroj analyzovat pouze skryté vzory.

Co je učení bez dozoru?

U učení bez dohledu není model pod dohledem. Model pracuje samostatně, aby předpověděl výsledky. Využívá algoritmy strojového učení k vyvození závěrů o neoznačených datech. Obecně platí, že algoritmy učení bez dohledu jsou těžší než algoritmy učení pod dohledem, protože existuje jen málo informací. Klastrování je typ učení bez kontroly. Lze jej použít ke seskupení neznámých dat pomocí algoritmů. K-průměr a shlukování založené na hustotě jsou dva shlukovací algoritmy.

Algoritmus k-mean umisťuje k centroid náhodně pro každý klastr. Pak je každému datovému bodu přiřazen nejbližší těžiště. Euklidovská vzdálenost se používá k výpočtu vzdálenosti od datového bodu k těžišti. Datové body jsou rozděleny do skupin. Pozice pro k centroidy se znovu vypočítají. Nová poloha těžiště je určena průměrem všech bodů ve skupině. Každý datový bod je opět přiřazen nejbližšímu těžišti. Tento proces se opakuje, dokud se centroidy již nezmění. k-mean je rychlý shlukovací algoritmus, ale neexistuje žádná specifikovaná inicializace shlukových bodů. Existuje také velká variace klastrových modelů založených na inicializaci bodů klastru.

Dalším algoritmem shlukování je shlukování založené na hustotě. To je také známé jako Density Based Spatial Clustering Applications with noise. Funguje to tak, že definujeme shluk jako maximální sadu připojených bodů hustoty. Jsou to dva parametry používané pro shlukování založené na hustotě. Jsou to Ɛ (epsilon) a minimální počet bodů. Ɛ je maximální poloměr okolí. Minimální body jsou minimální počet bodů v sousedství Ɛ k definování klastru. To je několik příkladů shlukování, které spadá do učení bez dozoru.

Obecně platí, že výsledky generované algoritmy učení bez dozoru nejsou příliš přesné a spolehlivé, protože stroj musí definovat a označit vstupní data před určením skrytých vzorů a funkcí.

Jaká je podobnost mezi supervizovaným a nekontrolovaným strojovým učením?

Dohled i nekontrolované učení jsou typy strojového učení

Jaký je rozdíl mezi supervizovaným a nekontrolovaným strojovým učením?

Rozdílný článek uprostřed před tabulkou

Supervised vs. Unsupervised Machine Learning

Supervised Learning je úkol strojového učení, který spočívá v učení funkce, která mapuje vstup na výstup na základě příkladných párů vstup-výstup. Unsupervised Learning je úkolem Machine Learning vyvodit funkci popisující skrytou strukturu z neoznačených dat.
Hlavní funkce
V supervizovaném učení model předpovídá výsledek na základě označených vstupních dat. V učení bez dohledu model předpovídá výsledek bez označených dat tím, že sám identifikuje vzory.
Přesnost výsledků
Výsledky generované metodami učení pod dohledem jsou přesnější a spolehlivější. Výsledky generované metodami učení bez dohledu nejsou příliš přesné a spolehlivé.
Hlavní algoritmy
V učení s dohledem existují algoritmy pro regresi a klasifikaci. Existují algoritmy pro shlukování v učení bez dozoru.

Shrnutí - Strojové učení pod dohledem a bez dozoru

Kontrolované učení a učení bez dozoru jsou dva typy strojového učení. Supervised Learning je úkol strojového učení, který spočívá v učení funkce, která mapuje vstup na výstup na základě příkladných párů vstup-výstup. Unsupervised Learning je úkolem Machine Learning vyvodit funkci popisující skrytou strukturu z neoznačených dat. Rozdíl mezi supervizovaným a nekontrolovaným strojovým učením je v tom, že supervizované učení používá označená data, zatímco bezobslužné opírání používá neoznačená data.