Klíčový rozdíl - dolování dat vs strojové učení
Dolování dat a strojové učení jsou dvě oblasti, které jdou ruku v ruce. Jelikož jsou vztahy, jsou si podobné, ale mají různé rodiče. Ale v současné době oba rostou stále více jako jeden jiný; téměř podobné jako dvojčata. Někteří lidé proto používají k těžbě dat slovo strojové učení. Při čtení tohoto článku však pochopíte, že jazyk stroje se liší od dolování dat. Klíčovým rozdílem je, že dolování dat se používá k získání pravidel z dostupných dat, zatímco strojové učení učí počítač učit se a rozumět daným pravidlům.
Co je dolování dat?
Dolování dat je proces extrakce implicitních, dříve neznámých a potenciálně užitečných informací z dat. Přestože dolování dat zní nově, technologie tomu tak není. Dolování dat je hlavní metodou výpočetního zveřejňování vzorů ve velkých souborech dat. Zahrnuje také metody na křižovatce strojového učení, umělé inteligence, statistických a databázových systémů. Pole dolování dat zahrnuje databázi a správu dat, předběžné zpracování dat, úvahy o odvození, úvahy o složitosti, následné zpracování objevených struktur a online aktualizace. Data bagrování, rybolov dat a snooping dat jsou běžněji odkazujícími pojmy v dolování dat.
Společnosti dnes používají výkonné počítače ke zkoumání velkého množství dat a k dlouhodobému analyzování zpráv z průzkumů trhu. Data mining pomáhá těmto společnostem identifikovat vztah mezi interními faktory, jako je cena, dovednosti zaměstnanců, a externími faktory, jako je konkurence, ekonomická situace a demografické údaje zákazníků.
Diagram procesu těžby dat CRISP
Co je to strojové učení?
Strojové učení je součástí počítačové vědy a je velmi podobné těžbě dat. Strojové učení se také používá k prohledávání systémů za účelem hledání vzorů a prozkoumání konstrukce a studia algoritmů. Strojové učení je druh umělé inteligence, která poskytuje počítačům schopnost učit se bez výslovného programování. Strojové učení se zaměřuje hlavně na vývoj počítačových programů, které se mohou naučit růst a měnit se podle nových situací a opravdu se blíží výpočtovým statistikám. Má také silné vazby na matematickou optimalizaci. Mezi nejběžnější aplikace strojového učení patří filtrování spamu, optické rozpoznávání znaků a vyhledávače.
Automatizovaný online asistent je aplikace strojového učení
Strojové učení je někdy v rozporu s dolováním dat, protože oba jsou jako dvě tváře na kostkách. Úkoly strojového učení se obvykle dělí do tří širokých kategorií, jako je učení pod dohledem, učení bez dozoru a posilovací učení.
Jaký je rozdíl mezi dolováním dat a strojovým učením?
Jak fungují
Dolování dat: Dolování dat je proces, který začíná zdánlivě nestrukturovanými daty a hledá zajímavé vzory.
Strojové učení: Strojové učení používá mnoho algoritmů.
Data
Dolování dat: Data mining se používá k extrakci dat z jakéhokoli datového skladu.
Strojové učení: Strojové učení je čtení stroje, který souvisí se systémovým softwarem.
aplikace
Dolování dat: Dolování dat využívá hlavně data z konkrétní domény.
Strojové učení: Techniky strojového učení jsou poměrně obecné a lze je použít na různá nastavení.
Soustředit se
Těžba dat: Komunita dolování dat se zaměřuje hlavně na algoritmy a aplikace.
Strojové učení: Komunity strojového učení platí za teorie více.
Metodologie
Dolování dat: Data mining se používá k získání pravidel z dat.
Strojové učení: Strojové učení učí počítač učit se a rozumět daným pravidlům.
Výzkum
Dolování dat: Data mining je oblast výzkumu, která využívá metody jako strojové učení.
Strojové učení: Strojové učení je metodika, která umožňuje počítačům provádět inteligentní úkoly.
Souhrn:
Dolování dat vs. strojové učení
Ačkoli se strojové učení s dolováním dat zcela liší, jsou si obvykle podobné. Data mining je proces extrakce skrytých vzorů z velkých dat a strojové učení je nástroj, který lze také použít. Pole strojového učení se dále rozvíjelo v důsledku budování AI. Data Miners mají obvykle velký zájem o strojové učení. Jak těžba dat, tak strojové učení spolupracují stejně pro rozvoj AI i pro výzkumné oblasti.
Obrázek se svolením:
1. „Procesní diagram CRISP-DM“od Kennetha Jensena - vlastní práce. [CC BY-SA 3.0] prostřednictvím Wikimedia Commons
2. „Automatizovaný online asistent“Bemidji State University [Public Domain] prostřednictvím Wikimedia Commons