Rozdíl Mezi Dolování Dat A OLAP

Rozdíl Mezi Dolování Dat A OLAP
Rozdíl Mezi Dolování Dat A OLAP

Video: Rozdíl Mezi Dolování Dat A OLAP

Video: Rozdíl Mezi Dolování Dat A OLAP
Video: Portal - Знакомьтесь, модули 3 2025, Leden
Anonim

Dolování dat vs OLAP

Data mining i OLAP jsou dvě běžné technologie Business Intelligence (BI). Business inteligence označuje počítačové metody pro identifikaci a extrakci užitečných informací z obchodních dat. Data mining je oblast počítačové vědy, která se zabývá získáváním zajímavých vzorů z velkých souborů dat. Kombinuje mnoho metod od umělé inteligence, statistik a správy databází. OLAP (online analytické zpracování), jak název napovídá, je kompilací způsobů dotazování vícerozměrných databází.

Data mining je také známý jako Knowledge Discovery in data (KDD). Jak již bylo zmíněno výše, jedná se o oblast informatiky, která se zabývá extrakcí dříve neznámých a zajímavých informací ze surových dat. Vzhledem k exponenciálnímu růstu dat, zejména v oblastech, jako je podnikání, se těžba dat stala velmi důležitým nástrojem pro převod tohoto velkého množství dat na business intelligence, protože ruční extrakce vzorů je v posledních několika desetiletích zdánlivě nemožná. Například se v současné době používá pro různé aplikace, jako je analýza sociálních sítí, detekce podvodů a marketing. Data mining se obvykle zabývá následujícími čtyřmi úkoly: shlukování, klasifikace, regrese a asociace. Clustering identifikuje podobné skupiny z nestrukturovaných dat. Klasifikace jsou pravidla učení, která lze použít na nová data a obvykle zahrnují následující kroky: předzpracování dat, návrh modelování, výběr učení / funkce a hodnocení / ověření. Regrese je hledání funkcí s minimální chybou modelových dat. Asociace hledá vztahy mezi proměnnými. Data mining se obvykle používá k zodpovězení otázek, jaké jsou hlavní produkty, které by mohly ve Wal-Martu v příštím roce pomoci dosáhnout vysokého zisku. Data mining se obvykle používá k zodpovězení otázek, jaké jsou hlavní produkty, které by mohly ve Wal-Martu v příštím roce pomoci dosáhnout vysokého zisku. Data mining se obvykle používá k zodpovězení otázek, jaké jsou hlavní produkty, které by mohly ve Wal-Martu v příštím roce pomoci dosáhnout vysokého zisku.

OLAP je třída systémů, které poskytují odpovědi na vícerozměrné dotazy. OLAP se obvykle používá pro marketingové, rozpočtové, prognostické a podobné aplikace. Je samozřejmé, že databáze používané pro OLAP jsou konfigurovány pro složité a ad-hoc dotazy s ohledem na rychlý výkon. K zobrazení výstupu OLAP se obvykle používá matice. Řádky a sloupce jsou tvořeny rozměry dotazu. K získání souhrnů často používají metody agregace na více tabulkách. Lze jej například použít ke zjištění letošních tržeb ve společnosti Wal-Mart ve srovnání s loňským rokem? Jaká je predikce prodeje v příštím čtvrtletí? Co lze říci o trendu při pohledu na procentuální změnu?

Ačkoli je zřejmé, že Data mining a OLAP jsou podobné, protože pracují na datech za účelem získání inteligence, hlavní rozdíl pochází z toho, jak fungují na datech. Nástroje OLAP poskytují vícerozměrnou analýzu dat a poskytují souhrny dat, ale naopak, dolování dat se zaměřuje na poměry, vzory a vlivy v sadě dat. Jedná se o dohodu OLAP s agregací, která se scvrkává na provoz dat pomocí „přidání“, ale dolování dat odpovídá „rozdělení“. Dalším významným rozdílem je, že zatímco nástroje pro dolování dat modelují data a vracejí použitelná pravidla, OLAP bude provádět srovnávací a kontrastní techniky podél obchodní dimenze v reálném čase.