Rozdíl Mezi Semi Join A Bloom Join

Rozdíl Mezi Semi Join A Bloom Join
Rozdíl Mezi Semi Join A Bloom Join

Video: Rozdíl Mezi Semi Join A Bloom Join

Video: Rozdíl Mezi Semi Join A Bloom Join
Video: 1 Relational Algebra Semijoin 2024, Listopad
Anonim

Semi Join vs Bloom Join

Semi join a Bloom join jsou dvě metody spojování používané při zpracování dotazů pro distribuované databáze. Při zpracování dotazů v distribuovaných databázích je třeba data přenášet mezi databázemi umístěnými na různých webech. Může to být nákladná operace v závislosti na množství dat, která je třeba přenést. Proto je při zpracování dotazů v prostředí distribuované databáze důležité optimalizovat dotazy, aby se minimalizovalo množství dat přenášených mezi weby. Semi join a Bloom join jsou dvě metody, které lze použít ke snížení množství přenosu dat a provedení efektivního zpracování dotazů.

Co je Semi Join?

Semi join je metoda používaná pro efektivní zpracování dotazů v prostředí distribuované databáze. Zvažte situaci, kdy databáze zaměstnanců (obsahující informace, jako je jméno zaměstnance, číslo oddělení, pro které pracuje atd.) Umístěná na webu 1 a databáze oddělení (obsahující informace, jako je číslo oddělení, název oddělení, umístění atd.) Umístěná na webu 2. Například pokud chceme získat jméno zaměstnance a název oddělení, pro které pracuje (pouze oddělení umístěných v „New Yorku“), provedením dotazu v procesoru dotazu umístěném na webu 3, existuje několik způsobů, jak k dosažení tohoto úkolu lze mezi těmito třemi místy přenášet data. Ale při přenosu dat je důležité si uvědomit, že není nutné přenášet celou databázi mezi weby. K efektivnímu provedení dotazu je třeba mezi weby přenést pouze některé z atributů (nebo n-tic), které jsou vyžadovány pro spojení. Semi join je metoda, kterou lze použít ke snížení množství dat dodávaných mezi weby. V semi join se přenáší pouze sloupec spojení z jednoho webu na druhý a tento přenesený sloupec se potom používá ke zmenšení velikosti dodávaných vztahů mezi ostatními weby. U výše uvedeného příkladu stačí přenést číslo oddělení a název oddělení n-tic s umístěním = „New York“z webu 2 na web 1 a provést spojení na webu 1 a přenést konečný vztah zpět na web 3.pouze sloupec spojení se přenáší z jednoho webu na druhý a pak se tento přenesený sloupec používá ke zmenšení velikosti dodávaných vztahů mezi ostatními weby. U výše uvedeného příkladu stačí přenést číslo oddělení a název oddělení n-tic s umístěním = „New York“z webu 2 na web 1 a provést spojení na webu 1 a přenést konečný vztah zpět na web 3.pouze sloupec spojení se přenáší z jednoho webu na druhý a pak se tento přenesený sloupec používá ke zmenšení velikosti dodávaných vztahů mezi ostatními weby. U výše uvedeného příkladu stačí přenést číslo oddělení a název oddělení n-tic s umístěním = „New York“z webu 2 na web 1 a provést spojení na webu 1 a přenést konečný vztah zpět na web 3.

Co je Bloom Join?

Jak již bylo zmíněno dříve, Bloom join je další metoda používaná k zabránění přenosu zbytečných dat mezi weby při provádění dotazů v prostředí distribuované databáze. V Bloom join, místo přenosu samotného sloupce join, je mezi lokalitami přenesena kompaktní reprezentace sloupce join. Bloom join používá filtr Bloom, který využívá bitový vektor k provádění dotazů na členství. Nejprve se pomocí sloupce spojení vytvoří filtr květu, který se přenese mezi weby a poté se provedou operace spojování.

Jaký je rozdíl mezi Semi Join a Bloom Join?

I když se metody semi join a Bloom join používají k minimalizaci množství dat přenášených mezi weby při provádění dotazů v prostředí distribuované databáze, Bloom join snižuje množství přenesených dat (počet n-tic) ve srovnání s semi join pomocí koncept filtrů Bloom, které používají bitový vektor k určení členství v sadách. Používání Bloom join bude tedy efektivnější než použití semi join.

Doporučená: