Semi Join vs Bloom Join
A Semi join és a Bloom join két összekapcsolási módszer, amelyet az elosztott adatbázisok lekérdezésének feldolgozásában használnak. A lekérdezések elosztott adatbázisokban történő feldolgozása során az adatokat át kell adni a különböző helyeken található adatbázisok között. Ez drága művelet lehet, az átadandó adatok mennyiségétől függően. Ezért a lekérdezések elosztott adatbázis-környezetben történő feldolgozása során fontos optimalizálni a lekérdezéseket a helyek között továbbított adatok mennyiségének minimalizálása érdekében. A félig csatlakozás és a virágcsatlakozás két módszer használható az adatátvitel mennyiségének csökkentésére és a lekérdezések hatékony feldolgozására.
Mi az a Semi Join?
A Semi join egy módszer a lekérdezések hatékony feldolgozására elosztott adatbázis-környezetekben. Vegyünk egy helyzetet, amikor az 1. telephelyen található Employee adatbázis (amely olyan információkat tartalmaz, mint az alkalmazott neve, osztály száma, amelynél dolgozik, stb.), És egy Tanszék adatbázisa (amely olyan információkat tartalmaz, mint az osztály száma, osztály neve, helye stb.) 2. Például, ha meg akarjuk szerezni az alkalmazott nevét és az osztály nevét, amelynél dolgozik (csak a „New York-ban található részlegeknél”), akkor a 3. helyen található lekérdező processzorral végrehajtva egy lekérdezést többféle módon adatokat lehetne továbbítani a három helyszín között ennek a feladatnak az elérése érdekében. De az adatok továbbításakor fontos megjegyezni, hogy nem szükséges a teljes adatbázist átvinni a helyek között. A lekérdezés hatékony végrehajtásához csak a csatlakozáshoz szükséges attribútumokat (vagy sorrendeket) kell átvinni a helyek között. A Semi join olyan módszer, amellyel csökkenthető a webhelyek között szállított adatok mennyisége. Félig egyesítéskor csak az összekötő oszlop kerül át az egyik helyről a másikra, majd ezt az átvitt oszlopot használják a többi hely közötti szállított kapcsolatok méretének csökkentésére. A fenti példához egyszerűen áthelyezheti a "New York" helyű szelvények osztályszámát és részlegnevét a 2. helyről az 1. helyre, elvégezheti az összekapcsolást az 1. helyen, és visszaviheti a végső relációt a 3. helyre.csak az összekötő oszlop kerül át egyik helyről a másikra, majd az áttöltött oszlop felhasználható a többi hely közötti szállított kapcsolatok méretének csökkentésére. A fenti példához egyszerűen áthelyezheti a "New York" helyű szelvények osztályszámát és részlegnevét a 2. helyről az 1. helyre, elvégezheti az összekapcsolást az 1. helyen, és visszaviheti a végső relációt a 3. helyre.csak az összekötő oszlop kerül át egyik helyről a másikra, majd az áttöltött oszlop felhasználható a többi hely közötti szállított kapcsolatok méretének csökkentésére. A fenti példához egyszerűen áthelyezheti a „New York” helyű sávok osztályszámát és osztályának nevét a 2. helyről az 1. helyre, és elvégezheti az összekapcsolást az 1. helyen, és a végső relációt visszahelyezheti a 3. helyre.
Mi a Bloom Join?
Mint korábban említettük, a bloom join egy másik módszer, amellyel elkerülhető a felesleges adatok átvitele a helyek között, amikor lekérdezéseket végeznek elosztott adatbázis-környezetben. A virágzó csatlakozás helyett az összekötő oszlop átvitele helyett az összekötő oszlop kompakt ábrázolása kerül át a helyek között. A Bloom join virágzásszűrőt használ, amely egy bitvektort alkalmaz a tagsági lekérdezések végrehajtására. Először egy virágzási szűrőt építenek az összekötő oszlop segítségével, és átkerülnek a helyek közé, majd végrehajtják az összekapcsolási műveleteket.
Mi a különbség a Semi Join és a Bloom Join között?
Annak ellenére, hogy az elosztott adatbázis-környezetben végzett lekérdezések végrehajtásakor mind a félig, mind a virágzáson alapuló módszereket alkalmazzák a helyek között továbbított adatok mennyiségének minimalizálására, a virágos összekapcsolás a virágzási szűrők fogalma, amelyek egy kis vektort alkalmaznak a beállított tagságok meghatározásához. Ezért a virágcsatlakozás használata hatékonyabb lesz, mint a félkötés használata.