V roce 2020 bylo celkové množství dat vytvořených, zachycených, zkopírovaných a spotřebovaných ve světě 59 ZB a předpokládá se, že do roku 2025 dosáhne 175 ZB. Tento nárůst způsobuje, že centralizované datové architektury dosahují svých limitů.
Řešením tohoto problému je virtualizace dat. Navzdory tomu existuje mnoho mylných představ o této technologii. Kvůli tomu důvodu, denodovat sestavil seznam nejčastějších mýtů, které tento pojem obklopují.
„Správa dat je nezbytná pro provádění jakékoli obchodní strategie, a proto stále více společností zavádí virtualizaci dat, protože jim umožňuje optimalizovat čas, náklady a procesy,“ vysvětluje José Andrés García, zodpovědný za Iberii a Latinskou Ameriku ve společnosti Denodo.
Mýty o virtualizaci dat
Toto jsou nejvýznamnější mýty o technologii virtualizace dat:
- Virtualizace může být přetížena velkými datovými sadami a složitými dotazy. Virtualizace dat poskytuje jedinečný přístup k integraci a správě dat, který nenajdete v žádné jiné technologii. Před několika lety byla data vkládána na federovaný server, což je softwarový proces, který umožňoval více databázím fungovat jako jedna, ale nefungoval dobře při zpracování velkých datových sad nebo složitých dotazů. Dnešní řešení pro virtualizaci dat dokážou přepsat požadavky tak, aby byly zpracovány ve zdroji dat, čímž odpadá nutnost přesouvat data systémem. Zlepšení výkonu dotazů pro pomalejší zdroje dat pomocí místně uložených dat. Z tohoto důvodu jsou moderní platformy pro virtualizaci dat schopny zpracovávat složité dotazy rychle a efektivně.
- Nástroje BI a virtualizace dat jsou vzájemně zaměnitelné. Nástroje business intelligence nabízejí funkce pro kombinování dat, tj. pro koordinaci, zpracování a analýzu dat z různých zdrojů a vytváření sestav z nich s vizí orientovanou na podnikání. Jeho funkčnost je však velmi omezená, protože každý nástroj potřebuje své vlastní sémantické datové silo. To podle Forrester Consulting způsobuje překážky v přístupu k datům, integraci a kompatibilitě pro 8 z 10 společností. Spojení mezi různými nástroji není dáno, takže datový mix je zaměřen na nástroj konkrétního dodavatele. Místo toho je virtualizace dat schopna propojit data z libovolného zdroje s řadou spotřebitelů a nástrojů v jediné vrstvě celopodnikové datové struktury.
Přečtěte si o 5 nejvýznamnějších mýtech o virtualizaci dat
- Data Lake nahrazuje virtualizaci dat. Dnes jsou všechna firemní data uložena, analyzována a zpracována v Data Lakes, ale jsou extrémně složitá, ne všechna data do nich lze zkopírovat a datová jezera postrádají služby doručování dat. Místo toho, aby měli uživatelé k datům přístup, musí je vyhledávat. Virtualizace dat mezitím poskytuje přístup k datům z různých datových jezer az jiných zdrojů v jediné jednotné vrstvě a pomáhá uživatelům agilním způsobem najít a pochopit data v datovém jezeře.
- Při použití nástrojů ETL není nutná virtualizace dat. Nástroje ETL lze použít k extrahování dat z různých zdrojů, jejich transformaci a následnému načtení do databáze nebo datového skladu. Ale ETL struktury jsou křehké; Pokud je například přidán nový zdroj dat, společnosti upřednostňují vybudování nové struktury před změnou stávající. Na jedné straně to vytváří datová sila, což uživatelům ztěžuje rychlé nalezení a zpracování potřebných dat. Na druhou stranu to vede k duplicitě dat; společnosti mají v rámci své architektury distribuovány až 12 kopií stejných dat. Naproti tomu při virtualizaci dat zůstávají data tam, kde jsou, a jsou reprezentována pouze ve virtuální vrstvě. To ušetří až 30 % provozních nákladů a 50 % času ve srovnání s tradičními metodami integrace.
- Virtualizace dat s sebou nese ztrátu kontroly nad nimi. Virtualizace dat umožňuje všem zaměstnancům přístup k firemním datům, takže mohou sami rychle a snadno provádět analýzy prostřednictvím samoobslužných služeb. To však znamená, že se ztrácí celkový obraz o tom, kdo jaká data používá a jak to dělá. Realita je taková, že platformy pro virtualizaci dat nabízejí mnoho ovládacích prvků pro regulaci přístupu a omezení požadavků – například pokud jde o trvání, priority nebo řádky ve výsledku – a pro omezení jejich rozsahu, například pomocí filtrů. Společnosti mohou také poskytovat standardizovaná a připravená data svým zaměstnancům.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com