Què és un llac de dades a Hadoop?
Què és un llac de dades a Hadoop?

Vídeo: Què és un llac de dades a Hadoop?

Vídeo: Què és un llac de dades a Hadoop?
Vídeo: Deployment and Maintaining Hadoop is not easy #Shorts 2024, De novembre
Anonim

A Llac de dades Hadoop és un dades plataforma de gestió integrada per una o més Hadoop clústers. S'utilitza principalment per processar i emmagatzemar no relacionals dades , com ara fitxers de registre, registres de clics d'Internet, sensor dades , objectes JSON, imatges i publicacions a les xarxes socials.

En aquest sentit, quina diferència hi ha entre un magatzem de dades i un llac de dades?

Llacs de dades i dades Els magatzems s'utilitzen àmpliament per emmagatzemar grans dades , però no són termes intercanviables. A llac de dades és una gran piscina de cru dades , la finalitat per la qual encara no està definit. A magatzem de dades és un repositori per estructurat, filtrat dades que ja s'ha processat amb una finalitat concreta.

A més, què és una arquitectura de llac de dades? A Data Lake és un dipòsit d'emmagatzematge que pot emmagatzemar una gran quantitat de material estructurat, semiestructurat i no estructurat dades . A diferència d'una casa de Dataware jeràrquica on dades s'emmagatzema a Fitxers i Carpetes, Llac de dades té un pis arquitectura.

En aquest sentit, què s'entén per Data Lake?

A llac de dades és un dipòsit d'emmagatzematge que conté una gran quantitat de raw dades en el seu format natiu fins que sigui necessari. Mentre que un jeràrquic dades botigues de magatzem dades en fitxers o carpetes, a llac de dades utilitza una arquitectura plana per emmagatzemar dades . El terme llac de dades sovint s'associa amb l'emmagatzematge d'objectes orientat a Hadoop.

Elasticsearch és un llac de dades?

A llac de dades és simplement un lloc per aparcar dades fins que ho necessiteu, i podria incloure HDFS (el més comú), emmagatzematge d'objectes, caixes NAS o qualsevol altra cosa. Fonamentalment, Elasticsearch és una eina d'indexació dades , no per a l'emmagatzematge de dades mateix.

Recomanat: