Com s'aconsegueix la localització de dades a Hadoop?
Com s'aconsegueix la localització de dades a Hadoop?

Vídeo: Com s'aconsegueix la localització de dades a Hadoop?

Vídeo: Com s'aconsegueix la localització de dades a Hadoop?
Vídeo: XTCD_CDC Coordinació digital 2024, De novembre
Anonim

Localització de dades en Hadoop . Preneu l'exemple de recompte de paraules, on la majoria de paraules s'han repetit durant 5 Lacs o més vegades. En aquest cas, després de la fase del mapeador, cada sortida del mapeador tindrà paraules en el rang de 5 Lacs. Aquest procés complet d'emmagatzematge de la sortida de Mapper a LFS s'anomena com Localització de dades.

Tenint això a la vista, què és la localització de dades a Hadoop?

El concepte de Dades localitat a Dades Hadoop localitat a MapReduce es refereix a la capacitat de moure el càlcul a prop del lloc real dades resideix al node, en lloc de moure's gran dades al càlcul. Això minimitza la congestió de la xarxa i augmenta el rendiment global del sistema.

A més, com s'emmagatzemen les grans dades? La majoria de la gent associa automàticament HDFS, o Hadoop Distributed File System, amb Hadoop dades magatzems. HDFS emmagatzema informació en clústers que estan formats per blocs més petits. Aquests blocs ho són emmagatzemat en el físic in situ emmagatzematge unitats, com ara unitats de disc internes.

Així, com s'emmagatzemen les dades a Hadoop?

En una Hadoop clúster, el dades dins d'HDFS i el sistema MapReduce s'allotgen a totes les màquines del clúster. Dades és emmagatzemat en dades blocs als DataNodes. HDFS els replica dades blocs, normalment de 128 MB de mida, i els distribueix perquè es repliquin dins de diversos nodes del clúster.

Com s'emmagatzemen els fitxers a HDFS?

HDFS exposa a dossier l'espai de noms del sistema i permet que les dades de l'usuari siguin emmagatzemat en Fitxers . Internament, a dossier es divideix en un o més blocs i aquests blocs ho són emmagatzemat en un conjunt de DataNodes. S'executa el NameNode dossier operacions d'espai de noms del sistema com obrir, tancar i canviar el nom Fitxers i directoris.

Recomanat: