Què és DistCp a Hadoop?
Què és DistCp a Hadoop?

Vídeo: Què és DistCp a Hadoop?

Vídeo: Què és DistCp a Hadoop?
Vídeo: Hadoop Certification - HDPCA - Copy data between two clusters using distcp 2024, Maig
Anonim

DistCp (còpia distribuïda) és una eina que s'utilitza per a còpies grans entre clústers/intra-clústers. S'utilitza MapReduce per efectuar la seva distribució, tractament i recuperació d'errors i notificació. Amplia una llista de fitxers i directoris a les tasques d'entrada de mapes, cadascuna de les quals copiarà una partició dels fitxers especificats a la llista d'origen.

De la mateixa manera, es pot preguntar, sobreescriu Distcp?

També hauria d'elaborar alguns i explicar-ho discp - sobreescriure voluntat sobreescriure el fitxer, independentment de si la mida coincideix o no. Això actualitzarà tots els fitxers de hdfs-nn2 que no coincideixin amb la mida de hdfs-nn1, així com esborraran els fitxers aliens.

De la mateixa manera, què és l'ordre Hadoop FS? El sistema de fitxers ( FS ) shell inclou diversos tipus de shell ordres que interactuen directament amb el Hadoop Sistema de fitxers distribuït ( HDFS ) així com altres sistemes de fitxers que Hadoop suports, com ara Local FS , HFTP FS , S3 FS , i altres.

D'aquesta manera, com puc transferir dades d'un Hdf a un altre Hdf?

Hadoop fs cp - El més fàcil manera de copiar dades d'un directori font a un altre . Utilitzar el hadoop fs -cp [font] [destinació]. Hadoop fs copyFromLocal: cal copiar dades del sistema de fitxers local a HDFS ? Utilitzar el hadoop fs -copyFromLocal [font] [destinació].

Com puc copiar un clúster d'un clúster a un altre?

Còpia de fitxers entre clústers . Tu pots copiar fitxers o directoris entre diferents clústers mitjançant l'ordre hadoop distcp. Heu d'incloure una credencial dossier en el teu còpia demaneu així la font clúster pot validar que esteu autenticat a la font clúster i l'objectiu clúster.

Recomanat: