Taula de continguts:

Com puc millorar el meu rendiment de sqoop?
Com puc millorar el meu rendiment de sqoop?

Vídeo: Com puc millorar el meu rendiment de sqoop?

Vídeo: Com puc millorar el meu rendiment de sqoop?
Vídeo: Релиз Java 17 и Windows 11. Платный Docker и новые MacBook от Apple [MJC News #9] 2024, Maig
Anonim

Per optimitzar rendiment , conjunt el nombre de tasques de mapa a un valor inferior a el nombre màxim de connexions que el suport de bases de dades. Controlant el quantitat de paral·lelisme que Sqoop utilitzarà per transferir dades és el forma principal de controlar el carregar teu base de dades.

En conseqüència, què passa si sqoop falla entre un procés?

Un típic Sqoop El treball que està ingerint dades d'una base de dades d'origen a HDFS copiarà les dades a un directori de destinació. El fitxer copiat s'eliminarà si sqoop falla sense completar.

També es pot preguntar, com s'aconsegueix el paral·lelisme en sqoop? Controlant Paral·lelisme . Sqoop importa dades en paral·lel de la majoria de fonts de bases de dades. Podeu especificar el nombre de tasques de mapa (processos paral·lels) que cal utilitzar per dur a terme la importació mitjançant l'argument -m o --num-mappers. Cadascun d'aquests arguments pren un valor enter que correspon al grau de paral·lelisme contractar

En conseqüència, com puc millorar el rendiment de la meva consulta Hive?

A continuació es mostra la llista de pràctiques que podem seguir per optimitzar les consultes Hive

  1. Activa la compressió a Hive.
  2. Optimitzar les unions.
  3. Eviteu la classificació global a Hive.
  4. Activa el motor d'execució Tez.
  5. Optimitza l'operador LIMIT.
  6. Activa l'execució en paral·lel.
  7. Activa el mode estricte de Mapreduce.
  8. Reducció únic per multigrup BY.

Com funciona sqoop split?

Es pot utilitzar per millorar el rendiment d'importació aconseguint un major paral·lelisme. Sqoop crea es divideix basat en els valors d'una columna particular de la taula que s'especifica per -- dividir -per l'usuari mitjançant l'ordre d'importació. Si no està disponible, s'utilitza la clau primària de la taula d'entrada per crear el es divideix.

Recomanat: