Què és AWS MapReduce?
Què és AWS MapReduce?

Vídeo: Què és AWS MapReduce?

Vídeo: Què és AWS MapReduce?
Vídeo: Introduction to Amazon Elastic MapReduce 2024, De novembre
Anonim

Amazon Elastic MapReduce (EMR) és un Amazon Web Services ( AWS ) eina de processament i anàlisi de big data. Amazon EMR processa grans dades a través d'un clúster Hadoop de servidors virtuals a Amazon Elastic Compute Cloud (EC2) i Amazon Simple Storage Service (S3).

D'aquesta manera, com funciona AWS EMR?

El servei inicia un nombre d'instàncies d'Amazon EC2 especificat pel client, format per un mestre i diversos altres nodes. Amazon EMR executa el programari Hadoop en aquests casos. El node mestre divideix les dades d'entrada en blocs i distribueix el processament dels blocs als altres nodes.

A més, quina diferència hi ha entre ec2 i EMR? A diferència EMR , EC2 no classifica els nodes esclaus en nodes bàsics i de tasca. Això augmenta el risc de perdre dades HDFS en cas que s'elimini/perdi un node. EC2 utilitza biblioteques Apache (s3a) per accedir a les dades de s3. Per altra banda, EMR utilitza codi propietari d'AWS per tenir un accés més ràpid a s3.

A més, AWS EMR està totalment gestionat?

Amazon Elastic MapReduce ( EMR ) és un gestionada totalment Plataforma Hadoop i Spark de Amazon Servei web ( AWS ). Amb EMR , AWS els clients poden activar ràpidament clústers Hadoop multinodes per processar càrregues de treball de grans dades.

AWS utilitza Hadoop?

Amazon Serveis web usos l'Apache de codi obert Hadoop tecnologia d'informàtica distribuïda per facilitar l'accés a grans quantitats de potència informàtica per executar tasques intensives en dades. Hadoop , la versió de codi obert de MapReduce de Google, ja està sent utilitzada per empreses com Yahoo i Facebook.

Recomanat: