Quin és el motor de processament de dades darrere d'Amazon Elastic MapReduce?
Quin és el motor de processament de dades darrere d'Amazon Elastic MapReduce?

Vídeo: Quin és el motor de processament de dades darrere d'Amazon Elastic MapReduce?

Vídeo: Quin és el motor de processament de dades darrere d'Amazon Elastic MapReduce?
Vídeo: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024, Maig
Anonim

Amazon EMR utilitza Apache Hadoop com a distribuït motor de processament de dades . Hadoop és un marc de programari Java de codi obert que admet dades -aplicacions distribuïdes intensives que s'executen en grans clústers de maquinari de mercaderies.

A més, què és Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) és un Serveis web d'Amazon ( AWS ) eina de processament i anàlisi de big data. Amazon EMR processa grans dades en un clúster Hadoop de servidors virtuals Amazon Elastic Compute Cloud ( EC2 ) i Amazon Servei d'emmagatzematge simple ( S3 ).

A més, Amazon EMR està totalment gestionat? És un gestionada totalment servei de data llac que pot desacoblar l'emmagatzematge de dades dels recursos informàtics i, en canvi, fa que els clústers informàtics siguin escalables, disponibles per utilitzar-los sota demanda, i inclou la possibilitat que diversos clústers accedeixin als mateixos conjunts de dades alhora.

També es pot preguntar com funciona AWS EMR?

En general, quan processeu les dades Amazon EMR , l'entrada són dades emmagatzemades com a fitxers al sistema de fitxers subjacent que hàgiu triat, com ara Amazon S3 o HDFS. Aquestes dades passen d'un pas a un altre en la seqüència de processament. El pas final escriu les dades de sortida en una ubicació especificada, com ara un Amazon Cubell S3.

Quina diferència hi ha entre ec2 i EMR?

A diferència EMR , EC2 no classifica els nodes esclaus en nodes bàsics i de tasca. Això augmenta el risc de perdre dades HDFS en cas que s'elimini/perdi un node. EC2 utilitza biblioteques Apache (s3a) per accedir a les dades de s3. Per altra banda, EMR utilitza codi propietari d'AWS per tenir un accés més ràpid a s3.

Recomanat: