Per què Hadoop és més barat?
Per què Hadoop és més barat?

Vídeo: Per què Hadoop és més barat?

Vídeo: Per què Hadoop és més barat?
Vídeo: Все шуруповёрты ломаются из-за этого! Хватит допускать эту ошибку! 2024, De novembre
Anonim

Hadoop és relativament barat

El cost per terabyte per implementar a Hadoop clúster és més barat que el cost per terabyte per configurar un sistema de còpia de seguretat en cinta. D'acord, a Hadoop El sistema costa més d'operar, perquè les unitats de disc que contenen les dades estan totes en línia i alimentades, a diferència de les unitats de cinta.

D'aquesta manera, Hadoop és rendible?

Hadoop ofereix un sistema escalable, cost - efectiu i una solució d'alta disponibilitat per a l'emmagatzematge i processament de grans dades. L'ús d'una capa física no propietària redueix molt la dependència de la tecnologia. També ofereix una capacitat de dimensionament elàstic quan es desplega a màquines virtuals o fins i tot al núvol IAAS.

A més, per què l'espurna és millor que Hadoop? Apache Espurna – Espurna és una eina informàtica de clúster ràpida. Apache Espurna executa aplicacions fins a 100 vegades més ràpid a la memòria i 10 vegades més ràpid al disc que Hadoop . A causa de la reducció del nombre de cicles de lectura/escriptura al disc i l'emmagatzematge de dades intermèdies a la memòria Espurna ho fa possible.

Tenint això en compte, quant costa Hadoop?

Per a una classe empresarial Hadoop clúster, es recomana un servidor Intel de gamma mitjana. Aquests normalment cost De 4.000 a 6.000 dòlars per node amb capacitats de disc entre 3 TB i 6 TB depenent del rendiment desitjat. Això vol dir node cost és d'aproximadament entre 1.000 i 2.000 dòlars per TB. HDFS no té limitacions físiques en la mida dels fitxers.

Per què Hadoop és més ràpid?

La raó per la qual és Spark més ràpid que Hadoop és que Spark processa tot a la memòria. També pot utilitzar el disc per a dades que no caben totes a la memòria.

Recomanat: