Ce este AWS MapReduce?
Ce este AWS MapReduce?

Video: Ce este AWS MapReduce?

Video: Ce este AWS MapReduce?
Video: Introduction to Amazon Elastic MapReduce 2024, Mai
Anonim

Amazon Elastic MapReduce (EMR) este un Amazon Web Services ( AWS ) instrument de prelucrare și analiză a datelor mari. Amazon EMR procesează date mari printr-un cluster Hadoop de servere virtuale pe Amazon Elastic Compute Cloud (EC2) și Amazon Simple Storage Service (S3).

În acest mod, cum funcționează AWS EMR?

Serviciul pornește un număr specificat de client de instanțe Amazon EC2, compus dintr-un master și mai multe alte noduri. Amazon EMR rulează software-ul Hadoop în aceste instanțe. Nodul master împarte datele de intrare în blocuri și distribuie procesarea blocurilor către celelalte noduri.

În afară de mai sus, care este diferența dintre ec2 și EMR? Spre deosebire de EMR , EC2 nu clasifică nodurile slave în noduri de bază și sarcini. Acest lucru crește riscul de a pierde date HDFS în cazul în care un nod este eliminat/pierdet. EC2 folosește bibliotecile Apache (s3a) pentru a accesa datele de pe s3. Pe de altă parte, EMR folosește codul proprietar AWS pentru a avea acces mai rapid la s3.

În plus, este AWS EMR gestionat în totalitate?

Amazon Elastic MapReduce ( EMR ) este a pe deplin gestionat Platforma Hadoop și Spark de la Amazon Serviciu web ( AWS ). Cu EMR , AWS clienții pot crea rapid clustere Hadoop cu mai multe noduri pentru a procesa încărcături de lucru mari de date.

AWS folosește Hadoop?

Amazon Servicii Web utilizări Apache cu sursă deschisă Hadoop tehnologie de calcul distribuită pentru a facilita accesul la cantități mari de putere de calcul pentru a rula sarcini mari de date. Hadoop , versiunea open-source a programului Google MapReduce, este deja folosită de companii precum Yahoo și Facebook.

Recomandat: