Τι είναι το AWS MapReduce;
Τι είναι το AWS MapReduce;

Βίντεο: Τι είναι το AWS MapReduce;

Βίντεο: Τι είναι το AWS MapReduce;
Βίντεο: Create and Execute MapReduce in Eclipse 2024, Ενδέχεται
Anonim

Amazon Elastic ΜΕΙΩΣΗ ΧΑΡΤΗ (EMR) είναι μια υπηρεσία Web της Amazon ( AWS ) εργαλείο επεξεργασίας και ανάλυσης μεγάλων δεδομένων. Το Amazon EMR επεξεργάζεται μεγάλα δεδομένα σε ένα σύμπλεγμα εικονικών διακομιστών Hadoop στο Amazon Elastic Compute Cloud (EC2) και στο Amazon Simple Storage Service (S3).

Με αυτόν τον τρόπο, πώς λειτουργεί το AWS EMR;

Η υπηρεσία ξεκινά έναν αριθμό παρουσιών Amazon EC2 που καθορίζεται από τον πελάτη, που αποτελείται από έναν κύριο και πολλούς άλλους κόμβους. Αμαζόνα EMR εκτελεί το λογισμικό Hadoop σε αυτές τις περιπτώσεις. Ο κύριος κόμβος διαιρεί τα δεδομένα εισόδου σε μπλοκ και διανέμει την επεξεργασία των μπλοκ στους άλλους κόμβους.

Εκτός από τα παραπάνω, ποια είναι η διαφορά μεταξύ ec2 και EMR; Διαφορετικός EMR , EC2 δεν κατηγοριοποιεί τους slave κόμβους σε κόμβους πυρήνα και task. Αυτό αυξάνει τον κίνδυνο απώλειας δεδομένων HDFS σε περίπτωση που αφαιρεθεί/χαθεί ένας κόμβος. EC2 χρησιμοποιεί βιβλιοθήκες Apache (s3a) για πρόσβαση σε δεδομένα στο s3. Αφ 'ετέρου, EMR χρησιμοποιεί ιδιόκτητο κώδικα AWS για να έχει ταχύτερη πρόσβαση στο s3.

Εξάλλου, το AWS EMR διαχειρίζεται πλήρως;

Αμαζόνα Ελαστικός Χάρτης Μείωση ( EMR ) είναι ένα πλήρως διαχείριση Hadoop and Spark πλατφόρμα από Αμαζόνα Υπηρεσία Ιστού ( AWS ). Με EMR , AWS Οι πελάτες μπορούν γρήγορα να δημιουργήσουν συστάδες Hadoop πολλαπλών κόμβων για να επεξεργαστούν μεγάλο φόρτο εργασίας δεδομένων.

Το AWS χρησιμοποιεί Hadoop;

Αμαζόνα Διαδικτυακές υπηρεσίες χρήσεις τον ανοιχτού κώδικα Apache Hadoop κατανεμημένη υπολογιστική τεχνολογία για να διευκολύνει την πρόσβαση σε μεγάλες ποσότητες υπολογιστικής ισχύος για την εκτέλεση εργασιών έντασης δεδομένων. Hadoop , η έκδοση ανοιχτού κώδικα του MapReduce της Google, χρησιμοποιείται ήδη από εταιρείες όπως το Yahoo και το Facebook.

Συνιστάται: