Πίνακας περιεχομένων:

Μπορώ να τρέξω την Python στο Hadoop;
Μπορώ να τρέξω την Python στο Hadoop;

Βίντεο: Μπορώ να τρέξω την Python στο Hadoop;

Βίντεο: Μπορώ να τρέξω την Python στο Hadoop;
Βίντεο: Howto Install Hadoop Using Ambari on Ubuntu 2024, Ενδέχεται
Anonim

Με δυνατότητα επιλογής μεταξύ γλωσσών προγραμματισμού όπως Java, Scala και Πύθων Για Hadoop οικοσύστημα, χρησιμοποιούν οι περισσότεροι προγραμματιστές Πύθων λόγω των υποστηρικτικών βιβλιοθηκών για εργασίες ανάλυσης δεδομένων. Hadoop Η ροή επιτρέπει στον χρήστη να δημιουργεί και εκτέλεση Αντιστοίχιση/Μείωση εργασιών με οποιοδήποτε σενάριο ή εκτελέσιμο ως αντιστοίχιση ή/και μειωτήρα.

Ομοίως, ρωτάται, πώς συνδέεται η Python με το Hadoop;

Σύνδεση Hadoop HDFS με Python

  1. Βήμα 1: Βεβαιωθείτε ότι το Hadoop HDFS λειτουργεί σωστά. Ανοίξτε το Terminal/Command Prompt, ελέγξτε εάν το HDFS λειτουργεί χρησιμοποιώντας τις ακόλουθες εντολές: start-dfs.sh.
  2. Βήμα 2: Εγκαταστήστε τη βιβλιοθήκη libhdfs3.
  3. Βήμα 3: Εγκαταστήστε τη βιβλιοθήκη hdfs3.
  4. Βήμα 4: Ελέγξτε εάν η σύνδεση με το HDFS είναι επιτυχής.

Ομοίως, τι είναι το Hadoop στην Python; Πύθων είναι μια πλήρης γλώσσα προγραμματισμού γενικής χρήσης που μπορεί να χρησιμοποιηθεί για να κάνει σχεδόν τα πάντα στον κόσμο του προγραμματισμού. Hadoop είναι ένα πλαίσιο μεγάλων δεδομένων γραμμένο σε Java για την αντιμετώπιση τεράστιου όγκου δεδομένων. Υπάρχουν πολλά διαδικτυακά ινστιτούτα τα οποία Hadoop με Πύθων μαθήματα όπως: Analytixlabs. Εντουρέκα.

Στη συνέχεια, το ερώτημα είναι πώς μπορώ να εκτελέσω ένα πρόγραμμα Python MapReduce στο Hadoop;

Γράψιμο ενός προγράμματος Hadoop MapReduce σε Python

  1. Κίνητρο.
  2. Αυτό που θέλουμε να κάνουμε.
  3. Προαπαιτούμενα.
  4. Python MapReduce Code. Βήμα χάρτη: mapper.py. Βήμα μείωσης: reducer.py.
  5. Εκτέλεση του κώδικα Python στο Hadoop. Λήψη παραδείγματος δεδομένων εισόδου. Αντιγράψτε τοπικά παραδείγματα δεδομένων στο HDFS.
  6. Βελτιωμένος κώδικας Mapper και Reducer: χρησιμοποιώντας επαναλήπτες και γεννήτριες Python. mapper.py. μειωτήρας.py.

Τι είναι το βάζο Hadoop Streaming;

Hadoop Η διανομή παρέχει ένα βοηθητικό πρόγραμμα Java που ονομάζεται Hadoop Streaming . Είναι συσκευασμένο σε α δοχείο αρχείο. Με Hadoop Streaming , μπορούμε να δημιουργήσουμε και να εκτελέσουμε εργασίες Map Reduce με ένα εκτελέσιμο σενάριο. Hadoop Streaming είναι ένα βοηθητικό πρόγραμμα που συνοδεύει το Hadoop κατανομή. Μπορεί να χρησιμοποιηθεί για την εκτέλεση προγραμμάτων για ανάλυση μεγάλων δεδομένων.

Συνιστάται: