Πίνακας περιεχομένων:

Πώς μπορώ να βελτιώσω την απόδοσή μου στο sqoop;
Πώς μπορώ να βελτιώσω την απόδοσή μου στο sqoop;

Βίντεο: Πώς μπορώ να βελτιώσω την απόδοσή μου στο sqoop;

Βίντεο: Πώς μπορώ να βελτιώσω την απόδοσή μου στο sqoop;
Βίντεο: Hadoop Rack Awareness 2024, Νοέμβριος
Anonim

Για βελτιστοποίηση εκτέλεση , σετ ο αριθμός εργασιών χάρτη σε τιμή μικρότερη από ο μέγιστος αριθμός συνδέσεων που ο υποστηρίζει βάση δεδομένων. Έλεγχος ο ποσότητα παραλληλισμού που Sqoop θα χρησιμοποιηθεί για τη μεταφορά δεδομένων είναι ο κύριος τρόπος ελέγχου ο φορτίο επάνω τα δικα σου βάση δεδομένων.

Αντίστοιχα, τι συμβαίνει εάν το sqoop αποτύχει στο μεταξύ μιας διαδικασίας;

Ένα τυπικό Sqoop Η εργασία που απορροφά δεδομένα από μια βάση δεδομένων πηγής στο HDFS θα αντιγράψει τα δεδομένα σε έναν κατάλογο προορισμού. Το αντιγραμμένο αρχείο πρόκειται να διαγραφεί εάν το sqoop αποτύχει χωρίς συμπλήρωση.

Μπορεί επίσης να ρωτήσει κανείς, πώς επιτυγχάνετε τον παραλληλισμό στο sqoop; Έλεγχος Παραλληλισμός . Sqoop εισάγει δεδομένα παράλληλα από τις περισσότερες πηγές βάσης δεδομένων. Μπορείτε να καθορίσετε τον αριθμό των εργασιών χάρτη (παράλληλες διεργασίες) που θα χρησιμοποιηθούν για την εκτέλεση της εισαγωγής χρησιμοποιώντας το όρισμα -m ή --num-mappers. Κάθε ένα από αυτά τα ορίσματα παίρνει μια ακέραια τιμή που αντιστοιχεί στον βαθμό του παραλληλισμός να απασχολήσει

Κατά συνέπεια, πώς μπορώ να βελτιώσω την απόδοση ερωτημάτων Hive μου;

Παρακάτω είναι η λίστα των πρακτικών που μπορούμε να ακολουθήσουμε για να βελτιστοποιήσουμε τα Hive Queries

  1. Ενεργοποίηση συμπίεσης στο Hive.
  2. Optimize Joins.
  3. Αποφύγετε την καθολική ταξινόμηση στο Hive.
  4. Ενεργοποιήστε το Tez Execution Engine.
  5. Βελτιστοποίηση τελεστή LIMIT.
  6. Ενεργοποίηση παράλληλης εκτέλεσης.
  7. Ενεργοποιήστε την αυστηρή λειτουργία Mapreduce.
  8. Single Reduce for Multi Group BY.

Πώς λειτουργεί το sqoop split;

Μπορεί να χρησιμοποιηθεί για τη βελτίωση της απόδοσης των εισαγωγών επιτυγχάνοντας μεγαλύτερο παραλληλισμό. Sqoop δημιουργεί χωρίζει με βάση τις τιμές σε μια συγκεκριμένη στήλη του πίνακα που καθορίζεται από -- διαίρεση -από τον χρήστη μέσω της εντολής εισαγωγής. Εάν δεν είναι διαθέσιμο, το πρωτεύον κλειδί του πίνακα εισόδου χρησιμοποιείται για τη δημιουργία του χωρίζει.

Συνιστάται: