Τι είναι μείωση με κλειδί;
Τι είναι μείωση με κλειδί;

Βίντεο: Τι είναι μείωση με κλειδί;

Βίντεο: Τι είναι μείωση με κλειδί;
Βίντεο: Η ινσουλίνη είναι το κλειδί για την μόνιμη απώλεια βάρους. Ο Jason Fung MD μας αποκαλύπτει... 2024, Νοέμβριος
Anonim

Η συνάρτηση Spark RDD reduceByKey συγχωνεύει τις τιμές για καθεμία κλειδί χρησιμοποιώντας έναν συνειρμικό περιορίζω λειτουργία. Αυτό σημαίνει διαισθητικά ότι αυτή η συνάρτηση παράγει το ίδιο αποτέλεσμα όταν εφαρμόζεται επαναλαμβανόμενα στο ίδιο σύνολο δεδομένων RDD με πολλαπλές κατατμήσεις ανεξάρτητα από τη σειρά των στοιχείων.

Τότε, ποια είναι η διαφορά μεταξύ του groupByKey και του reduceByKey;

groupByKey () είναι απλώς για να ομαδοποιήσετε το σύνολο δεδομένων σας με βάση ένα κλειδί. reduceByKey () είναι κάτι σαν ομαδοποίηση + συνάθροιση. reduceByKey μπορεί να χρησιμοποιηθεί όταν τρέχουμε σε μεγάλο σύνολο δεδομένων. Η aggregateByKey() είναι λογικά ίδια με reduceByKey () αλλά σας επιτρέπει να επιστρέψετε το αποτέλεσμα διαφορετικός τύπος.

Γνωρίστε επίσης, γιατί η μείωση είναι η δράση σε σπινθήρα; Μείωση σπινθήρα λειτουργία είναι μια δράση είδος λειτουργίας και ενεργοποιεί μια πλήρη εκτέλεση DAG για όλες τις παραταγμένες τεμπέλικες οδηγίες. Σπίθα RDD περιορίζω Η συνάρτηση μειώνει τα στοιχεία αυτού του RDD χρησιμοποιώντας τον καθορισμένο δυαδικό τελεστή αντικατάστασης και συσχέτισης. Μείωση σπινθήρα η λειτουργία είναι σχεδόν παρόμοια με περιορίζω μέθοδος στη Scala.

Εκτός από το παραπάνω, τι είναι το Pairrdd;

Το Spark παρέχει ειδικές λειτουργίες σε RDD που περιέχουν ζεύγη κλειδιών/τιμών. Αυτά τα RDD ονομάζονται ζεύγη RDD. Τα ζεύγη RDD είναι ένα χρήσιμο δομικό στοιχείο σε πολλά προγράμματα, καθώς εκθέτουν λειτουργίες που σας επιτρέπουν να ενεργείτε σε κάθε κλειδί παράλληλα ή να ομαδοποιείτε ξανά δεδομένα σε όλο το δίκτυο. PairRDDs είναι ζεύγη KEY/VALUE.

Είναι το reduceByKey μια ενέργεια;

Το reduce() εξάγει μια συλλογή που δεν προσθέτει στο κατευθυνόμενο άκυκλο γράφημα (DAG), επομένως υλοποιείται ως δράση . Ωστόσο, reduceByKey () επιστρέφει ένα RDD που είναι απλώς ένα άλλο επίπεδο/κατάσταση στο DAG, επομένως είναι ένας μετασχηματισμός.

Συνιστάται: