Τι είναι η μορφή δεδομένων παρκέ;
Τι είναι η μορφή δεδομένων παρκέ;

Βίντεο: Τι είναι η μορφή δεδομένων παρκέ;

Βίντεο: Τι είναι η μορφή δεδομένων παρκέ;
Βίντεο: 06_01 Ετοιμασία πίνακα δεδομένων 2024, Νοέμβριος
Anonim

Απάχης Παρκέ είναι ένα δωρεάν και ανοιχτού κώδικα προσανατολισμένο στη στήλη δεδομένα αποθήκευση μορφή του οικοσυστήματος Apache Hadoop. Είναι συμβατό με τα περισσότερα από τα δεδομένα πλαίσια επεξεργασίας στο περιβάλλον Hadoop. Παρέχει αποτελεσματική δεδομένα σχήματα συμπίεσης και κωδικοποίησης με βελτιωμένη απόδοση για τη διαχείριση πολύπλοκων δεδομένα χύμα.

Απλώς, ποια είναι η μορφή αρχείου παρκέ;

Παρκέ , ανοιχτού κώδικα μορφή αρχείου για το Hadoop. Παρκέ αποθηκεύει ένθετες δομές δεδομένων σε μια επίπεδη στήλη μορφή . Σε σύγκριση με μια παραδοσιακή προσέγγιση όπου τα δεδομένα αποθηκεύονται σε προσέγγιση προσανατολισμένη στη σειρά, παρκέ είναι πιο αποτελεσματικό όσον αφορά την αποθήκευση και την απόδοση.

Επιπλέον, σε τι χρησιμεύει το παρκέ; Παρκέ είναι μια μορφή αρχείου ανοιχτού κώδικα διαθέσιμη σε οποιοδήποτε έργο στο οικοσύστημα Hadoop. Απάχης Παρκέ έχει σχεδιαστεί για αποτελεσματική και αποδοτική μορφή επίπεδης στήλης αποθήκευσης δεδομένων σε σύγκριση με αρχεία που βασίζονται σε σειρές όπως αρχεία CSV ή TSV.

Επιπλέον, πώς αποθηκεύει δεδομένα η μορφή παρκέ;

ΔΕΔΟΜΕΝΑ BLOCK Κάθε μπλοκ στο παρκέ αρχείο είναι αποθηκευμένο με τη μορφή ομάδων σειρών. Ετσι, δεδομένα σε ένα παρκέ το αρχείο χωρίζεται σε πολλές ομάδες σειρών. Αυτές οι ομάδες σειρών με τη σειρά τους αποτελούνται από ένα ή περισσότερα κομμάτια στηλών που αντιστοιχεί σε μια στήλη στο δεδομένα σειρά. ο δεδομένα για κάθε κομμάτι στήλης γραμμένο με τη μορφή σελίδων.

Είναι το παρκέ αναγνώσιμο από τον άνθρωπο;

ORC, Παρκέ , και το Avro είναι επίσης μηχανή- αναγνώσιμος δυαδικές μορφές, που σημαίνει ότι τα αρχεία μοιάζουν με ασυναρτησίες του ανθρώπου . Αν χρειάζεσαι ένας άνθρωπος - αναγνώσιμος μορφή όπως JSON ή XML, τότε μάλλον θα πρέπει να ξανασκεφτείτε γιατί χρησιμοποιείτε το Hadoop εξαρχής.

Συνιστάται: