Τι είναι μια λίμνη δεδομένων στο Hadoop;
Τι είναι μια λίμνη δεδομένων στο Hadoop;

Βίντεο: Τι είναι μια λίμνη δεδομένων στο Hadoop;

Βίντεο: Τι είναι μια λίμνη δεδομένων στο Hadoop;
Βίντεο: Η λίμνη των κύκνων | Swan Lake Story in Greek @GreekFairyTales 2024, Νοέμβριος
Anonim

ΕΝΑ Λίμνη δεδομένων Hadoop είναι ένα δεδομένα πλατφόρμα διαχείρισης που περιλαμβάνει μία ή περισσότερες Hadoop συστάδες. Χρησιμοποιείται κυρίως για την επεξεργασία και αποθήκευση μη σχεσιακών δεδομένα , όπως αρχεία καταγραφής, εγγραφές ροής κλικ στο Διαδίκτυο, αισθητήρας δεδομένα , αντικείμενα JSON, εικόνες και αναρτήσεις μέσων κοινωνικής δικτύωσης.

Από αυτή την άποψη, ποια είναι η διαφορά μεταξύ μιας αποθήκης δεδομένων και μιας λίμνης δεδομένων;

Λίμνες δεδομένων και δεδομένα και οι δύο αποθήκες χρησιμοποιούνται ευρέως για την αποθήκευση μεγάλων δεδομένα , αλλά δεν είναι εναλλάξιμοι όροι. ΕΝΑ λίμνη δεδομένων είναι μια τεράστια δεξαμενή ακατέργαστων δεδομένα , ο σκοπός του οποίου δεν έχει ακόμη καθοριστεί. ΕΝΑ αποθήκη δεδομένων είναι ένα αποθετήριο για δομημένο, φιλτραρισμένο δεδομένα που έχει ήδη υποβληθεί σε επεξεργασία για συγκεκριμένο σκοπό.

Επιπλέον, τι είναι η αρχιτεκτονική λιμνών δεδομένων; ΕΝΑ Λίμνη Δεδομένων είναι ένα αποθετήριο αποθήκευσης που μπορεί να αποθηκεύσει μεγάλη ποσότητα δομημένων, ημιδομημένων και μη δομημένων δεδομένα . Σε αντίθεση με έναν ιεραρχικό οίκο Dataware όπου δεδομένα αποθηκεύεται σε αρχεία και φάκελο, Λίμνη δεδομένων έχει ένα διαμέρισμα αρχιτεκτονική.

Σε σχέση με αυτό, τι σημαίνει λίμνη δεδομένων;

ΕΝΑ λίμνη δεδομένων είναι ένα αποθετήριο αποθήκευσης που περιέχει μια τεράστια ποσότητα ακατέργαστων δεδομένα στην αρχική του μορφή μέχρι να χρειαστεί. Ενώ μια ιεραρχική δεδομένα καταστήματα αποθήκης δεδομένα σε αρχεία ή φακέλους, α λίμνη δεδομένων χρησιμοποιεί μια επίπεδη αρχιτεκτονική για αποθήκευση δεδομένα . Ο όρος λίμνη δεδομένων Συσχετίζεται συχνά με αποθήκευση αντικειμένων προσανατολισμένη στο Hadoop.

Είναι το Elasticsearch μια λίμνη δεδομένων;

ΕΝΑ λίμνη δεδομένων είναι απλά ένα μέρος για να παρκάρετε δεδομένα μέχρι να το χρειαστείτε και θα μπορούσε να περιλαμβάνει HDFS (το πιο συνηθισμένο), αποθήκευση αντικειμένων, κουτιά NAS ή οτιδήποτε άλλο. Βασικά, Elasticsearch είναι ένα εργαλείο για ευρετηρίαση δεδομένα , όχι για την αποθήκευση του δεδομένα εαυτό.

Συνιστάται: