Τι είναι το Gensim στην Python;
Τι είναι το Gensim στην Python;

Βίντεο: Τι είναι το Gensim στην Python;

Βίντεο: Τι είναι το Gensim στην Python;
Βίντεο: Gensim in Python Explained for Beginners | Learn Machine Learning 2024, Νοέμβριος
Anonim

Gensim είναι μια βιβλιοθήκη ανοιχτού κώδικα για μοντελοποίηση θεμάτων χωρίς επίβλεψη και επεξεργασία φυσικής γλώσσας, χρησιμοποιώντας σύγχρονη στατιστική μηχανική μάθηση. Gensim υλοποιείται σε Πύθων και Cython.

Έχοντας αυτό υπόψη, τι είναι το Gensim Word2Vec;

1. Εισαγωγή του Word2vec . Word2vec είναι μια από τις πιο δημοφιλείς τεχνικές για την εκμάθηση ενσωματώσεων λέξεων χρησιμοποιώντας ένα νευρωνικό δίκτυο δύο επιπέδων. Η είσοδος του είναι ένα σώμα κειμένου και η έξοδος του είναι ένα σύνολο διανυσμάτων. Υπάρχουν δύο κύριοι αλγόριθμοι εκπαίδευσης για word2vec , το ένα είναι η συνεχής τσάντα λέξεων (CBOW), ένα άλλο ονομάζεται skip-gram.

Επιπλέον, πώς λειτουργεί η σύνοψη του Gensim; Εκμάθηση: αυτόματη συνόψιση χρησιμοποιώντας Gensim . Αυτή η ενότητα συνοψίζει αυτόματα το δεδομένο κείμενο, εξάγοντας μία ή περισσότερες σημαντικές προτάσεις από το κείμενο. Με παρόμοιο τρόπο, αυτό μπορώ εξάγετε επίσης λέξεις-κλειδιά.

Στη συνέχεια, κάποιος μπορεί επίσης να ρωτήσει, πώς μπορώ να εισάγω το Gensim στην Python;

5 Απαντήσεις. Πρώτα πρέπει να εγκαταστήσετε το NumPy μετά το SciPy και μετά Gensim (αν υποθέσουμε ότι το έχετε ήδη Πύθων εγκατεστημένο). χρησιμοποίησα Πύθων 3.4 καθώς θεωρώ ευκολότερο να εγκαταστήσω το SciPy χρησιμοποιώντας την έκδοση 3.4. ΣΗΜΕΙΩΣΕΙΣ: Βεβαιωθείτε ότι το pip βρίσκεται στις μεταβλητές περιβάλλοντος (προσθέστε C:python34scripts στη μεταβλητή περιβάλλοντος).

Τι είναι ένα σώμα Gensim;

Το επόμενο σημαντικό αντικείμενο με το οποίο πρέπει να εξοικειωθείτε για να εργαστείτε gensim είναι το Σώμα (ένα σακουλάκι με λέξεις). Δηλαδή είναι α σώμα αντικείμενο που περιέχει τη λέξη id και τη συχνότητά της σε κάθε έγγραφο. Μπορείτε να το σκεφτείτε ως του gensim ισοδύναμο πίνακα Document-Term.

Συνιστάται: