Opinion mining from data of social media by probabilistic logic reasoning.
Εξαγωγή γνώμης σε δεδομένα των κοινωνικών μέσων με πιθανοτική λογική συλλογιστική.
View/ Open
Date
2020-09-23Author
Zervoudakis, Stefanos
Ζερβουδάκης, Στέφανος
Metadata
Show full item recordAbstract
This thesis studies opinion mining from social media with probabilistic logic reasoning. Twitter is one of the most active social networks, with millions of tweets sent daily, where multiple users express their opinion about travelling, economic issues, political decisions etc. As such, it offers a valuable source of information for opinion mining. Our approach uses a Bayesian-based opinion mining framework exploiting Twitter Data. It is described by the following steps. First, the framework of our approach imports Tweets massively by using Twitter’s API. Next, the imported Tweets are further processed automatically for constructing a set of untrained rules and random variables. Then, a Bayesian Network is derived by using the sets of untrained rules, the random variables and an evidence set. After that, the trained model can be used for the evaluation of new Tweets. Finally, the constructed model can be retrained incrementally thus becoming more robust.
As application domain for the development of our methodology we have selected tourism because it is one of the most popular topics in social media. Our system can predict with some probability users’ preferences, regarding their intention to visit a place or not. We have developed algorithms which create automatically efficient rules and random variables based on the trainset. Our system uses for model training the probabilistic logic reasoning system of ProbLog. The advantages of our approach are the following. First, our system follows an incremental learning strategy. That is, the derived model can be retrained incrementally with new training sets thus becoming more robust. Second, our system can be easily adapted to opinion mining from social media on other topics. Finally, the rules of the derived model are constructed in an efficient way and automatically. Στα πλαίσια αυτής της εργασίας μελετήθηκε η εξαγωγή γνώμης στα κοινωνικά μέσα με πιθανοτική λογική συλλογιστική. Το Twitter είναι ένα από τα πιο δημοφιλή κοινωνικά δίκτυα με εκατομμύρια χρήστες καθημερινά ενεργούς χρήστες που εκφράζουν την γνώμη τους σε θέματα όπως ταξίδια, οικονομία, πολιτική. Η συγκεκριμένη εφαρμογή διαθέτη πολύτιμη πληροφορία για εξόρυξη γνώμης. Η προσέγγισή μας χρησιμοποιεί ένα framework εξόρυξης απόψεων το οποίο βασίζεται σε Μπαεσιανή προσέγγιση όπου εκμεταλλεύεται τα δεδομένα που μπορούν να αξιοποιηθούν από το Twitter (tweets). Το σύστημα που δημιουργήσαμε περιγράφεται στα εξής βήματα. Αρχικά το σύστημα μας, παίρνει δεδομένα από το Twitter με την χρήση του Twitter API. Με τα εισαγόμενα δεδομένα (τουιτς) το σύστημα μας εξάγει ένα σύνολο από μη εκπαιδευμένους κανόνες και τυχαίες μεταβλητές. Στην συνέχεια χρησιμοποιώντας κάποιους αλγορίθμους που κατασκευάσαμε, δημιουργεί το σύστημα μας ένα εκπαιδευμένο Μπαεσιανό δίκτυο, μέσω των κανόνων που εξήχθησαν και το σύνολο των αποδεικτικών στοιχείων (evidence set). Το εκπαιδευμένο μοντέλο μπορεί να πάρει ως είσοδο νέα τουιτς ώστε να πραγματοποιήσει εξόρυξη γνώμης. Επίσης, το σύστημα μπορεί να εκπαιδευτεί με την μέθοδο αυξητικής μάθησης το οποίο το κάνει πιο εύρωστο. Ως πεδίο εφαρμογής επικεντρωθήκαμε στον τουρισμό, διότι είναι ένα από τα πιο δημοφιλής θέματα στα μέσα κοινωνικής δικτύωσης. Το σύστημα μας, μπορεί να προβλέψει την πρόθεση του χρήστη (με βάση το τουιτ που ανέρτησε) να επισκεφθεί την Κρήτη με κάποια πιθανότητα. Με τους αλγόριθμους που κατασκευάσαμε, το σύστημα μας δημιουργεί αυτόματα κανόνες και τυχαίες μεταβλητές με βάση τα δεδομένα που έχει επεξεργαστεί από το Τουίτερ. Για την εκπαίδευση του μοντέλου το σύστημα μας χρησιμοποιεί πιθανοτική λογική συλλογιστική μέσω της ProbLog. Τέλος τα πλεονεκτήματα του συστήματος μας είναι ότι μπορεί εύκολα να προσαρμοστεί σε άλλα θέματα του τουίτερ όπως οικονομία, πολιτική, επίσης η εκπαίδευση του μοντέλου γίνεται γρήγορα και αποτελεσματικά.
Collections
The following license files are associated with this item:
This website uses cookies to ensure you get the best browsing experience.
Continue
More info