Επιτομή:
Η ταχεία εξάπλωση των Μέσων Κοινωνικής Δικτύωσης τα τελευταία χρόνια, ως μέσο επικοινωνίας και ανταλλαγής πληροφοριών είχε σαν αποτέλεσμα τη δημιουργία συνόλου δεδομένων μεγάλου μεγέθους, τα οποία μπορούν να χρησιμοποιηθούν προκειμένου να αξιοποιηθούν πληροφορίες που σχετίζονται με το περιβάλλον του χρήστη. Ωστόσο, η ευκολία με την οποία τα δεδομένα μπορούν να συλλεχθούν και να αποθηκευτούν έχει δημιουργήσει μια νέα στάση σχετικά με την ανάλυση τους που οφείλεται στους περιορισμούς των υπαρχόντων μεθόδων ανάλυσης δεδομένων στην προσπάθεια αντιμετώπισης των προκλήσεων που έθεσαν οι νέοι τύποι δεδομένων. Κρίνοντας λοιπόν επιτακτική την ανάγκη για αξιοποίηση αυτής της κρυμμένης γνώσης σε αυτό το τεράστιο όγκο δεδομένων κυρίως υπό τη μορφή μη δομημένου κειμένου οδήγησε τους ερευνητές στη δημιουργία ενός νέου πεδίου ανάλυσης δεδομένων , το οποίο ονομάζεται Εξόρυξη Γνώσης από Κείμενο (Text Mining). Στόχος της παρούσα πτυχιακής εργασίας είναι να παρουσιάσει τα Μέσα Κοινωνικής Δικτύωσης και τις μεθόδους εξόρυξης δεδομένων καθώς και να παρουσιάσει βασικές τεχνικές που υπάρχουν για την εξόρυξη γνώσης από κείμενο.
ABSTRACT
The rapid deployment of Social Media Networks in recent years as a mean of communication and information exchange has as a result the creation of a large set of data that can be used in order to exploit information related to the user's environment. However, the ease with which data can be collected and stored has created a new attitude to their analysis due to the limitations of existing data analysis methods in addressing the challenges posed by new types of data. Therefore, judging the need to exploit this hidden knowledge in this vast amount of data that is mostly under the form of unstructured text, led researchers to create a new data analysis field, called Text Mining. The aim of this dissertation is to introduce the reader to the concept of Social Media Networking but also to this new method of data mining as well as to present all the available techniques available for extracting knowledge from text.