Επιτομή:
Η μεγαλύτερη πρόκληση της επιστήμης των Δεδομένων αποτελεί η διαχείριση των δεδομένων,
καθώς υπάρχει εκθετική αύξηση του όγκου τους εξαιτίας της αλματώδους τεχνολογικής
προόδου. Η επιστήμη των υπολογιστών έχει αναπτύξει συστήματα τα οποία μπορούν να
ανταποκριθούν στις απαιτήσεις της ταχείας παραγωγής, αποθήκευσης, εξόρυξης και ανάλυσης δεδομένων. Η έλλειψη αυτών των συστημάτων/εργαλείων θα δυσχέραινε την αξιοποίηση των Big Data για εξόρυξη νέων σημαντικών πληροφοριών. Η παρούσα πτυχιακή εργασία έχει στόχο την διερεύνηση των δυνατοτήτων και των χαρακτηριστικών της NoSQL, Apache Cassandra και του Spark για τα Big Data.