Επιτομή:
Στην παρούσα εργασία γίνεται εκτενής αναφορά στο επιστημονικό αντικείμενο της μηχανικής όρασης. Με τον όρο μηχανική όραση εννοούμε την προσπάθεια εξομοίωσης της ανθρώπινης όρασης από κάποια συσκευή, όπως ένα ρομπότ ή άλλο ηλεκτρονικό σύστημα. Η μηχανική όραση βασίστηκε πάνω σε ήδη υπάρχοντα επιστημονική αντικείμενα, όπως η επεξεργασία εικόνας, η αναγνώριση προτύπων και η μηχανική μάθηση. Για να καταλήξουμε στην ψηφιακή αναγνώριση προσώπων πρέπει πρώτα να έχουμε την δυνατότητα αποθήκευσης των δεδομένων της εικόνας με τέτοιο τρόπο ώστε στην συνέχεια να μπορούμε να την αναλύσουμε και να την επεξεργαστούμε σε σχετικά σύντομο χρόνο. Για τον λόγο αυτό οι ψηφιακές εικόνες αποθηκεύονται ως δισδιάστατοι πίνακες, όπου κάθε στοιχείο του πίνακα είναι ένα διάνυσμα ακέραιων αριθμών, οι οποίο περιγράφουν κάποιες ιδιότητες της εικόνας στο συγκεκριμένο τμήμα το οποίο αναπαριστούν. Το τι ακριβώς σημαίνουν οι αριθμοί αυτοί το καθορίζουν τα χρωματικά μοντέλα. Με τον όρο χρωματικά μοντέλα εννοούμε έναν τρισδιάστατο συνήθως χώρο, όπου κάθε χρώμα αναπαρίσταται από ένα σημείο. Υπάρχουν διάφορα χρωματικά μοντέλα, η ανάλυση των οποίων όμως ξεφεύγει από τα όρια της παρούσας εργασίας. Στην εργασία αυτή, γίνεται εκτενής αναφορά στο χρωματικό μοντέλοRGB. Συγκεκριμένα για το πρότυπο RGB κάθε pixel χαρακτηρίζεται από τρεις τιμές φωτεινότητας μια για το κόκκινο, μια για το πράσινο και τέλος μια για το μπλε. Ουσιαστικά έχουμε τρεις διαφορετικές εικόνες, μια για κάθε χρώμα. Στην συνέχεια οι εικόνες αυτές προστίθενται και η πρόσθεση των τριών πρωτευόντων χρωμάτων δημιουργεί τα υπόλοιπα χρώματα σε ποικίλες αναλογίες. Το πρότυπο αυτό χρησιμοποιείται όταν η εικόνα προβάλλεται σε οθόνη ηλεκτρονικού υπολογιστή.
Για να μπορέσουμε να επεξεργαστούμε μια εικόνα πρέπει να εφαρμόσουμε σε αυτή κάποιο μετασχηματισμό. Στην παρούσα εργασία γίνεται λόγος για τον δισδιάστατο μετασχηματισμό Haar, ο οποίος βασίζεται στην θεώρηση των κυματιδίων. Κύριο πλεονέκτημα του μετασχηματισμού συνίσταται στο ότι δειγματοληπτεί τα δεδομένα εισόδου σε πολλαπλές αναλύσεις με χαμηλή έως υψηλή ανάλυση και υπολογίζει τις διαφορές γειτονικών ζευγών.
Τέλος γίνεται αναφορά στους ταξινομητές, οι οποίοι είναι αλγόριθμοι που χρησιμοποιούνται για να επιτύχουμε την ταξινόμηση των προτύπων σε όσο το δυνατόν ομογενείς από άποψη χαρακτηριστικών κλάσεις. Υπάρχει μια ευρεία γκάμα ταξινομητών. Η επιλογή του κατάλληλου ταξινομητή σχετίζεται άμεσα με το είδοςτων χαρακτηριστικών και το είδος της εφαρμογής όπου θα χρησιμοποιηθεί. Η επιλογή των κατάλληλων χαρακτηριστικών και του ταξινομητή πρέπει να γίνει ταυτόχρονα. Με την τεχνική της ενδυνάμωσης (boosting) μπορούμε να μετατρέψουμε έναν απλό (ή ασθενή) ταξινομητή σε ισχυρό. Ένας τέτοιος αλγόριθμος ενδυνάμωσης είναι ο Adaboost, ο οποίος μπορεί να χρησιμοποιηθεί για την ενίσχυση της απόδοσης οποιουδήποτε αλγορίθμου εκμάθησης μηχανών. Η ενδυνάμωση επιτυγχάνεται με την κατασκευή ενός μοντέλου από τα δεδομένα εκπαίδευσης, στη συνέχεια δημιουργείται ένα δεύτερο μοντέλο που επιχειρεί να διορθώσει τα σφάλματα του πρώτου μοντέλου κ.ο.κ. Τα μοντέλα προστίθενται έως ότου προβλεφθεί απόλυτα το σετ εκπαίδευσης ή προστεθεί ένας μέγιστος αριθμός μοντέλων.