01.08.2013 Views

Ψηφιακό Τεκμήριο - E-Thesis

Ψηφιακό Τεκμήριο - E-Thesis

Ψηφιακό Τεκμήριο - E-Thesis

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ΣΥΣΤΗΜΑ ΑΥΤΟΜΑΤΗΣ ΑΝΑΓΝΩΡΙΣΗΣ ΜΟΥΣΙΚΩΝ ΟΡΓΑΝΩΝ 44<br />

χαρακτηριστικά θα είναι διαθέσιμα και χρήσιμα για την διαδικασία της αναγνώρισης.<br />

Η στρατηγική που θα χρησιμοποιήσει ο ακροατής για την αναγνώριση πρέπει να είναι<br />

ευέλικτη.<br />

Ο Mc Adams προτείνει ότι η διαδικασία της αναγνώρισης με αφαιρετικό τρόπο,<br />

σε ένα μεγάλο μέρος είναι διαδοχική, δηλαδή τα ηχητικά κύματα μετατρέπονται,<br />

κατά την αισθητήρια μεταγωγή τους (κατά την διάδοση τους από ‘αισθητήρες’), σε<br />

μια αναπαράσταση όπου μια ακουστική ομαδοποίηση(auditory grouping) μπορεί να<br />

πραγματοποιηθεί.<br />

Τα στοιχεία της ομαδοποίησης αναλύονται σε ένα σύνολο χαρακτηριστικών, τα<br />

οποία χρησιμοποιούνται ως η βάση της διαδικασίας της αναγνώρισης. Ο Mc Adams<br />

πιστεύει ότι η αναγνώριση λαμβάνει χώρα μετά την διαδικασία ομαδοποίησης της<br />

ανάλυσης της ακουστικής σκηνής. Παρ’ όλα αυτά αφήνει την πιθανότητα της<br />

ανατροφοδότησης από διαδικασίες μετά- αναγνώρισης, υψηλότερου επιπέδου. Αυτή<br />

η κυκλική επανάληψη της ανατροφοδότησης είναι απαραίτητη και πρέπει να ληφθεί<br />

υπόψη σε φαινόμενα, όπως η αποκατάσταση των φωνημάτων.<br />

Εικόνα 1.4.5. Στάδια ακουστικής επεξεργασίας για αναγνώριση ηχητικής πηγής σύμφωνα με τον<br />

Mc Adams.<br />

Στην παραπάνω εικόνα φαίνονται τα στάδια της επεξεργασίας για την αναγνώριση<br />

ηχητικής πηγής από τον άνθρωπο, όπου σύμφωνα με τον Mc Adams είναι διαδοχική.<br />

Γενικά, χρησιμοποιούμε ό,τι γνωρίζουμε για μια συγκεκριμένη ηχητική πηγή για να<br />

καλύψουμε τα κενά στα διαθέσιμα αισθητήρια στοιχεία της ακοής, δηλαδή, τα<br />

στοιχεία που δεν ακούσαμε. Σύμφωνα με τα φαινόμενα ακουστικής αποκατάστασης<br />

(Warren), συμπληρώνουμε λεπτομερώς τα κενά ,με την προϋπάρχουσα γνώση, βάσει<br />

των προσδοκιών μας και των αισθήσεων μας. Η συγκεκριμένη διαδικασία είναι<br />

εξολοκλήρου απρόσιτη στη συνείδηση μας. Δεν γνωρίζουμε ότι το κάνουμε και<br />

πιστεύουμε ότι ακούμε περισσότερα και με περισσότερη λεπτομέρεια από ότι στην<br />

πραγματικότητα ακούμε.Πράγματι, η κυκλική επανάληψη της ανατροφοδότησης<br />

στην αρχιτεκτονική του Mc Adams(τα στάδια ακουστικής επεξεργασίας) είναι<br />

ουσιαστική. Ως άνθρωποι είμαστε ικανοί να αναγνωρίσουμε περιπτώσεις από ένα<br />

μεγάλο πλήθος γενικών κατηγοριών, σε πραγματικές ακουστικές συνθήκες και κάτω<br />

από ένα ευρύ φάσμα πολυπλοκότητας που προκύπτει από μια μίξη σχεδόνταυτόχρονων<br />

ήχων. Η ανθρώπινη αναγνώριση μειώνεται, όταν οι συνθήκες που<br />

λαμβάνει χώρα η αναγνώριση χειροτερεύουν. Η εκμάθηση μας είναι εξαιρετικά<br />

ευέλικτη. Μπορούμε να αναγνωρίσουμε την δομή ενός χώρου χωρίς να έχει δοθεί<br />

‘ετικέτα’(label) σε κάθε αντικείμενο και μαθαίνουμε συνεχώς, προσθέτοντας<br />

καινούριες κατηγορίες αντικειμένων καθόλη την διάρκεια της ζωής μας. Εκτός από<br />

μια τέτοια μη-επιβλέπουσα μάθηση(unsupervised learning), μπορούμε να μάθουμε<br />

καινούριες κατηγορίες από κάποια διδασκαλία. Σε πολλές περιπτώσεις χρειαζόμαστε<br />

μόνο μερικά παραδείγματα, μερικές φορές ακόμα και ένα, για να μάθουμε μια<br />

καινούργια κατηγορία(Sayre, 1965). Συμπληρώνοντας τα παραπάνω, ο εγκέφαλός<br />

μας λειτουργεί σε πραγματικό χρόνο και όχι μόνο σε γενικές γραμμές. Οι ανθρώπινοι

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!