Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
ΣΥΣΤΗΜΑ ΑΥΤΟΜΑΤΗΣ ΑΝΑΓΝΩΡΙΣΗΣ ΜΟΥΣΙΚΩΝ ΟΡΓΑΝΩΝ 44<br />
χαρακτηριστικά θα είναι διαθέσιμα και χρήσιμα για την διαδικασία της αναγνώρισης.<br />
Η στρατηγική που θα χρησιμοποιήσει ο ακροατής για την αναγνώριση πρέπει να είναι<br />
ευέλικτη.<br />
Ο Mc Adams προτείνει ότι η διαδικασία της αναγνώρισης με αφαιρετικό τρόπο,<br />
σε ένα μεγάλο μέρος είναι διαδοχική, δηλαδή τα ηχητικά κύματα μετατρέπονται,<br />
κατά την αισθητήρια μεταγωγή τους (κατά την διάδοση τους από ‘αισθητήρες’), σε<br />
μια αναπαράσταση όπου μια ακουστική ομαδοποίηση(auditory grouping) μπορεί να<br />
πραγματοποιηθεί.<br />
Τα στοιχεία της ομαδοποίησης αναλύονται σε ένα σύνολο χαρακτηριστικών, τα<br />
οποία χρησιμοποιούνται ως η βάση της διαδικασίας της αναγνώρισης. Ο Mc Adams<br />
πιστεύει ότι η αναγνώριση λαμβάνει χώρα μετά την διαδικασία ομαδοποίησης της<br />
ανάλυσης της ακουστικής σκηνής. Παρ’ όλα αυτά αφήνει την πιθανότητα της<br />
ανατροφοδότησης από διαδικασίες μετά- αναγνώρισης, υψηλότερου επιπέδου. Αυτή<br />
η κυκλική επανάληψη της ανατροφοδότησης είναι απαραίτητη και πρέπει να ληφθεί<br />
υπόψη σε φαινόμενα, όπως η αποκατάσταση των φωνημάτων.<br />
Εικόνα 1.4.5. Στάδια ακουστικής επεξεργασίας για αναγνώριση ηχητικής πηγής σύμφωνα με τον<br />
Mc Adams.<br />
Στην παραπάνω εικόνα φαίνονται τα στάδια της επεξεργασίας για την αναγνώριση<br />
ηχητικής πηγής από τον άνθρωπο, όπου σύμφωνα με τον Mc Adams είναι διαδοχική.<br />
Γενικά, χρησιμοποιούμε ό,τι γνωρίζουμε για μια συγκεκριμένη ηχητική πηγή για να<br />
καλύψουμε τα κενά στα διαθέσιμα αισθητήρια στοιχεία της ακοής, δηλαδή, τα<br />
στοιχεία που δεν ακούσαμε. Σύμφωνα με τα φαινόμενα ακουστικής αποκατάστασης<br />
(Warren), συμπληρώνουμε λεπτομερώς τα κενά ,με την προϋπάρχουσα γνώση, βάσει<br />
των προσδοκιών μας και των αισθήσεων μας. Η συγκεκριμένη διαδικασία είναι<br />
εξολοκλήρου απρόσιτη στη συνείδηση μας. Δεν γνωρίζουμε ότι το κάνουμε και<br />
πιστεύουμε ότι ακούμε περισσότερα και με περισσότερη λεπτομέρεια από ότι στην<br />
πραγματικότητα ακούμε.Πράγματι, η κυκλική επανάληψη της ανατροφοδότησης<br />
στην αρχιτεκτονική του Mc Adams(τα στάδια ακουστικής επεξεργασίας) είναι<br />
ουσιαστική. Ως άνθρωποι είμαστε ικανοί να αναγνωρίσουμε περιπτώσεις από ένα<br />
μεγάλο πλήθος γενικών κατηγοριών, σε πραγματικές ακουστικές συνθήκες και κάτω<br />
από ένα ευρύ φάσμα πολυπλοκότητας που προκύπτει από μια μίξη σχεδόνταυτόχρονων<br />
ήχων. Η ανθρώπινη αναγνώριση μειώνεται, όταν οι συνθήκες που<br />
λαμβάνει χώρα η αναγνώριση χειροτερεύουν. Η εκμάθηση μας είναι εξαιρετικά<br />
ευέλικτη. Μπορούμε να αναγνωρίσουμε την δομή ενός χώρου χωρίς να έχει δοθεί<br />
‘ετικέτα’(label) σε κάθε αντικείμενο και μαθαίνουμε συνεχώς, προσθέτοντας<br />
καινούριες κατηγορίες αντικειμένων καθόλη την διάρκεια της ζωής μας. Εκτός από<br />
μια τέτοια μη-επιβλέπουσα μάθηση(unsupervised learning), μπορούμε να μάθουμε<br />
καινούριες κατηγορίες από κάποια διδασκαλία. Σε πολλές περιπτώσεις χρειαζόμαστε<br />
μόνο μερικά παραδείγματα, μερικές φορές ακόμα και ένα, για να μάθουμε μια<br />
καινούργια κατηγορία(Sayre, 1965). Συμπληρώνοντας τα παραπάνω, ο εγκέφαλός<br />
μας λειτουργεί σε πραγματικό χρόνο και όχι μόνο σε γενικές γραμμές. Οι ανθρώπινοι