Σκοπός της παρούσας εργασίας είναι να διερευνηθεί κατά πόσο

ΠΡΟΜΕΣΙΠ 2011 ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ
Επεξεργασία
Εγκεφαλογραφήματος
για τη μελέτη της
μουσικής προτίμησης
Θεματική Υποενότητα 1.2 – Α priori γνώση
μουσικού κομματιού
Γκόντρα Πολυξένη
Τσιλιγκύρη Αλεξάνδρα
Χειμαριώτης Γρηγόρης-Άρης
14/12/2011
Περιεχόμενα
Εισαγωγή ................................................................................................................................... 3
Κεφάλαιο 1: Προεπεξεργασία ................................................................................................... 5
1.1 Φιλτράρισμα ................................................................................................................... 5
1.2 Απόρριψη σημάτων- Artifacts ......................................................................................... 6
Κεφάλαιο 2: Επεξεργασία – Μεθοδολογία ............................................................................... 8
2.1 Εξαγωγή χαρακτηριστικών .............................................................................................. 8
2.2 Στατιστική ανάλυση....................................................................................................... 11
2.2.1 Ανάλυση με Wilcoxon test ..................................................................................... 12
2.2.2 Ανάλυση με Spearman test .................................................................................... 16
2.3 Ταξινόμηση .................................................................................................................... 20
2.3.1 Naive Bayesian Ταξινόμηση ................................................................................... 20
2.3.2 Ταξινόμηση k-Κοντινότερων Γειτόνων ................................................................... 22
2.3.3 Ταξινόμηση με Support Vector Machine (SVM) .................................................... 23
Επίλογος .................................................................................................................................. 25
Εισαγωγή
Σκοπός της παρούσας εργασίας είναι να διερευνηθεί κατά πόσο μπορεί να εξαχθεί συμπέρασμα για την μουσική
προτίμηση του ανθρώπου με βάση το εγκεφαλογράφημά του.
Τα δεδομένα για ανάλυση ελήφθησαν από ένα πείραμα του οποίου το πρωτόκολλο περιγράφεται παρακάτω.
Να σημειωθεί ότι το πείραμα δεν πραγματοποιήθηκε από τους συγγραφείς του παρόντος κειμένου.
Για την επεξεργασία των σημάτων, την στατιστική ανάλυση και την ταξινόμησή τους χρησιμοποιήθηκε το
Matlab.
Πειραματικό πρωτόκολλο:
Η κάθε επανάληψη του πειράματος διαρκεί 25,5 sec και συνίσταται από:
0 – 3 sec: χαλάρωση
3 sec: εμφανίζεται ένας σταυρός στο κέντρο της οθόνης και παραμένει εκεί μέχρι το 19,5 sec.
3,5 – 4 sec: τόνος που δηλώνει την έναρξη του μουσικού κομματιού
4 – 19 sec: ηχητικό απόσπασμα
19 – 19,5 sec: τόνος που δηλώνει το τέλος του ηχητικού αποσπάσματος
19,5 – 25,5 sec : ερωτηματολόγιο
Συνολικά, το πείραμα περιελάμβανε 75 επαναλήψεις που αντιστοιχούν σε 75 ηχητικά αποσπάσματα. Από τα 75
ηχητικά αποσπάσματα, τα 60 αντιστοιχούν σε μουσικά κομμάτια από τέσσερα διαφορετικά είδη μουσικής (Rock,
Jazz, Electronic, Κλασσική – 15 αποσπάσματα για κάθε είδος) και τα 15 σε λευκό θόρυβο. Μετά την ακρόαση του
κάθε ηχητικού αποσπάσματος οι συμμετέχοντες καλούνταν να αξιολογήσουν το πόσο τους άρεσε κάθε
απόσπασμα [(5) Πολύ, (4) Αρκετά, (3) Μέτρια, (2) Λίγο, (1) Καθόλου] και το πόσο εξοικειωμένοι ήταν με το κάθε
απόσπασμα [(5) Πολύ, (4) Αρκετά, (3) Μέτρια, (2) Λίγο, (1) Καθόλου]. Τα σήματα λήφθηκαν μέσω 14
μονοπολικών καναλιών τα οποία τοποθετήθηκαν συμμετρικά στο αριστερό και δεξί ημισφαίριο του εγκεφάλου.
Μετά την ακρόαση των μουσικών κομματιών και την αξιολόγησή τους από τους εθελοντές τα
εγκεφαλογραφήματα κατηγοριοποιήθηκαν στις εξής κατηγορίες:




dLF (106):Οι συμμετέχοντες απάντησαν ότι τους άρεσαν [(5) Πολύ, (4) Αρκετά] και τα γνώριζαν [(5)
Πολύ, (4) Αρκετά].
dLUF (37): Oι συμμετέχοντες απάντησαν ότι τους άρεσαν [(5) Πολύ, (4) Αρκετά] και δεν τα
γνώριζαν [(3) Μέτρια, (2) Λίγο, (1) Καθόλου].
dDF (160): Oι συμμετέχοντες απάντησαν ότι δεν τους άρεσαν [(3) Μέτρια, (2) Λίγο, (1) Καθόλου]
και τα γνώριζαν [(5) Πολύ, (4) Αρκετά].
dDUF (237): Oι συμμετέχοντες απάντησαν ότι δεν τους άρεσαν [(3) Μέτρια, (2) Λίγο, (1) Καθόλου]
και δεν τα γνώριζαν [(3) Μέτρια, (2) Λίγο, (1) Καθόλου].

dN (135): Περιλαμβάνει την ακρόαση των αποσπασμάτων λευκού θορύβου.
Συνεπώς, το σύνολο των διαθέσιμων σημάτων για μελέτη είναι 675 HEΓ.
Τα σήματα που διατίθενται για την μελέτη που περιγράφεται παρακάτω προέρχονται από τέσσερα (4) από τα 14
αρχικά κανάλια καταγραφής. Τα τέσσερα (4) αυτά κανάλια είναι τα εξής: 1 – AF3, 2 – F3 (αριστερό εγκεφαλικό
ημισφαίριο) και 3 – F4, 4 – AF4 (δεξί εγκεφαλικό ημισφαίριο). Επίσης, για τη μελέτη χρησιμοποιήθηκαν μόνο τα
15 sec που αντιστοιχούν στην ακρόαση του ηχητικού κομματιού.
Κεφάλαιο 1: Προεπεξεργασία
1.1 Φιλτράρισμα
Στην πρώτη φάση της επεξεργασίας των σημάτων, τα ηλεκτροεγκεφαλογραφήματα , στο εξής EEG, που έχουμε
στη διάθεσή μας φιλτράρονται στις παρακάτω ζώνες συχνοτήτων:
1.
Alpha (8-12.5 Hz),
2. Beta1 (13-18 Hz),
3. Beta2 (18.5-24 Hz),
4. Beta3 (24.5-31.5 Hz)
Για το φιλτράρισμα στις παραπάνω ζώνες , χρησιμοποιείται ένα ζωνοδιαβατό Butterworth φίλτρο 6ης τάξης. Ένα
παράδειγμα αυτού του φιλτραρίσματος για ένα τυχαίο EEG από τα διαθέσιμα δείγματά μας φαίνεται στην
παρακάτω εικόνα:
Εικόνα 1: Παράδειγμα Φιλτραρίσματος στις 4 ζώνες συχνοτήτων
1.2 Απόρριψη σημάτων- Artifacts
Στο σύνολο των σημάτων παρατηρήσαμε ότι υπήρχαν και κάποια που η μορφή τους δεν ήταν σαν
τυπικό EEG. Ένα παράδειγμα είναι το παρακάτω:
Εικόνα 2: Παράδειγμα μη φυσιολογικού EEG
Είναι γνωστό ότι οι τυπικές τιμές πλάτους του EEG σε έναν ενήλικο υγιή άνθρωπο είναι [10μV-100μV], όταν το
EEG λαμβάνεται από την επιφάνεια του κρανίου. Είναι προφανές λοιπόν, ότι σήματα σαν της παραπάνω εικόνας
δεν μπορούν να θεωρηθούν φυσιολογικά. Βασικότερος λόγος που μπορεί να προκύψουν τέτοια EEG είναι από
λάθος κατά τη λήψη του, για παράδειγμα αν δεν εφάπτεται καλά το ηλεκτρόδιο με το κρανίο.
Για την απόρριψη των σημάτων-artifacts θεωρήσαμε ένα κατώφλι στα -400μV για τις αρνητικές τιμές του EEG και
στα 400μV. Όποιο από τα 675 διαθέσιμα σήματα διαθέτει, έστω και για μία χρονική στιγμή και έστω σε ένα από
τα 4 κανάλια καταγραφής, πλάτος που ξεπερνά το παραπάνω κατώφλι απορρίπτεται από τη λίστα των προς
ανάλυση σημάτων και δεν λαμβάνεται καθόλου υπόψη στην μελέτη που ακολουθεί. Για την απόρριψη
χρησιμοποιήσαμε την εντολή eegthresh του πακέτου EEGLAB για matlab.
Συνολικά με την παραπάνω διαδικασία απορρίφθηκαν 3 τετράδες σημάτων:

1 τετράδα από την κατηγορία DF (μη αρεστό, γνωστό κομμάτι) λόγω artifact στο 3ο και 4ο κανάλι
καταγραφής.

1 τετράδα από την κατηγορία LF (αρεστό, γνωστό κομμάτι) λόγω artifact στο 3ο και 4ο κανάλι
καταγραφής.

1 τετράδα από την κατηγορία Ν (ακρόαση λευκού θορύβου) λόγω artifact στο 3ο και 4ο κανάλι
καταγραφής.
Κεφάλαιο 2: Επεξεργασία – Μεθοδολογία
Στις παραγράφους που ακολουθούν περιγράφονται τα βήματα για την εξαγωγή πιθανών συμπερασμάτων
μουσικής προτίμησης.
Η δομή που ακολουθείται είναι η παρακάτω:

Εξαγωγή χαρακτηριστικών (feature extraction)

Στατιστική Ανάλυση

Ταξινόμηση
2.1 Εξαγωγή χαρακτηριστικών
Στα διαθέσιμα σήματα EEG εφαρμόζουμε short-time μετασχηματισμό Fourier, στο εξής STFT, ώστε να προκύψει
το φασματογράφημα (spectrogram) του καθενός. Το φασματογράφημα περιέχει πληροφορία συγχρόνως στο
πεδίο του χρόνου και στο πεδίο της συχνότητας.
Χρησιμοποιήσαμε την εντολή spectrogram του matlab με τις προεπιλεγμένες ρυθμίσεις που είναι οι παρακάτω:

Το αρχικό σήμα διαιρείται σε 8 χρονικά τμήματα.

Για τον υπολογισμό του STFT χρησιμοποιείται παράθυρο Hamming.

H επικάλυψη μεταξύ των γειτονικών χρονικών κομματιών είναι 50%.

Το πλήθος των συχνοτήτων που προκύπτουν είναι 257.
Ένα παράδειγμα φασματογραφήματος είναι το παρακάτω:
Εικόνα 3: Παράδειγμα Φασματογραφήματος
Ο υπολογισμός του φασματογραφήματος έγινε για όλες τις κατηγορίες, όλες τις ζώνες συχνοτήτων και όλα τα
διαθέσιμα κανάλια καταγραφής. Στη συνέχεια, για κάθε μία από τις 5 κατηγορίες (DUF, DF, LUF, LF, N)
υπολογίστηκε το μέσο φασματογράφημα για δεδομένη ζώνη συχνοτήτων και κανάλι καταγραφής. Έτσι λοιπόν
προέκυψαν 5 πίνακες διάστασης 257 x 8 x 4 x 4 όπου

η πρώτη διάσταση εκφράζει τη συχνότητα ,

η δεύτερη το χρονικό τμήμα ,

η τρίτη διάσταση το κανάλι,

και η τέταρτη τη ζώνη συχνοτήτων.
Από κάθε έναν από αυτούς τους 5 πίνακες υπολογίστηκαν το μέγιστο πλάτος του φασματογραφήματος, η
αντίστοιχη συχνότητα και η αντίστοιχη φάση για κάθε κανάλι και κάθε ζώνη συχνοτήτων . Επίσης
υπολογίστηκαν οι περιοχές συχνοτήτων και τα χρονικά τμήματα στα οποία το πλάτος του φασματογραφήματος
ξεπερνά το 30% του μέγιστου πλάτους. Οι τιμές που προέκυψαν συνοψίζονται στους παρακάτω πίνακες:
1ο κανάλι
DUF
Alpha
(8-12.5 Hz)
Beta1
(13-18 Hz)
Beta2
(18.5-24 Hz)
Beta3
(24.5-31.5 Hz)
DF
Alpha
(8-12.5 Hz)
Beta1
(13-18 Hz)
Beta2
(18.5-24 Hz)
Beta3
(24.5-31.5 Hz)
2ο κανάλι
3ο κανάλι
4ο κανάλι
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
15.59
9.25
1.23
12.74
11
1.76
12.47
10.5
1.85
14.38
11.75
-0.56
14.91
13.5
2.33
10.45
16.5
0.47
16.66
15
-1.24
14.04
16.5
-1.27
26.11
22.75
2.56
19.87
23
-0.63
24.27
21.5
-2.97
22
-2.87
21.87
27.75
-2.02
14.51
27.75
3.07
21.81
29.5
3.04
28.5
-2.37
23.03
20.23
1ο κανάλι
2ο κανάλι
3ο κανάλι
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
4ο κανάλι
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
15.13
11.25
3.02
11.63
11
-0.8
18.62
11
-0.47
19.39
10.5
-0.09
18.84
15.25
3.04
17.63
15.25
3.06
21.41
14.25
-2.33
23.97
14.25
-2.26
24.8
21.25
-3
17.48
21
1.33
29.28
21
1.09
27.58
21
-1.23
23.67
27
-1.7
18.33
25.75
2.77
24.95
30.25
-0.45
24.32
27.25
1.38
LUF
Alpha
(8-12.5 Hz)
Beta1
(13-18 Hz)
Beta2
(18.5-24 Hz)
Beta3
(24.5-31.5 Hz)
1ο κανάλι
2ο κανάλι
3ο κανάλι
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
32.75
11.25
-3.07
24.75
11.25
-3.02
32.2
11.25
2.99
32.92
11.25
-3.06
50.58
15.25
-1.04
37.49
15.25
-1.02
35.33
16.25
2.64
54.1
16
0.41
52.79
20.75
-2.38
40.1
20.75
-2.46
51.03
19.75
-3.08
47.42
20
0.57
42.28
27.5
-1.94
47
27.75
0.78
54.34
27.5
-1.9
49.7
27.25
0.34
1ο κανάλι
LF
Alpha
(8-12.5 Hz)
Beta1
(13-18 Hz)
Beta2
(18.5-24 Hz)
Beta3
(24.5-31.5 Hz)
2ο κανάλι
Alpha
(8-12.5 Hz)
Beta1
(13-18 Hz)
Beta2
(18.5-24 Hz)
Beta3
(24.5-31.5 Hz)
3ο κανάλι
4ο κανάλι
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
22.92
10.75
-0.6
20.9
10.75
-0.6
27.5
10.75
-0.26
26.17
11.25
-1.34
26.9
16
-1.25
23.7
14.25
-2.03
35.01
16.75
-0.62
32.43
15.75
0.88
31.7
23.25
0.97
30.87
21.25
-0.23
41
21.25
-0.55
42.21
22
2.82
32.77
25.75
-1.42
25.24
25.75
0.13
35.04
28.25
-0.44
28.58
25.75
-1.87
1ο κανάλι
N
4ο κανάλι
2ο κανάλι
3ο κανάλι
4ο κανάλι
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
Πλάτος
Συχνότ.
(Hz)
Φάση
15.49
10.25
-2.37
11.11
9.5
-1.77
17.37
11.75
-2.58
18.45
10
-0.75
24.62
14.25
-1.27
18.52
16.5
2.77
25.71
15.5
-0.65
28.58
16.5
2.9
31.49
21.5
2.31
21.48
22.25
1.19
27.43
21.5
2.33
26.87
21.75
-0.94
31.7
29.75
2.51
29.06
28
2.34
29.85
29.5
-1.81
34.89
28
2.23
Οι παραπάνω τιμές αποτελούν τα χαρακτηριστικά (features) στα οποία βασίστηκε η στατιστική ανάλυση και η
ταξινόμηση που περιγράφονται παρακάτω .
2.2 Στατιστική ανάλυση
Με τους ελέγχους στατιστικής σημαντικότητας ελέγχεται αν μπορεί να απορριφθεί μια μηδενική υπόθεση (null
hypothesis) ή όχι. Η μηδενική υπόθεση απορρίπτεται εφόσον το παρατηρούμενο στατιστικό επίπεδο
σημαντικότητας, το οποίο υπολογίζεται με χρήση του κατάλληλου στατιστικού μοντέλου που ταιριάζει στα
δεδομένα, είναι μικρότερο/ίσο του 0.05 (p<=0.05) Σε αντίθετη περίπτωση (ρ>0.05), θεωρείται ότι τα δεδομένα
δεν επαρκούν για την εξαγωγή ενός στατιστικά σημαντικού συμπεράσματος. Σημειώνεται ότι σε καμιά
περίπτωση δεν μπορεί να αποδειχθεί ότι η μηδενική πρόταση είναι αληθής παρά μόνο είναι δυνατό να
απορριφθεί ή όχι.
Στην παρούσα εργασία, δεδομένου ότι για τα δεδομένα μας δεν μπορούμε να υποθέσουμε κανονική κατανομή
όπως απαιτείται για τη χρήση παραμετρικών μεθόδων, επιλέξαμε την χρήση μη παραμετρικών μεθόδων. Πιο
συγκεκριμένα, χρησιμοποιήσαμε:
Wilcoxon test
Το Wilcoxon test (rank sum test, signed rank) είναι μια μη παραμετρική μέθοδος για την εύρεση διαφορών που
εμφανίζονται στις διαφορετικές συνθήκες των πειραμάτων (αρεστά, μη αρεστά, θόρυβος δεδομένου του
επιπέδου της εξοικείωσης).

Μηδενική υπόθεση για Wilcoxon rank sum test: Τα δεδομένα υπό σύγκριση (Χ,Υ) είναι ανεξάρτητα
δείγματα από όμοιες συνεχείς κατανομές με ίσες διάμεσους, έναντι της εναλλακτικής ότι δεν έχουν ίσες
διάμεσους (X και Y μπορούν να έχουν διαφορετικά μεγέθη).

Μηδενική υπόθεση για Wilcoxon signed rank test: Τα δεδομένα Χ, Υ προέρχομαι από μια συνεχή,
συμμετρική κατανομή με μηδενική διάμεσο, έναντι της εναλλακτικής ότι η κατανομή δεν έχει μηδενική
διαμέσος (X και Y δεν μπορούν να έχουν διαφορετικά μήκη).
Spearman test
Ο συντελεστής συσχέτισης διατάξεων του Spearman (Spearman’s rank correlation coefficient) είναι επίσης μια
μη παραμετρική μέθοδος για την εύρεση ομοιοτήτων που εμφανίζονται στις διαφορετικές συνθήκες των
πειραμάτων (αρεστά, μη αρεστά, θόρυβος δεδομένου του επιπέδου της εξοικείωσης).

Μηδενική υπόθεση: Τα δεδομένα Χ, Υ δεν παρουσιάζουν συσχέτιση. Ο συντελεστής Spearman είναι
ευρέως γνωστός ως δείκτης συνάφειας και χρησιμοποιείται για την μελέτη του είδους και του μεγέθους
της γραμμικής σχέσης δεδομένων Χ, Υ όταν αυτά δεν ακολουθούν κανονική κατανομή αντί του Pearson
Correlation Coefficient.
2.2.1 Ανάλυση με Wilcoxon test
Τα ζεύγη διαφορετικών συνθηκών που ελέχθηκαν ως προς τις διαφορές τους με τη χρήση του Wilcoxon rank
sum test είναι τα ακόλουθα:
1. LF-LUF
2. LF-DF
3. LF-DUF
4. LF-N
5. DF-DUF
6. DF-LUF
7. DF-N
8. LUF-DUF
9. LUF-N
10.DUF-N
Για καθένα από τα παραπάνω ζεύγη έγινε έλεγχος της μηδενικής υπόθεσης του Wilcoxon Rank Sum test για τις
συχνότητες των τιμών που εμφανίστηκαν στα φασματογραφημάτα άνω του 30% της μέγιστης κορυφής καθώς
και για τα αντίστοιχα χρονικά διαστημάτα που εμφανίστηκαν οι τιμές αυτές. Σημειώνεται ότι ο έλεγχος έγινε ανά
ζώνη συχνοτήτων αλλά και ανά κανάλι. Πραγματοποιήθηκαν δηλαδή 2 (χαρακτηριστικά) x 10 (ζεύγη
συχνοτήτων) x 4 (ζώνες συχνοτήτων) x 4 (κανάλια) + 2 (κατηγορίες) x 10 (ζεύγη συγκρίσεων) x 4 (ζώνες
συχνοτήτων) = 400 συγκρίσεις.
Επίσης για τα ίδια ζεύγη, πραγματοποιήθηκε και το Signed Rank test για τη μελέτη διαφορών ως προς τις τιμές
της μέγιστης κορυφής οι οποίες παρουσιάστηκαν στα μέσα φασματογραφήματα που αντιστοιχούν στις υπό
σύγκριση συνθήκες του πειράματος, τις αντίστοιχες θέσεις τους στο επίπεδο της συχνότητας καθώς και τις
αντίστοιχες τιμές της φάσης ανά ζώνη συχνοτήτων και ανεξάρτητα αυτής. Δηλαδή, πραγματοποιήθηκαν
συνολικά: 3 (κατηγορίες χαρακτηριστικών) x 4 (ζώνες συχνοτήτων) x 10 (ζεύγη συγκρίσεων) + 3 (κατηγορίες
χαρακτηριστικών) x 10 (ζεύγη συγκρίσεων) = 150 συγκρίσεις .
Στις εικόνες που ακολουθούν φαίνονται τα αποτελέσματα του Wilcoxon sum rank test καθώς και του Wilcoxon
signed rank όπου η μηδενική υπόθεση απορρίφθηκε, δηλαδή ότι το p-value είχε τιμές p<=0.05.To γεγονός αυτό
σημαίνει, όπως αναφέρθηκε και παραπάνω, ότι δεν υπάρχουν ομοιότητες μεταξύ των συγκρινόμενων
συνθηκών για ζώνες συχνοτήτων για τις οποίες απορρίφθηκε η μηδενική υπόθεση για κάποιο από τα ζεύγη
συγκρίσεων. Αποτελέσματα από άλλες συγκρίσεις για τις οποίες για όλα τα χαρακτηριστικά και ζεύγη
συγκρίσεων προέκυψε p>0.05 παραλήφθηκαν για χάρη συντομίας. Σημειώνεται ότι με κόκκινο χρώμα
σημειώνονται τα αποτελέσματα με p<=0.05.
Wilcoxon Rank Sum Test Band Beta1(13-18 Hz) Time Windows(30% over peak)
0.8
0.7
0.6
P-value
0.5
0.4
0.3
0.2
0.1
0
DUF-DFDUF-LUFDUF-LF DUF-N LUF-LF LUF-DF LUF-N LF-DF
Comparison Pairs
LF-N
DF-N
Wilcoxon Rank Sum Test Band Beta3(24.5-31.5 Hz) Frequency (30% over peak)
0.7
0.6
P-value
0.5
0.4
0.3
0.2
0.1
0
DUF-DFDUF-LUFDUF-LF DUF-N LUF-LF LUF-DF LUF-N LF-DF
Comparison Pairs
LF-N
DF-N
Wilcoxon Rank Sum Test Band Beta2(18.5-24 Hz) Time Windows (30% over peak)
0.7
0.6
P-value
0.5
0.4
0.3
0.2
0.1
0
DUF-DFDUF-LUFDUF-LF DUF-N LUF-LF LUF-DF LUF-N LF-DF
Comparison Pairs
LF-N
DF-N
Wilcoxon Rank Sum Test Band Beta3(24.5-31.5 Hz) Time Windows(30% over peak)
1
0.9
0.8
0.7
P-value
0.6
0.5
0.4
0.3
0.2
0.1
0
DUF-DFDUF-LUFDUF-LF DUF-N LUF-LF LUF-DF LUF-N LF-DF
Comparison Pairs
LF-N
DF-N
Wilcoxon Signed Rank Test Magnitude (PEAK)
0.02
0.018
0.016
0.014
P-value
0.012
0.01
0.008
0.006
0.004
0.002
0
DUF-DFDUF-LUFDUF-LF DUF-N LUF-LF LUF-DF LUF-N LF-DF
Comparison Pairs
LF-N
DF-N
Όπως αναφέρθηκε και προηγουμένως, πραγματοποιήθηκαν έλεγχοι για όλα τα πιθανά ζεύγη ανά ζώνη
συχνοτήτων, ανά κανάλι αλλά και ανεξαρτήτως αυτών και παρόλα αυτά η μηδενική υπόθεση απορρίφθηκε
(p<=0.05) μόνο στην περίπτωση αναμενόμενων διαφορών είτε έδωσε συμπεράσματα που δεν μπορούσαν να
ερμηνευτούν. Σαν αναμενόμενη διαφορά εννοούμε τη διαφορά ανάμεσα στο άκουσμα μουσικής και στο
άκουσμα λευκού θορύβου. Συνεπώς, διαπιστώσαμε ότι με τη χρήση του Wilcoxon test δεν μπορούμε να
εξάγουμε κάποιο στατιστικώς σημαντικό συμπέρασμα σε σχέση με τις διαφορές υπό διαφορετικές συνθήκες του
πειράματος. Επομένως είτε τα χαρακτηριστικά που επιλέχθηκαν να μελετηθούν δεν ήταν κατάλληλα για τα
δεδομένα μας είτε το Wilcoxon test δεν είναι η κατάλληλη στατιστική μέθοδος για το πρόβλημα μας.
Αξίζει ωστόσο να σημειωθεί ότι αν και δεν μπορούμε να εξάγουμε κάποιο γενικό συμπέρασμα ως προς τη
διαφορετικότητα στην απόκριση των υποκειμένων υπό διαφορετικές συνθήκες, υπήρχαν περιπτώσεις που η
μηδενική υπόθεση απορρίφθηκε. Οι περιπτώσεις αυτές παρουσιάστηκαν στα παραπάνω διαγράμματα και
αναλύονται ακολούθως:
Α. Κατά τη σύγκριση των χαρακτηριστικών που αντιστοιχούν σε τιμές πάνω από το 30% της μέγιστης κορυφής
που εμφανίστηκε στα μέσα φασματογραφήματα. Συγκεκριμένα, απορρίφθηκε η υπόθεση των μηδενικών
διαμέσων για:

Τις συχνότητες στη ζώνη Beta3 (24.5-31.5 Hz) από δεδομένα των κατηγοριών μη αρεστά(DF) –
θορύβου(N), αρεστά(LF) – θορύβου(N), μη αρεστά και άγνωστα(DUF) – θορύβου(N).

Τα χρονικά παράθυρα στη ζώνη Beta1(13-18 Hz) δεδομένων των κατηγοριών μη αρεστά και
άγνωστα(DUF) – αρεστά(LF), μη αρεστά και άγνωστα(DUF) - μη αρεστά(DF), μη αρεστά και
άγνωστα(DUF) - αρεστά και άγνωστα(LUF), μη αρεστά(DF) – θορύβου(N).

Tα χρονικά παράθυρα στη ζώνη Βeta2: μη αρεστά και άγνωστα(DUF) – αρεστά(LF), μη αρεστά και
άγνωστα(DUF) - μη αρεστά(DF).
Β. Κατά τη σύγκριση των μέγιστων τιμών των κορυφών στα φασματογραφήματα όταν η σύγκριση έγινε
ανεξάρτητα από τη ζώνη συχνοτήτων με χρήση του Wilcoxon signed rank test.
2.2.2 Ανάλυση με Spearman test
Ο συντελεστής συσχέτισης διατάξεων του Spearman χρησιμοποιήθηκε για τη μελέτη των 10 ζευγών που
προαναναφέρθηκαν (LF-LUF, LF-DF, LF-DUF, LF-N, DF-DUF, DF-LUF, DF-N, LUF-DUF, LUF-N, DUF-N). Ο
συντελεστής Spearman καθώς και το αντίστοιχο επίπεδο σημαντικότητας υπολογίστηκε για τις τιμές της
μέγιστης κορυφής στα μέσα φασματογραφήματα, τις αντίστοιχες συχνότητες και φάσεις ανά ζώνη συχνοτήτων.
Δηλαδή υπολογίστηκαν για 10 (ζεύγη συγκρίσεων) x 3 (χαρακτηριστικά) x 4 (ζώνες) = 120 περιπτώσεις.
Τα αποτελέσματα παρουσιάζονται συνοπτικά στα ακόλουθα διαγράμματα. Με συνεχή γραμμή εμφανίζονται οι
τιμές που έλαβε ο συντελεστής συσχέτισης και με κουκκίδες οι τιμές του επιπέδου σημαντικότητας, το p-value.
Το μπλε χρώμα συμβολίζει τιμές p>0.05.
Magnitude (PEAK)
1
0.5
0
Correlation Coefficients, P-values
-0.5
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-LF
LUF-DF
Comparison Pairs
LUF-N
LF-DF
LF-N
DF-N
Frequency
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
Phase
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
Εικόνα 4: Spearman Correlation Coefficients Ζώνη Alpha (8-12.5 Hz)
Magnitude (PEAK)
1
0.5
0
Correlation Coefficients, P-values
-0.5
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-LF
LUF-DF
Comparison Pairs
LUF-N
LF-DF
LF-N
DF-N
Frequency
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
Phase
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
Εικόνα 5: Spearman Correlation Coefficients Ζώνη Beta1 (13-18 Hz)
Magnitude (PEAK)
1
0.8
0.6
0.4
0.2
Correlation Coefficients, P-values
0
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-LF
LUF-DF
Comparison Pairs
LUF-N
LF-DF
LF-N
DF-N
Frequency
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
Phase
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
Εικόνα 6: Spearman Correlation Coefficients Ζώνη Beta2 (18.5-24 Hz)
Magnitude (PEAK)
1
0.5
0
Correlation Coefficients, P-values
-0.5
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-DF
LUF-N
LF-DF
LF-N
DF-N
LUF-LF
LUF-DF
Comparison Pairs
LUF-N
LF-DF
LF-N
DF-N
Frequency
1
0.5
0
-0.5
-1
DUF-DF
DUF-LUF
DUF-LF
DUF-N
LUF-LF
Phase
1
0.5
0
-0.5
DUF-DF
DUF-LUF
DUF-LF
DUF-N
Εικόνα 7: Spearman Correlation Coefficients Beta3 (24.5 – 31.5 Hz)
Γνωρίζουμε ότι ο συντελεστής λαμβάνει τιμές από -1 έως +1. Οι τιμές -1 και +1 σημαίνουν ότι υπάρχει μια
τέλεια (αρνητική ή θετική, αντίστοιχα) γραμμική σχέση μεταξύ των υπό σύγκριση δεδομένων. Όταν η τιμή του
συντελεστή Spearman είναι 0 τότε δεν υπάρχει γραμμική σχέση μεταξύ των δεδομένων χωρίς ωστόσο να
αποκλείεται η ύπαρξη οποιασδήποτε άλλης σχέσης. Στην περίπτωση που ο συντελεστής λαμβάνει αρνητικές
τιμές τότε υπάρχει αρνητική συσχέτιση. Δηλαδή ενώ το μέγεθος τα δεδομένα του ενός δείγματος αυξάνονται, το
μέγεθος της άλλης τείνουν να μειώνονται. Αντίθετα, όταν αυξάνονται τα μεγέθη των δεδομένων και των δύο
δειγμάτων τότε ο συντελεστής Spearman λαμβάνει θετικές τιμές και σηματοδοτεί την ύπαρξη θετικής
συσχέτισης μεταξύ των δεδομένων. Ωστόσο η τιμή του έχει σημασία μόνο εφόσον η μηδενική υπόθεση
απορριφθεί, δηλαδή το επίπεδο σημαντικότητας είναι p<=0.05. Επομένως για καμία από τις παραπάνω
συγκρίσεις δεν μπορούμε να αποδείξουμε την ύπαρξη συσχέτισης με τη χρήση του Spearman συντελεστή. Όπως
και στην περίπτωση του Wilcoxon test, το γεγονός αυτό σημαίνει πως είτε η εν λόγω μη παραμετρική μέτρηση
δεν είναι κατάλληλη για την μελέτη συσχετίσεων στα δεδομένα μας είτε η επιλογή των χαρακτηριστικών δεν
ήταν κατάλληλη. Για το λόγο αυτό, προχωρήσαμε στη χρήση ταξινομητών (classifiers) όπως αναλύεται στην
επόμενη ενότητα.
2.3 Ταξινόμηση
Η δεύτερη προσέγγιση για να εξαχθούν συμπεράσματα μουσικής προτίμησης από τα διαθέσιμα δεδομένα, είναι
η ταξινόμηση με τη βοήθεια naive Bayesian classifiers και nearest neighbor classifiers. Μελετήθηκε η δυνατότητα
ταξινόμησης μεταξύ

των 5 γνωστών κατηγοριών (DUF, DF, LUF, LF, N) και

μεταξύ 3 κατηγοριών (Μη αρεστό, Αρεστό, Λευκός Θόρυβος). Στην κατηγορία «Μη αρεστό»
συγχωνεύτηκαν οι κατηγορίες DUF και DF ενώ στην κατηγορία «Αρεστό» συγχωνεύτηκαν οι κατηγορίες
LUF και LF.
Σ’ αυτήν την προσέγγιση δεν χρησιμοποιήθηκε το μέσο φασματογράφημα για κάθε κατηγορία ακουστικής
προτίμησης. Υπολογίστηκε το μέγιστο πλάτος και οι αντίστοιχες συχνότητα και φάση στο μέγιστο, για κάθε μία
από τις επαναλήψεις του πειράματος και για κάθε κανάλι καταγραφής.
Δημιουργήθηκαν 672 διανύσματα χαρακτηριστικών (feature vectors). Η διάσταση του κάθε διανύσματος είναι
1 x 12 και η δομή του είναι η παρακάτω:
1o
2ο
3ο
4ο
5ο
6ο
7ο
8ο
9ο
10ο
11ο
12ο
feat.
feat.
feat.
feat.
feat.
feat.
feat.
feat.
feat.
feat.
feat.
feat.
1ο ch,
1ο ch, 1ο ch, 2ο ch, 2ο ch, 2ο ch,
3ο ch, 3ο ch, 3ο ch, 4ο ch, 4ο ch, 4ο ch,
max
max
max
max
max
value
freq
angle value freq
angle
value freq
max
max
max
max
max
max
angle value freq
Max
angle
2.3.1 Naive Bayesian Ταξινόμηση
Η πρώτη μέθοδος ταξινόμησης που χρησιμοποιήθηκε είναι το naive Bayes μοντέλο πιθανότητας. Στο μοντέλο
αυτό, το κάθε χαρακτηριστικό που απαρτίζει το διάνυσμα χαρακτηριστικών (feature vector) λαμβάνεται ως
ανεξάρτητη, των υπολοίπων χαρακτηριστικών, μεταβλητή. Γι’ αυτό και αυτή η μέθοδος ταξινόμησης ανήκει στην
κατηγορία της διακρίνουσας ανάλυσης (discriminant analysis) . Χρησιμοποιήθηκε η εντολή classify του matlab. Ο
τύπος της διακρίνουσας συνάρτησης που χρησιμοποιήθηκε ήταν ο ‘diagquadratic’. Η συγκεκριμένη διακρίνουσα
συνάρτηση προσαρμόζει τις πολυμεταβλητές κανονικές πυκνότητες με εκτίμηση διαγώνιου πίνακα
συμμεταβλητότητας.
Για να εκτιμηθεί πλήρως η αποδοτικότητα του ταξινομητή, χρησιμοποιήθηκε η τεχνική cross validation. Σύμφωνα
με αυτή , το σύνολο των 672 διανυσμάτων χαρακτηριστικών χωρίζονται σε 10 κατηγορίες. Οι 9 κατηγορίες
χρησιμοποιούνται για την εκπαίδευση του ταξινομητή και η 10η κατηγορία για τη δοκιμή του. Η παραπάνω
διαδικασία (εκπαίδευση και δοκιμή) επαναλαμβάνεται 10 φορές ώστε κάθε κατηγορία να έχει χρησιμοποιηθεί
σίγουρα και για εκπαίδευση και για δοκιμή. Στο τέλος της παραπάνω διαδικασίας, είμαστε σε θέση να
εκτιμήσουμε τον ταξινομητή με βάση τους συντελεστές σωστής και λάθος ταξινόμησης (correct Rate και error
Rate αντίστοιχα).
Επιπλέον, για περισσότερη ασφάλεια ότι τα διανύσματα χαρακτηριστικών έχουν χωριστεί με πολλούς δυνατούς
τρόπους σε ομάδες εκπαίδευσης και δοκιμής του ταξινομητή, η τεχνική cross validation επαναλήφθηκε 10
φορές.
Τα αποτελέσματα της ταξινόμησης με naive Baysian model φαίνονται παρακάτω:
2.3.1.1 Ταξινόμηση – 5 ομάδες
Η ταξινόμηση των διανυσμάτων χαρακτηριστικών ανάμεσα σε 5 ομάδες (DUF, DF, LUF, LF, N) έφερε τα
παρακάτω αποτελέσματα:
Alpha
(8-12.5 Ηz)
Μέσος
συντελεστής λάθους
0.7501
Beta1
(13-18 Hz)
0.754
Beta2
Beta3
(18.5-24 Hz)
(24.5-31.5 Hz)
0.7862
0.8519
(mean Error Rate)
Όπως παρατηρείται, ο συντελεστής λάθους είναι μεγαλύτερος από τον συντελεστή τυχαιότητας, που είναι 50%,
για όλες τις ζώνες συχνοτήτων. Επομένως, οι 5 κατηγορίες δεν μπορούν να διακριθούν μεταξύ τους με τα
διαθέσιμα δεδομένα και με χρήση του naive Bayesian μοντέλου.
2.3.1.2 Ταξινόμηση – 3 ομάδες
Η ταξινόμηση των διανυσμάτων χαρακτηριστικών ανάμεσα σε τρεις κατηγορίες (Αρεστό – Μη Αρεστό – Λευκός
Θόρυβος) έφερε τα παρακάτω αποτελέσματα:
Alpha
(8-12.5 Ηz)
Μέσος
συντελεστής λάθους
0.6116
Beta1
(13-18 Hz)
0.5549
Beta2
Beta3
(18.5-24 Hz)
(24.5-31.5 Hz)
0.6003
0.6345
(mean Error Rate)
Τα αποτελέσματα είναι καλύτερα από την προηγούμενη περίπτωση αλλά ο ταξινομητής και αυτή τη φορά δεν
είναι αποτελεσματικός αφού η τιμή του σε όλες τις ζώνες συχνοτήτων ξεπερνά το 50%.
2.3.2 Ταξινόμηση k-Κοντινότερων Γειτόνων
Η δεύτερη μέθοδος ταξινόμησης που χρησιμοποιήθηκε ήταν αυτή των k-κοντινότερων γειτόνων. Αυτή η μέθοδος
είναι η απλούστερη μεταξύ των υπολοίπων του κλάδου της αναγνώρισης προτύπων. Σύμφωνα με αυτή, ένα
αντικείμενο ταξινομείται σε μία από τις υποψήφιες κλάσεις με βάση την πλειοψηφία των γνωστών αντικειμένων
που βρίσκονται στην k- γειτονία του.
Στην παρούσα εργασία, επιλέχθηκε k=300 μετά από δοκιμές test and error. Η τιμή αυτή για την παράμετρο,
έδωσε καλύτερα αποτελέσματα σε δοκιμαστικές ταξινομήσεις. Γενικώς, είναι γνωστό ότι όσο μεγαλύτερο το k,
αναλογικά και με το πλήθος των διαθέσιμων δεδομένων, τόσο περισσότερο εξαλείφεται ο θόρυβος που υπάρχει
στα διανύσματα χαρακτηριστικών, οπότε δίνονται και καλύτερα αποτελέσματα ταξινόμησης.
Τέλος, να σημειωθεί ότι και με αυτή την μέθοδο ταξινόμησης χρησιμοποιήθηκε η τεχνική 10-fold cross validation
με τον τρόπο που περιγράφηκε στην παράγραφο 2.2.1.
2.3.2.1 Ταξινόμηση – 5 ομάδες
Η ταξινόμηση των διανυσμάτων χαρακτηριστικών ανάμεσα σε 5 ομάδες (DUF, DF, LUF, LF, N) με τον αλγόριθμο
του k-κοντινότερου γείτονα έφερε τα παρακάτω αποτελέσματα:
Alpha
(8-12.5 Ηz)
Μέσος
συντελεστής λάθους
0.6473
Beta1
(13-18 Hz)
0.6473
Beta2
Beta3
(18.5-24 Hz)
(24.5-31.5 Hz)
0.6473
0.6473
(mean Error Rate)
Παρατηρούμε ότι σε όλες τις συχνοτικές ζώνες ο συντελεστής λάθους του ταξινομητή έχει την ίδια, υψηλή τιμή.
Και σε αυτή την περίπτωση, δεν μπορεί να γίνει αξιόπιστη ταξινόμηση μεταξύ των 5 κατηγοριών μουσικής
προτίμησης.
2.3.2.1 Ταξινόμηση – 3 ομάδες
Η ταξινόμηση των διανυσμάτων χαρακτηριστικών ανάμεσα σε τρεις ομάδες (Αρεστό – Μη Αρεστό – Λευκός
Θόρυβος) με τον αλγόριθμο του k-κοντινότερου γείτονα έφερε τα παρακάτω αποτελέσματα:
Alpha
(8-12.5 Ηz)
Μέσος
συντελεστής λάθους
0.4089
Beta1
(13-18 Hz)
0.3918
Beta2
Beta3
(18.5-24 Hz)
(24.5-31.5 Hz)
0.4107
0.4186
(mean Error Rate)
Σε αυτή την περίπτωση, ο συντελεστής λάθους για όλες τις ζώνες συχνοτήτων είναι μικρότερος από τον
συντελεστή τυχαιότητας, όμως παραμένει και πάλι υψηλός.
2.3.3 Ταξινόμηση με Support Vector Machine (SVM)
H τελευταία δοκιμή ταξινόμησης περιλαμβάνει τη χρήση Support Vector Machines.Προκειμένου να εξεταστεί
κατά πόσο μπορεί να διαπιστωθούν διαφορές και ομοιότητες στα εγκεφαλογραφήματα δύο ομάδων
πειραμάτων, για παράδειγμα LUF-DF, με βάση κάποια χαρακτηριστικά που υπολογίζονται από τα
φασματογραφήματα τους , γίνεται εκπαίδευση ταξινομητών SVM που σκοπεύουν να διαχωρίσουν διανύσματα
των χαρακτηριστικών με βάση την ομάδα πειραμάτων. Η εκπαίδευση γίνεται 10 φορές με την εξαίρεση κάθε
φορά του 10% των διανυσμάτων , το οποίο στην συνέχεια χρησιμοποιείται για τον έλεγχο της απόδοσης των
ταξινομητών. Από τις 10 επαναλήψεις, υπολογίζεται το μέσο σφάλμα. Αν η ταξινόμηση έχει μικρό σφάλμα,
συμπεραίνουμε ότι είναι σχετικά εύκολος ο διαχωρισμός τους άρα διαφέρουν αρκετά με βάση τα επιλεγμένα
χαρακτηριστικά. Διαφορετικά, αν υπάρχει μεγάλο σφάλμα, συμπεραίνουμε ότι τα χαρακτηριστικά τους είναι
όμοια.
Αυτή η διαδικασία πραγματοποιείται για όλους τους συνδυασμούς ζευγαριών ομάδων και για κάθε ζώνη
συχνοτήτων ξεχωριστά. Έτσι προκύπτουν 10 μέσα σφάλματα όσοι είναι οι συνδυασμοί των ομάδων σε ζεύγη για
κάθε ζώνη. Στo παρακάτω σχήμα, φαίνεται ότι το σφάλμα ταξινόμησης ανάμεσα σε όλα τα ζευγάρια ομάδων
παρουσιάζει παρόμοια συμπεριφορά στις 4 ζώνες συχνοτήτων:
Εικόνα 8: Μέσο σφάλμα ταξινόμησης SVM ανά ζεύγος, για κάθε ζώνη συχνοτήτων
Επειδή στην απόδοση των ταξινομητών παίζει ρόλο και το πλήθος διανυσμάτων που χρησιμοποιούνται από
κάθε ομάδα ,θεωρείται καταλληλότερο να εξετάζονται κάθε φορά τα σφάλματα της ταξινόμησης μιας ομάδας
με όλες τις υπόλοιπες προκειμένου να έχουμε ένα δείκτη της ομοιότητας/διαφοράς με αυτές.
Γενικά και για τις 4 ζώνες παρατηρούμε τα εξής για τις 5 ομάδες :

Αρεστό – Γνωστό (LF) :
Μέτρια ταξινόμηση (~30% μέσο σφάλμα) με τις ομάδες LUF και DUF και χειρότερη(~40% σφάλμα) με τις
ομάδες DF-N.

Αρεστό – Άγνωστο (LUF):
Kατά σειρά, γίνεται καλύτερη ταξινόμηση με τις ομάδες DUF, DF, N , LF . Άρα μεγαλύτερη διαφορά στα
χαρακτηριστικά παρατηρείται με την ομάδα DUF και μικρότερη με την ομάδα LF.

Μη αρεστό – Γνωστό (DF):
Καλύτερη ταξινόμηση με την ομάδα LUF , μέτρια με την ομάδα LF και χειρότερη με τις ομάδες DUF,N.
Άρα συμπεραίνουμε ότι έχουμε μεγαλύτερες διαφορές με τις ομάδες LUF,LF και μικρότερες με τις
DUF,N.

Μη αρεστό – Άγνωστο (DUF):
Καλύτερη ταξινόμηση με την ομάδα LUF , μέτρια με την ομάδα LF και χειρότερη με τις ομάδες DF,N. Άρα
συμπεραίνουμε ότι έχουμε μεγαλύτερες διαφορές με τις ομάδες LUF,LF και μικρότερες με τις DF,N.

Λευκός Θόρυβος (Ν):
Καλύτερη ταξινόμηση με την ομάδα LUF και πάλι ,έπειτα με την DUF και πολύ κακή(~45%) με τις LF , DF.
Παρατηρούμε ότι ανάμεσα στην LUF και στις άλλες ομάδες ,έχουμε καλύτερη ταξινόμηση από ότι έχουν οι
άλλες ομάδες μεταξύ τους, επειδή λόγω του μικρού πλήθους διανυσμάτων που ανήκουν σ’ αυτή, έχει
μεγαλύτερη ομοιογένεια. Άρα συμπεραίνουμε ότι το πλήθος διανυσμάτων που λαμβάνονται στην ταξινόμηση
εξακολουθεί να παίζει ρόλο.
Παρόλα αυτά , σε πολλές περιπτώσεις, παρατηρείται ότι το είδος των ομάδων που εξετάζονται παίζει και αυτό
ρόλο στην απόδοση της ταξινόμησης και μάλιστα ανάμεσα σε ομάδες που αναμένεται μεγαλύτερη ομοιότητα,
για παράδειγμα DF – DUF, παρατηρείται χειρότερη ταξινόμηση από ομάδες π.χ. DF-LF ή DF-LUF όπου
αναμένονται διάφορες στα χαρακτηριστικά που έχουν επιλεγεί.
Επίλογος
Σαν συμπέρασμα της μελέτης που περιγράφηκε παραπάνω, μπορεί να διατυπωθεί το εξής:
Με χρήση SVM , υπάρχει η δυνατότητα αν δοθεί ένα EEG ατόμου που ακροάστηκε ένα μουσικό κομμάτι να
διαπιστωθεί με μεγάλη αξιοπιστία:

Ότι ήταν άγνωστο το κομμάτι και είτε του άρεσε είτε δεν του άρεσε.

Ότι ήταν άγνωστο το κομμάτι και του άρεσε ή ότι ήταν γνωστό και δεν του άρεσε.

Ότι του άρεσε ένα άγνωστο μουσικό κομμάτι ή ότι άκουσε ένα απόσπασμα λευκού θορύβου.
Να σημειωθεί ότι αξιόπιστη ικανότητα διάκρισης μουσικής προτίμησης μπορεί να επιτευχθεί μόνο μεταξύ δύο
κάθε φορά περιπτώσεων, των παραπάνω. Δεν είναι δηλαδή αξιόπιστο από τα χαρακτηριστικά που
απομονώθηκαν στην παρούσα εργασία να επιλέξει κανείς μεταξύ 5 περιπτώσεων μουσικής προτίμησης.
Τα αποτελέσματα είναι μερικώς ενθαρρυντικά. Σαν μελλοντική εργασία θα μπορούσαν να απομονωθούν
διαφορετικά χαρακτηριστικά από τα EEGs, ή θα μπορούσε να γίνει χρήση στατιστικής ανώτερης τάξης, όπως
κυρτότητα ή σωρείτες του φασματογραφήματος.