∆ιάγνωση βλαβών µέσω ελέγχου δονήσεων σε βιοµηχανική γραµµή

ΕΙΣΑΓΩΓΗ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΑΡΑΓΩΓΗΣ &
∆ΙΟΙΚΗΣΗΣ
∆ιάγνωση βλαβών µέσω ελέγχου δονήσεων σε βιοµηχανική γραµµή
Παραγωγής πλυντηρίων
∆ιατριβή που υπεβλήθη για την µερική ικανοποίηση των απαιτήσεων για την
απόκτηση ∆ιδακτορικού ∆ιπλώµατος
Υπό Γεωργίου Ν. Τσελέντη
1998
I
II
III
IV
V
x
VI
ΠΕΡΙΕΧΟΜΕΝΑ
1 Εισαγωγή ______________________________________________________ - 1 1.1 ∆ιάγνωση βλαβών στη γραµµή παραγωγής_____________________________ - 1 1.2 Σύγχρονες απαιτήσεις διαγνωστικών συστηµάτων ______________________ - 2 1.3 Στόχος, βασικοί άξονες και δοµή της εργασίας__________________________ - 4 -
2 Αυτοµατοποιηµένη διάγνωση βλαβών µέσω αναγνώρισης προτύπου (pattern
recognition) __________________________________________________________ - 7 2.1 Μέθοδοι παραµετρικής και µη παραµετρικής διάγνωσης_________________ - 7 2.2 Αναγνώριση προτύπου _____________________________________________ - 9 2.3 ∆ιάγνωση βλαβών και συντήρηση βασισµένη στην ανάλυση κραδασµών
(vibration analysis) _______________________________________________________ - 10 2.4 Συνδυασµός ανάλυσης κραδασµών µε αναγνώριση προτύπου ____________ - 15 2.4.1 Στάδιο Α: Λήψη της πληροφορίας από τους αισθητήρες. ______________________ - 16 2.4.2 Στάδιο Β: Προεπεξεργασία της πληροφορίας ______________________________ - 17 2.4.3 Στάδιο Γ: Μετατροπή στο πεδίο της συχνότητας ____________________________ - 17 2.4.4 Στάδιο ∆: Επιλογή χαρακτηριστικών _____________________________________ - 18 2.4.5 Στάδιο Ε: Ταξινόµηση των σηµάτων σε κατηγορίες (αποδεκτό ή ελαττωµατικό) ___ - 19 2.4.6 Αντιστοίχηση ενός προϊόντος σε µια κατηγορία _____________________________ - 19 -
2.5 Προηγούµενες σχετικές εργασίες ____________________________________ - 20 -
3 ∆ιατύπωση του προβλήµατος και περιγραφή των απαιτήσεων της διάγνωσης 23
3.1 Εισαγωγή _________________________________________________________ 23
3.2 Έλεγχος ποιότητας της παραγωγής πλυντηρίων στην Ευρωπαϊκή Ένωση ____ 24
3.3 Κατηγορίες βλαβών που απασχολούν τους κατασκευαστές_________________ 24
3.4 Σχεδιαστικές απαιτήσεις του βιοµηχανικού κατασκευαστή ________________ 25
3.5 Περιγραφή της διαδικασίας πρόσκτησης δεδοµένων από τους κραδασµούς___ 26
3.6 ∆οµή δεδοµένων____________________________________________________ 29
4 Θεωρητικό υπόβαθρο ______________________________________________ 33
4.1 Πρόσκτηση δεδοµένων και προεπεξεργασία του σήµατος εισόδου __________ 33
4.2 Μετατροπή στο πεδίο της συχνότητας__________________________________ 34
VII
4.2.1 ∆ιακριτός µετασχηµατισµός Fourier (DFT) __________________________________ 34
4.2.2 Κυµατίδια (Wavelets) ___________________________________________________ 36
4.3 Κανονικοποίηση____________________________________________________ 37
4.4 Εκτιµήτριες πυκνότητας πυρήνα (KDE) ________________________________ 38
4.4.1 KDE για δεδοµένα σε µία διάσταση ________________________________________ 39
4.4.2 KDE για δύο και περισσότερες διαστάσεις δεδοµένων__________________________ 40
4.4.3 Απεικόνιση ισοϋψών (contouring) _________________________________________ 41
4 ____________________________________________________________________ 43
.5 Μετασχηµατισµός Karhunen-Loeve ____________________________________ 43
4.6 Ταξινόµηση µε χρήση αποστάσεων ____________________________________ 47
4.6.1 Ευκλείδεια απόσταση και απόσταση Mahalanobis _____________________________ 48
4.6.2 Απόσταση Bayes _______________________________________________________ 51
4.7 Ο αλγόριθµος FCM (Fuzzy c-means)___________________________________ 53
4.8 Ταξινόµηση µέσω του προσαρµοζόµενου δικτύου ασαφούς λογικής ANFIS___ 57
4.9 Ο αλγόριθµος ID3 __________________________________________________ 61
5 Ανάπτυξη ενός αυτοµατοποιηµένου συστήµατος ταξινόµησης _____________ 68
5.1 Εισαγωγή _________________________________________________________ 68
5.2 Προτεινόµενη µοντελοποίηση και ορισµός του προβλήµατος _______________ 69
5.3 Προεπεξεργασία του σήµατος_________________________________________ 70
5.3.1 Προσδιορισµός της στάσιµης κατάστασης του περιοδικού σήµατος _______________ 70
5.4 Επιλογή χαρακτηριστικών ___________________________________________ 73
5.4.1 Μέγιστα φάσµατος (κορυφές) _____________________________________________ 75
5.4.2 Χρήση KDE για την εξέταση των µεγίστων του φάσµατος ______________________ 76
5.4.3 Περιττές αρµονικές _____________________________________________________ 79
5.4.4 Χρήση του αλγορίθµου ID για εύρεση σηµείων µε πληροφορία στο φάσµα _________ 80
5.4.5 Έλεγχος σηµαντικών χαρακτηριστικών µε βάση την στατιστική συµπεριφορά του
φάσµατος _______________________________________________________________________ 85
5.5 Ταξινόµηση _______________________________________________________ 88
5.5.1 Χρήση του αλγορίθµου FCM για την εξέταση του διαχωρισµού των κλάσεων _______ 88
5.5.2 Εκτίµηση επίδοσης ταξινοµητή____________________________________________ 90
5.5.3 Πιθανότητες εµφάνισης κλάσεων __________________________________________ 92
VIII
5.5.4 Επιδόσεις ταξινοµητών __________________________________________________ 93
5.6 Η τελική πρόταση για το σύστηµα ταξινόµησης στην παραγωγή___________ 104
5.7 Συµπεράσµατα και µελλοντική εργασία _______________________________ 108
6 Αναφορές ____________________________________________________ - 127 7 ΠΑΡΑΡΤΗΜΑ________________________________________________ - 133 7.1 ΤΟ ΣYΣΤΗΜΑ ΤΩΝ ΙΝΤΕΡΦΕΡΟΜΕΤΡΙΚΩΝ ΑΙΣΘΗΤΗΡΩΝ_______ - 133 7.1.1 Μέτρηση κραδασµών µε οπτικούς αισθητήρες _____________________________ - 133 -
7. 1. 2 Αρχές λειτουργίας _____________________________________________ - 135 7.1.2.1 Ακρίβεια µέτρησης _________________________________________________ - 136 7.1.2.2 Η απόκλιση (δ) ___________________________________________________ - 137 7.1.2.3 Tο σφαλµα συνηµιτονου (Ecos) ______________________________________ - 138 7.1.2.4 Το σφαλµα Abbé (Ea) ______________________________________________ - 139 -
7.1.3 Το συστηµα των αισθητηρων στην συγκεκριµενη εφαρµογη __________ - 140 -
IX
X
ΕΙΣΑΓΩΓΗ
1 Εισαγωγή
1.1 ∆ιάγνωση βλαβών στη γραµµή παραγωγής
Μετά τον Β’ Παγκόσµιο πόλεµο παρατηρήθηκε µια αυξανόµενη πολυπλοκότητα
των στρατιωτικών και βιοµηχανικών συστηµάτων σε αντίθεση µε την µείωση του
εκπαιδευµένου προσωπικού επίβλεψης. Αυτές οι δύο παράµετροι προκάλεσαν αυξανόµενη
ζήτηση
για
αυτοµατοποιηµένα
συστήµατα
ελέγχου.
Ταυτόχρονα,
η
ίδια
η
αυτοµατοποίηση της παραγωγής δεν θα µπορούσε από την φύση της εξέλιξής της να µην
συµπεριλάβει και την αυτοµατοποίηση του ελέγχου της. Η απαίτηση για καλύτερη
ποιότητα τελικού προϊόντος καθώς και για ασφαλέστερες συνθήκες εργασίας είναι δύο
ακόµα
σηµαντικοί
παράγοντες
που
επέβαλαν
την
ανάπτυξη
αξιόπιστων
αυτοµατοποιηµένων συστηµάτων ελέγχου της ποιότητας των παραγοµένων προϊόντων.
Ως βλάβη ή ελάττωµα ενός προϊόντος στην γραµµή παραγωγής µπορεί να οριστεί
οποιαδήποτε ασυµφωνία ενός χαρακτηριστικού του ή κάποιας λειτουργίας του µε κάποιες
προκαθορισµένες τιµές (specifications). Πρέπει να επισηµανθεί ότι η παρουσία βλάβης δεν
είναι απαραίτητο να σηµαίνει αχρηστία. Συνεπώς, µε την διαδικασία διάγνωσης βλαβών
δεν εντοπίζονται για παράδειγµα µόνο προϊόντα που δεν λειτουργούν αλλά και αυτά που
λειτουργούν εκτός των προδιαγραφών. Για λόγους ανταγωνισµού κυρίως, η διεθνής τάση
στην αγορά είναι να δοθεί µεγαλύτερη έµφαση στην ποιότητα των παραγοµένων
προϊόντων. Ταυτόχρονα, κοινωνικές πιέσεις για περισσότερη ασφάλεια και ποιότητα των
προϊόντων δηµιούργησαν περισσότερα και πιο αυστηρά επίπεδα χαρακτηριστικών και
λειτουργίας (standards) γεγονός που ασκεί πίεση στους κατασκευαστές για την
ενσωµάτωση συστηµάτων ελέγχου ποιόηττας στην παραγωγική διαδικασία.
Για τον έλεγχο του παραγοµένου προϊόντος στην γραµµή παραγωγής, εκτός από την
συνηθισµένη µη αυτοµατοποιηµένη εποπτεία που ασκείται από κάποιον εξειδικευµένο
-1-
ΕΙΣΑΓΩΓΗ
εργάτη υπάρχουν στατιστικές µέθοδοι όπως τα διαγράµµατα ελέγχου. Τα διαγράµµατα
αυτά που είναι γνωστά και ως διαγράµµατα Shewhart, άρχισαν να εφαρµόζονται για τον
στατιστικό έλεγχο των παραγωγικών διαδικασιών από τις αρχές της δεκαετίας του 1930
[Pouliezos and Stavrakakis (1994)]. Οι µέθοδοι αυτές συνήθως παρέχουν όρια τα οποία
προκύπτουν από την στατιστική συµπεριφορά της παραγωγικής διαδικασίας [Vance
(1983)]. Αν συγκεκριµένα χαρακτηριστικά του παραγόµενου προϊόντος βρεθούν εκτός
των ορίων, τότε το προϊόν θεωρείται ελαττωµατικό και αποµακρύνεται από την γραµµή
παραγωγής όπου και επανεξετάζεται. Αυτός ο τρόπος ελέγχου έχει το πλεονέκτηµα ότι δεν
επηρεάζεται εύκολα από διακυµάνσεις των µετρουµένων χαρακτηριστικών οι οποίες
µπορεί να οφείλονται σε διάφορους λόγους όπως ο βιοµηχανικός θόρυβος, η αλλαγή των
πρώτων υλών παραγωγής, η µεγάλη ανοχή των οργάνων µέτρησης κ.α.
Η εξοικονόµηση πόρων, η απαίτηση για υψηλά ποσοστά διάγνωσης ελαττωµατικών
προϊόντων και η µείωση του απαιτούµενου χρόνου ελέγχου, είναι οι βασικοί λόγοι για την
ολοένα και µεγαλύτερη υιοθέτηση αυτοµατοποιηµένων διαγνωστικών συστηµάτων, που
σταδιακά βοηθούν ή αντικαθιστούν τον ανθρώπινο παράγοντα στην διαδικασία ελέγχου
της παραγωγής.
1.2 Σύγχρονες απαιτήσεις διαγνωστικών συστηµάτων
Η υπάρχουσα εµπειρία από την µέχρι σήµερα εφαρµογή διαγνωστικών συστηµάτων
έχουν διαµορφώσει ένα πλαίσιο απαιτήσεων που είναι επιθυµητό να ικανοποιούνται από
ένα τέτοιο σύστηµα [Strejc (1981), Rodriguez, and Rivera (1986), Shirley and Fortin
(1986), Morrison and Upton (1994), Pouliezos and Stavrakakis (1994)]. Οι απαιτήσεις
αυτές και γενικότερα οι επιθυµητές ιδιότητες ενός διαγνωστικού συστήµατος είναι:
Αυτοµατοποίηση
των
διαδικασιών
µέτρησης,
οι
οποίες
µέχρι
σήµερα
πραγµατοποιούνται από εξειδικευµένο προσωπικό λειτουργίας και συντήρησης, µε
ευνόητες επιπτώσεις στο κόστος, στο χρόνο και την αξιοπιστία. Η εξέλιξη των
βασισµένων σε ηλεκτρονικό υπολογιστή συστηµάτων πρόσκτησης και παρακολούθησης
-2-
ΕΙΣΑΓΩΓΗ
λειτουργίας (SCADA), δίνει την δυνατότητα για οικονοµικά εφικτές λύσεις χωρίς
ιδιαίτερη πολυπλοκότητα.
Το ίδιο ισχύει και για την λήψη της διαγνωστικής απόφασης, έτσι ώστε στις
περιπτώσεις τις οποίες είναι δυνατόν, η διαδικασία να αυτοµατοποιηθεί πλήρως ή στο
βαθµό που προτείνει ο σχεδιαστής του συστήµατος.
Η αυτοµατοποίηση δεν σηµαίνει και κατάργηση της πληροφορίας: το διαγνωστικό
σύστηµα θα πρέπει να υποστηρίζει την διαφάνεια στην λήψη των αποφάσεων και να έχει
διαθέσιµη κάθε πληροφορία στους χρήστες που αφορά το είδος, το µέγεθος, το χρόνο της
βλάβης και πιθανόν την διαδικασία αποκατάστασης.
Κάθε προϋπάρχουσα εµπειρία αλλά και κάθε νέο στοιχείο που εµφανίζεται στην
γραµµή παραγωγής, θα πρέπει να αξιολογείται κατάλληλα από το αυτοµατοποιηµένο
διαγνωστικό σύστηµα. Συνεπώς θα πρέπει να υπάρχει "µνήµη" αλλά και "µαθησιακή"
διαδικασία.
Είναι επιθυµητή η χρήση περισσοτέρων της µίας διαγνωστικών µεθόδων και ο
συνδυασµός τους µε κατάλληλη διαδικασία, προσδίδοντας έτσι αυξηµένες ικανότητες
ανίχνευσης βλαβών και αξιοπιστίας, αφού είναι γνωστό ότι συχνά κάθε µέθοδος έχει στην
πραγµατικότητα συγκεκριµένες αδυναµίες εφαρµογής. Τα συστήµατα αυτά καλούνται
υβριδικά και αν γίνει κατάλληλος συνδυασµός, είναι δυνατόν ο σχεδιαστής να
επωφελείται από τα πλεονεκτήµατα της κάθε µεθόδου.
Είναι επιθυµητή ακόµα η απόδοση ενός µέτρου της ποιότητας του παραγοµένου
προϊόντος κατά την διάρκεια της διαδικασίας, αφού έτσι τίθεται στην διακριτική ευχέρεια
του χειριστή ή σχεδιαστή του συστήµατος, να επανεξετάσει το προϊόν που θα αποκλίνει
από τα προκαθορισµένα όρια.
Η δυνατότητα ενσωµάτωσης ενός τέτοιου συστήµατος στο γενικότερο σύστηµα της
γραµµής παραγωγής, θα πρέπει να επιτρέπει την οµαλή ροή σε όλα τα σχετιζόµενα
τµήµατα.
-3-
ΕΙΣΑΓΩΓΗ
Η επίδοση ενός διαγνωστικού συστήµατος µπορεί να αξιολογηθεί µε βάση τις
ακόλουθες παραµέτρους:
Πρέπει να ανιχνεύει όσο το δυνατό µεγαλύτερο αριθµό πραγµατικών βλαβών και
ταυτόχρονα να κρατά σε χαµηλό επίπεδο τον αριθµό των εσφαλµένων συναγερµών (false
alarms).
Ο χρόνος αντίδρασης του συστήµατος από την στιγµή του εντοπισµού πρέπει να
είναι µικρός, ώστε να γίνουν οι απαραίτητες ενέργειες στην γραµµή παραγωγής.
Η χρησιµοποιούµενη µέθοδος θα πρέπει να ανιχνεύει τις προκύπτουσες βλάβες µε
ευρωστία (robustness), ανεπηρέαστη από εξωτερικές διαταραχές ή θορύβους, µια
κατάσταση συνηθισµένη στο βιοµηχανικό περιβάλλον παραγωγής.
1.3 Στόχος, βασικοί άξονες και δοµή της εργασίας
Η παρούσα εργασία έχει σαν σκοπό, την ανάπτυξη ενός αυτοµατοποιηµένου
διαγνωστικού συστήµατος, το οποίο µε χρήση
µη καταστρεπτικών µεθόδων θα
πραγµατοποιεί διάγνωση βλαβών οικιακών συσκευών σε µια γραµµή παραγωγής, µε
στόχο την βελτίωση της ποιότητας του τελικού παραγόµενου προϊόντος.
Ο στόχος της εργασίας είναι να προτείνει µια µεθοδολογία που θα επιτυγχάνει ένα
υψηλό ποσοστό διάγνωσης, σε πραγµατικό χρόνο και σε εργοστασιακό περιβάλλον, των
σηµαντικότερων βλαβών που ενδιαφέρουν το βιοµηχανικό κατασκευαστή.
Στο επόµενο κεφάλαιο θα αναπτυχθεί γενικά η δυνατότητα ανίχνευσης βλαβών
κάνοντας χρήση της θεωρίας της αναγνώρισης προτύπου. Θα περιγραφούν οι δύο βασικές
κατηγορίες της παραµετρικής και µη παραµετρικής διάγνωσης και θα δοθεί συνοπτικά η
µεθοδολογία που ακολουθείται συχνά στην παραγωγή για διάγνωση και συντήρηση,
χρησιµοποιώντας ανάλυση κραδασµών. Ακολούθως θα αναπτυχθεί η διάρθρωση σε
διακριτά στάδια ενός συστήµατος που θα συνδυάζει την γνωστή θεωρία της ανάλυσης
κραδασµών και την αναγνώριση προτύπου. Στο τέλος του κεφαλαίου θα αναφερθούν
-4-
ΕΙΣΑΓΩΓΗ
προηγούµενες προσεγγίσεις που έχουν αναφερθεί στην βιβλιογραφία και είναι σχετικές µε
αυτήν που επιχειρείται σ' αυτή την εργασία.
Στο κεφάλαιο 3, θα παρουσιαστεί η ανάγκη που υπάρχει στην βιοµηχανία για την
δηµιουργία ενός αυτοµατοποιηµένου διαγνωστικού συστήµατος στην γραµµή παραγωγής
οικιακών συσκευών όπως είναι τα πλυντήρια και τα προσδοκώµενα οφέλη από µια τέτοια
εφαρµογή. Θα αναφερθούν οι κατηγορίες βλαβών που απασχολούν τον βιοµηχανικό
κατασκευαστή και οι οποίες αφορούν κατά κύριο λόγο προβλήµατα που εµφανίζουν τα
προϊόντα λόγω κακής συναρµολόγησης. Επίσης, θα αναφερθεί ο τρόπος πρόσκτησης των
δεδοµένων από τα προκαθορισµένα σηµεία µέτρησης, καθώς και ο τρόπος δοµής και
κωδικοποίησής τους.
Στο κεφάλαιο 4, θα αναλυθεί το απαραίτητο θεωρητικό υπόβαθρο για την υλοποίηση
ενός συστήµατος αυτοµατοποιηµένης διάγνωσης στην γραµµή παραγωγής, το οποίο κάνει
χρήση
της αναγνώρισης προτύπου και της ανάλυσης κραδασµών. Συγκεκριµένα, θα
παρουσιαστεί ο τρόπος µε τον οποίον τα δεδοµένα κανονικοποιούνται και στην συνέχεια
µετατρέπονται στο πεδίο της συχνότητας µέσω του διακριτού µετασχηµατισµού Fourier.
Στην συνέχεια, θα αναλυθεί η δυνατότητα κατηγοριοποίησης των δεδοµένων στον χώρο
ℜ2 που δίνεται µέσω της εκτιµήτριας πυκνότητα πυρήνα µε την χρήση ισοϋψών
καµπύλων. Αναφέρεται η µέθοδος µείωσης της διάστασης των δεδοµένων µέσω του
µετασχηµατισµού Karhunen-Loeve, που είναι γνωστότερος ως ανάλυση δεδοµένων σε
κύριες συνιστώσες. Περιγράφεται ακόµη, ο τρόπος µε τον οποίο γίνεται ταξινόµηση
δεδοµένων µέσω αποστάσεων και συγκεκριµένα µε χρήση ευκλείδειας απόστασης,
απόστασης Mahalanobis και απόστασης Bayes. ∆ίνονται δύο µέθοδοι κατηγοριοποίησης
που κάνουν χρήση ασαφούς λογικής: ο αλγόριθµος FCM, ο οποίος αποτελεί µια µη
εποπτευόµενη µέθοδο που ανιχνεύει για υπάρχουσες δοµές στα δεδοµένα
και το
προσαρµοζόµενο δίκτυο ANFIS, το οποίο µε βάση την πληροφορία από τα παραδείγµατα
κατηγοριοποίησης αναπροσαρµόζει κατάλληλα συναρτήσεις συµµετοχής, που εκφράζουν
το κατά πόσο ένα αντικείµενο ανήκει σε κάποια κατηγορία. Τέλος, περιγράφεται ο
αλγόριθµος ID ο οποίος χρησιµοποιείται µε επιτυχία για κατηγοριοποίηση ποιοτικών
δεδοµένων αλλά στην περίπτωση αυτής της εργασίας θα χρησιµοποιηθεί για αριθµητικά
δεδοµένα και συγκεκριµένα για τον προσδιορισµό των πλέον διαχωριστικών
-5-
ΕΙΣΑΓΩΓΗ
χαρακτηριστικών, ώστε να τροφοδοτήσουν µε επιτυχία κάποια από τις µεθόδους
ταξινόµησης.
Στο κεφάλαιο 5, θα αναλυθεί η διαδικασία µε την οποία, κάνοντας χρήση της
θεωρίας που περιγράφονται στο κεφάλαιο 4, κατασκευάστηκε ένα αυτοµατοποιηµένο
σύστηµα ταξινόµησης, το οποίο ικανοποιεί σε µεγάλο βαθµό τις απαιτήσεις που
περιγράφονται στο κεφάλαιο 3. Συγκεκριµένα, αναλύεται ο τρόπος µε τον οποίο γίνεται η
συλλογή και προεπεξεργασία των δεδοµένων, καθώς και οι εναλλακτικές προσεγγίσεις
που
εξετάσθηκαν
κατά
την
διαδικασία
εξαγωγής
των
χαρακτηριστικών.
Αντιπαραβάλλονται διαφορετικές µέθοδοι ταξινόµησης και προτείνεται ένα τελικό σχήµα,
το οποίο πραγµατοποιεί µε βάση τα µέχρι τώρα δεδοµένα ικανοποιητική ταξινόµηση σε
ποσοστό άνω του 95%. Στο τέλος του κεφαλαίου παρουσιάζεται µια συνολική εκτίµηση
της υλοποίησης σε βιοµηχανικό περιβάλλον καθώς και τυχόν επεκτάσεις ή βελτιώσεις στο
σύστηµα.
Στo παράρτηµα παρουσιάζονται αναλυτικά οι αρχές λειτουργίας του συστήµατος
των ιντερφεροµετρικών αισθητήρων, η περιοχή λειτουργίας του, καθώς και προβλήµατα ή
σφάλµατα που µπορεί να επηρεάσουν τη µέτρηση. Στην συνέχεια παρατίθεται ένας
πίνακας που συνοψίζει τις αιτίες που µας προσδιορίζουν αντίστοιχες βλάβες σύµφωνα µε
την θεωρία της ανάλυσης κραδασµών. Ακολουθεί πίνακας µε αναλυτική κατανοµή των
δειγµάτων που χρησιµοποιήθηκαν σ' αυτή την εργασία ανά τύπο και σηµείο µέτρησης.
-6-
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
2 Αυτοµατοποιηµένη διάγνωση βλαβών
µέσω
αναγνώρισης
προτύπου
(pattern
recognition)
2.1 Μέθοδοι παραµετρικής και µη παραµετρικής διάγνωσης
Οι διαγνωστικές µέθοδοι µπορούν να διαχωριστούν σε δύο κατηγορίες µε βάση την
χρήση ή µη ενός µοντέλου που θα εκµεταλλεύεται την διαθέσιµη πληροφορία [Pouliezos
and Stavrakakis (1994)]. Έστω ότι επιθυµούµε να κατασκευαστεί ένα διαγνωστικό
σύστηµα το οποίο θα προσλαµβάνει δεδοµένα από τον χώρο εισόδου και θα πρέπει να
αποδώσει στην έξοδο πληροφορία για την κατάσταση του ελεγχοµένου αντικειµένου. Στην
περίπτωση που υφίσταται επαρκής γνώση για την δοµή του χώρου εισόδου και για τις
διαδικασίες που οδηγούν στις διάφορες καταστάσεις (βλάβες ή οµαλή λειτουργία), τότε
είναι δυνατόν να κατασκευαστεί ένα παραµετρικό µοντέλο εκτίµησης, το οποίο κάθε φορά
θα αντιστοιχεί την είσοδο σε µια κατάσταση του ελεγχοµένου αντικειµένου στην έξοδο. Οι
παράµετροι του µοντέλου εκτίµησης συνήθως εκτιµώνται µέσω παραδειγµάτων, γνωστών
δηλαδή αντιστοιχήσεων εισόδου-εξόδου. Θα πρέπει πάντως, όταν µιλάµε για µοντέλα που
έχουν εφαρµογή στην αυτοµατοποιηµένη διάγνωση, να ληφθεί σοβαρά υπόψη η σηµασία
που έχει ο χρόνος διάγνωσης αφού πολύπλοκα µοντέλα µε απαιτητικούς σε χρόνο
υπολογισµούς είναι πρακτικά ανεφάρµοστα.
Στην περίπτωση που δεν υπάρχει επαρκής γνώση του χώρου εισόδου και των
µηχανισµών που επενεργούν στο υπό έλεγχο αντικείµενο, δεν είναι εφικτό να
χρησιµοποιηθεί παραµετρικό µοντέλο εκτίµησης και εφαρµόζονται µη παραµετρικές
-7-
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
µέθοδοι εκτίµησης της κατάστασης. Τέτοιες µέθοδοι κάνουν χρήση όλων των διαθέσιµων
δεδοµένων και η αντιστοίχηση από τον χώρο εισόδου στις καταστάσεις γίνεται µέσω της
πληροφορίας που εµπεριέχεται στα παραδείγµατα (για παράδειγµα µε χρήση νευρωνικών
δικτύων), σε αντίθεση µε τις παραµετρικές στις οποίες αρκεί να προσδιοριστούν οι
παράµετροι του µοντέλου. Γι' αυτό και καλούνται από τον Stone (1977), µέθοδοι
βασισµένες στην µνήµη (memory based methods). Οι µέθοδοι που χρησιµοποιούν
αναγνώριση προτύπου ανήκουν στις µη παραµετρικές µεθόδους αφού δεν είναι
απαραίτητο κάποιο µαθηµατικό µοντέλο για την διάγνωση.
Συγκρίνοντας τις δύο µεθόδους µπορούµε να παρατηρήσουµε τα ακόλουθα:
Η επιτυχία των παραµετρικών µεθόδων µε χρήση µοντέλου εξαρτάται άµεσα από
την σωστή επιλογή του µοντέλου. Με µόνη δυνατότητα την αλλαγή των παραµέτρων µια
τέτοια µέθοδος είναι δυσπροσάρµοστη σε σηµαντικές αλλαγές, τόσο όσον αφορά τα
δεδοµένα εισόδου, όσο και σε αλλαγές στο χώρο της κατάστασης. Η ευαισθησία σε λάθη
µοντελοποίησης έχει αναδειχθεί σ' ένα από τα σηµαντικότερα προβλήµατα αυτών των
µεθόδων [Pouliezos and Stavrakakis (1994)].
Οι µη παραµετρικές µέθοδοι συνήθως έχουν µικρότερο υπολογιστικό φόρτο, αλλά
απαιτούν έναν ικανό αριθµό παραδειγµάτων, αλλιώς δεν µπορούν να φτάσουν σε ικανό
επίπεδο εκµάθησης. Είναι όµως περισσότερο ευέλικτες σε αλλαγές, τόσο στα δεδοµένα
εισόδου όσο και στην διαδικασία, αφού τα δεδοµένα εισόδου είναι αυτά που καθορίζουν
την συµπεριφορά του διαγνωστικού συστήµατος. Βέβαια για κάθε τέτοια αλλαγή
απαιτείται η επανάληψη του σταδίου εκµάθησης. Η αντιπροσωπευτικότητα και η
ποσότητα των παραδειγµάτων είναι παράµετροι εξαιρετικής σηµασίας γι΄ αυτή την
προσέγγιση.
Η κατηγορία των µεθόδων που χρησιµοποιούν την αναγνώριση προτύπου, για να
διαχωρίσουν τον χώρο των χαρακτηριστικών σε κατηγορίες αντίστοιχες µε τις πιθανές
καταστάσεις και στην συνέχεια να δώσουν την διαγνωστική απόφαση, ανήκει στις µη
παραµετρικές µεθόδους.
-8-
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
2.2 Αναγνώριση προτύπου
Ο όρος αναγνώριση προτύπου αναφέρεται στην αναζήτηση για προϋπάρχουσες
δοµές µέσα σ' ένα σύνολο δεδοµένων. Τα δεδοµένα µπορούν να είναι ποσοτικά, ποιοτικά ή
να ανήκουν και στις δύο κατηγορίες. Η αναζήτηση µπορεί να γίνει µε διάφορες µεθόδους
(στατιστικές, εµπειρικές, κ.α.). Η ανάλυση της δοµής των δεδοµένων και συγκεκριµένα
των κατηγοριών (cluster analysis) αφορά την έρευνα για την ύπαρξη κατηγοριών
εξαντλητικών και αλληλοαποκλειοµένων µε τέτοιον τρόπο, ώστε τα µέλη κάθε κατηγορίας
να παρουσιάζουν µεγαλύτερη οµοιότητα µεταξύ τους, σε σχέση µε τα µέλη κάθε άλλης
κατηγορίας.
Ορισµός 2.1:
Έστω Ω ένα σύνολο οµοειδών προϊόντων και p ∈ Ω ένα προϊόν. Αν στα προϊόντα αυτά
οριστεί ένα πεπερασµένο σύνολο παραµέτρων τα λεγόµενα χαρακτηριστικά του (features)
και κάθε χαρακτηριστικό i µπορεί να λάβει n τιµές x 1i ( p ),K , x ni ( p ) σχετικές µε το
προϊόν, δηµιουργούµε ένα πρότυπο (pattern) xi = ( xi1( p ), ... , xin ( p )) . Συνεπώς, το πρότυπο
είναι ένα σύνολο τιµών των χαρακτηριστικών παραµέτρων ενός αντικειµένου. Αν ορίσουµε
ως κλάσεις του Ω τα k διαφορετικά υποσύνολα w j ⊆ Ω έτσι ώστε
k
Uw
j
= Ω , το πρόβληµα
j =1
της αναγνώρισης προτύπου έγκειται στην κατάταξη του x σε κάποια κλάση wj κάνοντας
χρήση των χαρακτηριστικών.
Η αναγνώριση προτύπου χρησιµοποιείται συχνά σε εφαρµογές στις οποίες
εκτελούνται αυτοµατοποιηµένες διαδικασίες εξαιρετικά απλές για τον άνθρωπο όπως
αναγνώριση εικόνας ή φωνής. Η αναγνώριση προτύπου βρίσκει επίσης εφαρµογή σε
περιπτώσεις όπου σύνθετα και πολυπληθή δεδοµένα είναι δύσκολο να ερµηνευθούν από
τον άνθρωπο. Έτσι, όπως θα παρουσιαστεί και σ' αυτή την εργασία, στην περίπτωση όπου
τα δεδοµένα προέρχονται από πολλούς αισθητήρες και αναπαριστώνται σε διαστάσεις και
χώρους που ο άνθρωπος δεν έχει δυνατότητες εποπτείας και εµπειρία σχετικά µε την
-9-
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
µορφή των σχηµατιζόµενων δοµών, η αναγνώριση προτύπου µπορεί να αποδειχθεί µια
εξαιρετικά χρήσιµη µεθοδολογία.
2.3 ∆ιάγνωση βλαβών και συντήρηση βασισµένη στην ανάλυση κραδασµών
(vibration analysis)
Η διάγνωση βλαβών µέσω ανάλυσης κραδασµών αποτελεί µια περιοχή που κερδίζει
συνεχώς έδαφος στην βιοµηχανία, αφού µειώνει τα έξοδα συντήρησης, αυξάνει την
αξιοπιστία και βελτιώνει τα επίπεδα ασφάλειας. Τα οικονοµικά οφέλη µιας τέτοιας
µεθόδου έχουν ήδη επισηµανθεί από τα τέλη της δεκαετίας του '60 [Poling (1966), Baxter
and Bernhard (1968)]. Η χρήση τεχνικών όπως η ανάλυση κραδασµών ή θορύβου, για την
διαπίστωση αλλαγής κατάστασης µηχανών παρουσιάζεται αναλυτικά από τον Lyon
(1987). Στην Ελλάδα, βιοµηχανικοί κυρίως χρήστες και µεγάλες µονάδες παραγωγής
ιδιωτικές ή δηµόσιες όπως η ∆ΕΗ χρησιµοποιούν ανάλυση κραδασµών για προληπτικούς
λόγους σε περιστρεφόµενες µηχανές και αεροστρόβιλους [Λουκής (1993)]. Αποτελεί µια
τεχνική µεταξύ άλλων, η οποία χρησιµοποιείται στην περίπτωση που έχουµε άγνοια ή
είναι δύσκολο να εκτιµήσουµε το ακριβές µοντέλο της διαδικασίας της λειτουργίας και
των πιθανών καταστάσεων. Η πρόοδος που έχει σηµειωθεί τόσο στο χώρο της
πληροφορικής όσο και στον χώρο των αισθητηρίων και οργάνων µέτρησης
έχει
καταστήσει την µέθοδο ελκυστική από πλευράς κόστους και χρόνου.
Η συνήθης διαδικασία της ανάλυσης κραδασµών, αφορά την παρακολούθηση των
δονήσεων συνήθως περιστρεφόµενων µηχανικών συστηµάτων, µέσω κατάλληλων
αισθητηρίων. Η λειτουργία της µηχανής είναι από την φύση της η γενεσιουργός αιτία
αυτών των δονήσεων (πηγή). Όταν η δόνηση µετριέται πάνω στο σώµα της µηχανής,
συνήθως µέσω transducer ή επιταχυνσιοµέτρου (µετατροπείς κραδασµού σε αναλογικό
ηλεκτρικό σήµα), καταγράφεται το σήµα της πηγής µε µια αλλοίωση που προέρχεται από
τα φυσικά χαρακτηριστικά του µέσου που παρεµβάλλεται στη διαδροµή του κύµατος. Η
παρακολούθηση του σήµατος τόσο στο πεδίο του χρόνου, όσο και στο πεδίο της
συχνότητας, δίνει την δυνατότητα εντοπισµού µιας βλάβης στο σύστηµα ή την πρόκληση
- 10 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
συναγερµού στην περίπτωση που δεν γνωρίζουµε το ακριβές αίτιο της βλάβης και τους
λόγους της µη εύρυθµης λειτουργίας. Συνήθως, µία βλάβη σε εξέλιξη θα προκαλέσει
αύξηση δονήσεων σε µια περιοχή συχνοτήτων η οποία σχετίζεται µε την βλάβη. Σύµφωνα
µε πρότυπα που έχουν καθιερωθεί
διεθνώς [ISO 10816-1 (1995)] οι µετρήσεις
ταλαντώσεων για µεγάλο εύρος συχνοτήτων, µπορούν να χρησιµοποιηθούν ως δείκτης της
γενικής κατάστασης µιας µηχανής [Αδαµόπουλος (1988)] όπως στο σχήµα 2.1. Ανάλογα
µε τα πλάτη των ταλαντώσεων και τις συχνότητες που παρουσιάζονται, µπορούµε να
αποφανθούµε για την κατάσταση του συστήµατος που εµφανίζει τους κραδασµούς.
Σχήµα 2.1 Κατάταξη λειτουργίας συστήµατος που υπόκειται σε κραδασµούς
ανάλογα µε την περιοχή συχνοτήτων-µετατοπίσεων
Οι δονήσεις που παρατηρούνται κατά την διάρκεια λειτουργίας µιας µηχανής
µεταβάλλονται και για άλλους λόγους:
Α. Τα µέρη που έρχονται σε επαφή αλλοιώνουν τα φυσικά τους χαρακτηριστικά
λόγω τριβής. Πρόκειται για την φυσική φθορά λόγω τριβής σηµείων εδράσεων, τριβέων,
κλπ. η οποία βέβαια ενδέχεται να οδηγήσει και σε βλάβη.
- 11 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Β. Αρκετές φορές µέρη της µηχανής αντικαθίστανται από άλλα που έχουν
διαφορετικές ιδιότητες (για παράδειγµα κατασκευασµένα από άλλα υλικά).
Γ. Αλλάζει η έδραση της µηχανής ή έρχεται σε επαφή µε άλλα συστήµατα µε
συνέπεια να αλλάζουν παράµετροι όπως η ιδιοσυχνότητά της.
Αυτές οι µεταβολές των δονήσεων µπορούν να διαχωριστούν σε βραχυπρόθεσµες
και σε µακροπρόθεσµες ανάλογα µε το χρονικό διάστηµα που µεταβάλλεται η συχνότητα
των δονήσεων.
Όταν το σήµα αυτό αναλύεται στο πεδίο των συχνοτήτων µέσω του
µετασχηµατισµού Fourier, είναι δυνατόν να εξαχθούν συµπεράσµατα που αφορούν την
περιοδικότητα του σήµατος. Η ύπαρξη πολλαπλασίων µιας θεµελιώδους συχνότητας, που
καλούνται αρµονικές, πολύ συχνά αποκαλύπτει σχέση αίτιου-αιτιατού µε συγκεκριµένες
βλάβες ή απλά χαρακτηρίζει φυσικά υποσυστήµατα της µηχανής. Παράδειγµα περιοδικού
σήµατος αποτελεί η δόνηση οφειλόµενη σε πρόβληµα στα γρανάζια µετάδοσης κίνησης
και η οποία µεταφράζεται σε εµφάνιση συνιστωσών στο φάσµα συχνοτήτων σε τιµές
ανάλογες προς τον αριθµό οδόντωσης και τον λόγο εµπλοκής του γραναζιού.
- 12 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Συνοψίζοντας, η παρακολούθηση της κατάστασης ενός κινητήρα (σχήµα 2.2)
µπορούν να πραγµατοποιηθούν ως ακολούθως [Brüel & Kjær(1980)]:
1.Με παρακολούθηση του συνολικού επιπέδου κραδασµών και την οριοθέτηση
επιπέδων συναγερµού και κανονικής λειτουργίας µε βάση την εµπειρία.
2. Στο πεδίο της συχνότητας, µε σύγκριση των φασµάτων των συχνοτήτων για κάθε
κατάσταση λειτουργίας
3.Προβλέποντας την εξέλιξη στο χρόνο συγκεκριµένων τµηµάτων του φάσµατος των
συχνοτήτων που συνδέονται µε την εύρυθµη ή µη λειτουργία του κινητήρα και κατά
συνέπεια προβλέποντας πιθανό χρόνο βλάβης.
4.Ελέγχοντας συγκεκριµένα σηµεία του φάσµατος των συχνοτήτων, στα οποία είναι
γνωστό ότι παρουσιάζονται µεταβολές όταν εµφανίζονται βλάβες.
- 13 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Παρά το ότι η εργασία αυτή πραγµατεύεται διάγνωση βλαβών µέσω κραδασµών,
πέρα από τις οµοιότητες που παρουσιάζει η µεθοδολογία που θα αναπτυχθεί µε την
γνωστή πλέον και εφαρµοσµένη ανάλυση κραδασµών, υπάρχουν και σηµαντικές διαφορές
που δεν επιτρέπουν ουσιαστικά την χρήση της λογικής που αναπτύχθηκε µε συντοµία. Θα
πρέπει να επισηµανθούν τα ακόλουθα:
Η ανάλυση κραδασµών εφαρµόζεται σε µηχανές ή µηχανικά συστήµατα για τα
οποία είναι γνωστή η προϊστορία και τα µηχανικά χαρακτηριστικά της µηχανής που θα
ελεγχθεί. Πρόκειται δηλαδή για µια παρακολούθηση της µηχανής και η διάγνωση
συνίσταται σε επέµβαση όταν παρατηρηθεί απόκλιση από κάποια όρια. Η προϊστορία αυτή
καταγράφεται και αποτελεί την λεγόµενη υπογραφή (signature) της µηχανής. Είναι
προφανές ότι η προϊστορία αυτή είναι διαφορετική για κάθε περίπτωση διαφορετικής
µηχανής. Στην περίπτωση που πραγµατοποιείται έλεγχος νέου προϊόντος δεν υφίσταται
ουσιαστικά προϊστορία και δεν είναι δυνατή τέτοια προσέγγιση.
Λόγω περιορισµών στην περιοχή ελέγχου της γραµµής παραγωγής, δεν είναι
δυνατόν να πραγµατοποιηθεί η µέτρηση µε τον τρόπο που απαιτεί η ανάλυση κραδασµών.
Η µέτρηση στην ανάλυση κραδασµών απαιτεί ιδανικές συνθήκες: συνηθίζεται η χρήση
αισθητηρίου επαφής και η προετοιµασία της όλης διαδικασίας είναι χρονοβόρα. Στην
περίπτωση του ελέγχου στην γραµµή παραγωγής θέλουµε να ελαχιστοποιήσουµε το χρόνο
µέτρησης και συνεπώς δεν συνιστάται χρήση αισθητηρίου επαφής, ούτε είναι δυνατή η
επανάληψη της διαδικασίας τοποθέτησης και ρύθµισης του συστήµατος µέτρησης για
κάθε προϊόν, όπως συνηθίζεται στην ανάλυση κραδασµών.
Το εξεταζόµενο µηχανικό σύστηµα του πλυντηρίου µε ελατήρια-αναρτήσεις και
γενικά συστήµατα απορρόφησης κραδασµών, είναι σύνθετο και περιλαµβάνει πληθώρα
ηλεκτροµηχανικών
υποσυστηµάτων,
που
προκαλούν
ιδιόµορφες
αποσβέσεις
επηρεάζοντας το φάσµα των συχνοτήτων.
Στο συγκεκριµένο πρόβληµα δεν είναι εκ των προτέρων γνωστές οι ιδιότητες και τα
χαρακτηριστικά του σήµατος των κραδασµών για τα προϊόντα της γραµµής παραγωγής.
∆εν υπάρχει δηλαδή γνωστή πληροφορία για την µορφή που αναµένεται να έχει το σήµα,
τόσο στο πεδίο του χρόνου όσο και στο πεδίο της συχνότητας.
- 14 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Οι παραπάνω επισηµάνσεις έχουν ως αποτέλεσµα να µην είναι δυνατόν
να
εφαρµοστούν αυτούσιες οι τεχνικές που χρησιµοποιούνται στην διάγνωση ενός απλού
κινητήρα.
2.4 Συνδυασµός ανάλυσης κραδασµών µε αναγνώριση προτύπου
Συνδυάζοντας τα όσα αναφέρθηκαν στις δύο προηγούµενες ενότητες, είναι δυνατόν
να εφαρµοστεί µια εναλλακτική αντιµετώπιση στο πρόβληµα της διάγνωσης βλαβών στην
γραµµή παραγωγής προϊόντων που περιέχουν κινητήρες, οι οποίοι θέτουν σε περιστροφή
σύνθετα συστήµατα. ∆εδοµένα από τις προς έλεγχο πιθανές καταστάσεις (κανονική
λειτουργία και διαφορετικές βλάβες), τα οποία συλλέγονται από αισθητήρες,
µετατρέπονται σε φάσµατα στο πεδίο της συχνότητας. Όµως η πληροφορία που
εµφανίζεται στα φάσµατα, δεν δίδει προφανή κατάταξη των πιθανών καταστάσεων, έτσι
ώστε να δίνει στην συνέχεια την δυνατότητα να κατατάσσουµε κάθε νέο προϊόν σε
κατηγορία αποδεκτού ή ελαττωµατικού. Στην εργασία αυτή προτείνεται η επιλογή
κατάλληλων χαρακτηριστικών µε κριτήριο την διαχωρισιµότητα των κλάσεων, ώστε να
µειώνεται ο χώρος εισόδου, οπότε κατάλληλα επιλεγµένοι ταξινοµητές να εµφανίζουν
στην έξοδο τις διαφορετικές κλάσεις. Με δεδοµένα αρκετά παραδείγµατα, ώστε να
υπάρχει σαφής εικόνα του χώρου των κλάσεων, προσδοκούµε να δηµιουργηθεί ένα
σύστηµα διάγνωσης, µε το οποίο να είναι δυνατή η ταξινόµηση ενός καινούργιου
προϊόντος όταν θα καταφθάνει στην γραµµή παραγωγής.
Στην βιβλιογραφία έχουν παρουσιαστεί πρόσφατα περιπτώσεις εφαρµογής ενός
συνδυασµού της αναγνώρισης προτύπου µε την ανάλυση ταλαντώσεων
[Meir et al.
(1993), Hemminger (1994), Zieba et al. (1994), Röpke and Filbert (1994), Burth et al.
(1996), Tumer et al. (1996)] και µάλιστα εµφανίζεται ενδιαφέρον για εφαρµογές σε πεδία
διάγνωσης όπως η ιατρική [Strackeljan et al. (1995)] και η µαγνητική φασµατογραφία
[Tate (1996)].
Ο προαναφερθείς τρόπος προσέγγισης µπορεί να χωριστεί σε στάδια ανάλογα µε τις
µετατροπές που υφίσταται το σήµα εισόδου. Παρά το ότι ο διαχωρισµός αυτός δεν είναι
- 15 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
αυστηρός και πολλές απ' αυτές τις διαδικασίες συγχωνεύονται ή παραλείπονται, είναι
ευδιάκριτα τα ακόλουθα στάδια τα οποία και παρουσιάζονται στο σχήµα 2.3.
Σχήµα 2.3 Στάδια συνδυασµού αναγνώρισης προτύπου µε ανάλυση κραδασµών
2.4.1 Στάδιο Α: Λήψη της πληροφορίας από τους αισθητήρες.
Οι αισθητήρες, ακουστικοί ή επιταχυνσιόµετρα, συνήθως εφάπτονται µε το
υποκείµενο του ελέγχου. Χρειάζεται προετοιµασία στην τοποθέτησή τους και η θέση τους
παίζει ρόλο στην ποιότητα της µετρούµενης ποσότητας [Barkov (1996), Obaitat (1993)].
Υπάρχει περίπτωση να έχουµε διάγνωση µε διέγερση από τη συσκευή που πραγµατοποιεί
τον έλεγχο, όπως συχνά συµβαίνει στην περίπτωση των ιατρικών εφαρµογών [Tate (1996),
Strackeljan et al. (1995)] όπου για να ελεγχθεί η σύνθεση του ιστού ή του οργάνου
εκπέµπεται ένα είδος κύµατος (ηλεκτροµαγνητικό ή ηχητικό) και αναλύεται η
επανεκποµπή του.
Σ' αυτή την εργασία οι αισθητήρες για λόγους απαιτήσεων της γραµµής παραγωγής
θα πρέπει να λειτουργούν από απόσταση, γεγονός που αποτελεί έναν από τους λόγους
επιλογής των ιντερφεροµετρικών αισθητήρων laser. Η επιλογή της συχνότητας
δειγµατοληψίας παίζει σηµαντικό ρόλο σ' αυτό το στάδιο, αφού καθορίζει τον αριθµό των
σηµείων στο πεδίο του χρόνου και τον βαθµό ανάλυσης στο πεδίο των συχνοτήτων.
- 16 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Υπάρχουν όµως ταυτόχρονα οι περιορισµοί του κόστους και της υπάρχουσας τεχνολογίας
που πρέπει να συνυπολογιστούν µε την απαίτηση για υψηλή ανάλυση.
2.4.2 Στάδιο Β: Προεπεξεργασία της πληροφορίας
Η αφαίρεση τµηµάτων της πληροφορίας στο πεδίο του χρόνου που δεν περιέχουν
χρήσιµη πληροφορία µε κατάλληλα φίλτρα και η κανονικοποίηση των δεδοµένων είναι
δύο παράγοντες που βελτιώνουν την δυνατότητα για καλύτερη διαχωρισιµότητα στα
επόµενα στάδια. Επίσης, το σήµα εισόδου θα πρέπει να ελεγχθεί για την ποιότητά του
όσον αφορά την αναλογία σήµατος προς θόρυβο και να γίνουν όλα τα βήµατα που θα
βελτιώσουν την αναλογία αυτή. Υπάρχει βέβαια το πρόβληµα προσδιορισµού του τι
αποτελεί πληροφορία και τι θόρυβο σε ένα πραγµατικό σήµα εισόδου. Στην στατιστική
µοντελοποίηση, θόρυβος µπορεί να νοηθεί το µη αιτιοκρατικό τµήµα ενός µοντέλου σε
αντίθεση µε το αιτιοκρατικό τµήµα, του οποίου η γνώση αποτελεί και την πληροφορία
[Shimshoni (1995)]. Οποιαδήποτε λοιπόν προσπάθεια µείωσης του θορύβου πρέπει να
στηρίζεται στην εκ των προτέρων γνώση του πεδίου εφαρµογής.
2.4.3 Στάδιο Γ: Μετατροπή στο πεδίο της συχνότητας
Επειδή συνήθως το σήµα των ταλαντώσεων στο πεδίο του χρόνου προκύπτει από
συνέλιξη περιοδικών σηµάτων, γίνεται µετατροπή του στο πεδίο της συχνότητας.
Συχνότερα χρησιµοποιείται ο µετασχηµατισµός Fourier [Zieba et al. (1994), Röpke (1994),
Strackeljan et al. (1995), Meir et al. (1993), Hemminger (1994)], αλλά τελευταία
χρησιµοποιούνται όλο και περισσότερο και άλλοι µετασχηµατισµοί όπως τα wavelets
[Tate (1996), Huynh et al. (1998)] που κρατούν και την πληροφορία της µεταβολής της
συχνότητας στο χρόνο.
- 17 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
2.4.4 Στάδιο ∆: Επιλογή χαρακτηριστικών
Ακόµα και αν επιχειρηθεί η κατηγοριοποίηση στο πεδίο των συχνοτήτων, το
προκύπτον σήµα ανήκει στο χώρο ℜn µε n αρκετά µεγάλο. Είναι λογικό να υποθέσουµε
ότι απαιτείται πολύ χαµηλότερη διάσταση για την µετάδοση της απαιτούµενης
πληροφορίας που απαιτείται για τον διαχωρισµό σε κλάσεις.
Ορισµός 2.2:
Ο ελάχιστος αριθµός χαρακτηριστικών d που απαιτείται για να διατηρηθεί η απαιτούµενη
πληροφορία για τον διαχωρισµό σε κλάσεις σχηµατίζει τον ουσιαστικό (intrinsic) χώρο ℜd
[Fukunaga (1972), Jain and Dubes (1988)].
Στόχος λοιπόν είναι, η επιλογή των χαρακτηριστικών να γίνει µε τέτοια κριτήρια
ώστε να πλησιάσουµε αυτή την διάσταση d και να περιοριστούµε σ' αυτά τα απολύτως
απαραίτητα χαρακτηριστικά. ∆υστυχώς, δεν υπάρχει προκαθορισµένος τρόπος για να
προχωρήσουµε στην µείωση αυτή, ενώ οποιαδήποτε µείωση από το αρχικό σήµα
µεταφράζεται και σε πιθανή µείωση της πληροφορίας που θα οδηγήσει σε ικανοποιητικό
διαχωρισµό. Έτσι, ο στόχος είναι να βρεθούν µετασχηµατισµοί που θα προβάλλουν τα
δεδοµένα σε χώρους µικρότερης διάστασης, διατηρώντας όµως το πληροφοριακό
περιεχόµενο του διαχωρισµού τους σε κλάσεις, όσο το δυνατόν αναλλοίωτο.
Υπάρχουν διάφορες κλασικές µέθοδοι και κριτήρια για να επιλεγούν αυτοί οι
µετασχηµατισµοί, όπως είναι η ανάλυση σε κύριες συνιστώσες (principal component
analysis επίσης γνωστή και ως
Karhunen-Loeve expansion), που χρησιµοποιεί ως
κριτήριο την διασπορά των δεδοµένων, ή η παραγοντική ανάλυση (factor analysis), η
οποία χρησιµοποιεί ως κριτήριο µείωσης της διάστασης τον συσχετισµό µεταξύ των
δεδοµένων. Ένα σηµείο που πρέπει να επισηµανθεί είναι ότι πολλές τέτοιες µέθοδοι
µείωσης του χώρου των δεδοµένων έχουν σαν κύριο στόχο την πιστή διατήρηση της δοµής
τους ενώ η βασική µέριµνα στα προβλήµατα ταξινόµησης είναι η επίτευξη
διαχωρισιµότητας [Duda and Hart (1973)].
- 18 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
2.4.5 Στάδιο Ε: Ταξινόµηση των σηµάτων σε κατηγορίες (αποδεκτό ή
ελαττωµατικό)
Μετά από όλα τα προηγούµενα στάδια προσδοκούµε η διάσταση του αρχικού
σήµατος να έχει µειωθεί και η διαχωρισιµότητα των κλάσεων να έχει αυξηθεί. Το
επιθυµητό είναι τα σήµατα να κατηγοριοποιηθούν µέσω καταλλήλων διαδικασιών σε
κατηγορίες που θα αντιστοιχούν στην πηγή που τα προκάλεσε.
Οι µέθοδοι ταξινόµησης µπορούν να διαχωριστούν σε δύο βασικές κατηγορίες: την
εποπτευόµενη (supervised) όπου ο ταξινοµητής δέχεται καθοδήγηση για τις κλάσεις που
θα διαµορφώσει και την µη εποπτευόµενη (unsupervised) όπου η ίδια η φύση των
δεδοµένων υποδεικνύει στον ταξινοµητή το πόσες κλάσεις θα δηµιουργηθούν. Κανονικά
στην εργασία αυτή, µόνο η πρώτη κατηγορία θα έπρεπε να ενδιαφέρει – αφού αν είναι
γνωστές οι βλάβες, είναι γνωστές και οι κατηγορίες που πρέπει να διαπιστώσει ο
ταξινοµητής – αλλά πολλές φορές εφαρµόζονται µη εποπτευόµενες µέθοδοι µε σκοπό να
επαληθευτούν δοµές µέσα στο χώρο των δεδοµένων ή να ανακαλυφθούν πιθανές άλλες
που υπάρχουν.
2.4.6 Αντιστοίχηση ενός προϊόντος σε µια κατηγορία
Στα προαναφερθέντα στάδια επισηµαίνεται η διαδοχική µείωση του χώρου των
δεδοµένων. Oι αισθητήρες προσλαµβάνουν αναλογικό σήµα από ένα προϊόν που
µετατρέπεται σε ψηφιακό (1η µείωση). Στην συνέχεια κατά την προεπεξεργασία, το σήµα
µετατρέπεται στην κατάλληλη κλίµακα (scaling) κρατώντας το τµήµα που πιστεύεται ότι
έχει την χρήσιµη πληροφορία (2η µείωση). Η µετατροπή στο πεδίο της συχνότητας
αποτελεί την 3η µείωση. Από το φάσµα των συχνοτήτων επιλέγονται τα χαρακτηριστικά
που θεωρείται ότι διαχωρίζουν τις κλάσεις (4η µείωση). Στο τέλος µε κάποιον ταξινοµητή
(classifier) κάθε σήµα αποδίδεται σε µία κατηγορία (5η µείωση). Είναι σηµαντικό, πως η
όλη διαδικασία ξεκίνησε από ένα προϊόν αντικείµενο ελέγχου, για να αποδοθεί στο τέλος
σε µία κατηγορία.
- 19 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Πρέπει να επισηµανθεί ακόµα, πως σε κάθε στάδιο αυτές οι διαδοχικές µειώσεις δεν
γίνονται πάντα µε προκαθορισµένο τρόπο. Είναι απόφαση του σχεδιαστή του συστήµατος
να αποφασίσει για παράδειγµα το τι θα πρέπει να γίνει κατά την προεπεξεργασία , ή ποια
µέθοδο θα πρέπει να χρησιµοποιήσει για να µετατρέψει το σήµα από το πεδίο του χρόνου
στο πεδίο της συχνότητας (π.χ. µετασχηµατισµό Fourier ή Wavelets). Τα σηµαντικότερα
στάδια πάντως είναι αυτά της επιλογής των χαρακτηριστικών και της µεθόδου
ταξινόµησης. Επειδή η έξοδος του ενός σταδίου αποτελεί είσοδο του άλλου, είναι
προφανές ότι η απόφαση στην έξοδο επηρεάζεται άµεσα από οποιαδήποτε επιλογή κατά
µήκος αυτής της "αλυσίδας". Έτσι το πρόβληµα τελικά έγκειται στην αναζητήση
ικανοποιητικών συνδυασµών για κάθε στάδιο, χωρίς να είναι εκ των προτέρων γνωστό αν
αυτοί αποτελούν και την βέλτιστη επιλογή.
2.5 Προηγούµενες σχετικές εργασίες
Η ανάλυση κραδασµών, όπως αναφέρθηκε είναι ήδη γνωστή από το τέλος της
δεκαετίας του 1960, αλλά χρησιµοποιείται στην παραγωγή κυρίως για λόγους προληπτικής
συντήρησης. Σε µεγάλες µονάδες παραγωγής που έχουν στην "καρδιά" του συστήµατος
παραγωγής κινητήρες, είναι σηµαντική η απρόσκοπτη λειτουργία τους και οι ελάχιστες
δυνατές απώλειες χρόνου συντήρησης. Η ανάλυση κραδασµών συνήθως εφαρµόζεται σε
κινητήρες µεγάλης ισχύος και όπου αυτό είναι εφικτό, οι µετρήσεις γίνονται όσο το
δυνατόν κοντά στην πηγή. Όσο µειώνεται η ισχύς του κινητήρα και όσο το
ηλεκτροµηχανικό σύστηµα γίνεται συνθετότερο και µε µεγαλύτερες αποσβέσεις των
κραδασµών, τόσο εγκαταλείπεται η σκέψη για χρήση της µεθοδολογίας. Ο Hammer
(1988) περιγράφει µια αναλυτική µεθοδολογία για διάγνωση βλαβών γεννητριών και
κινητήρων που περιλαµβάνει χρήση ελέγχων για αποδεκτά ή µη επίπεδα κραδασµών που
µπορούν να πραγµατοποιηθούν και στην γραµµή παραγωγής. Αναφέρεται όµως σε
µεγάλης ιπποδύναµης µηχανές και όχι σε σύνθετα ηλεκτροµηχανικά συστήµατα
χρησιµοποιώντας δεδοµένα που δεν είναι δυνατόν να ληφθούν χωρίς να διακοπεί η ροή
της παραγωγής.
- 20 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Έχουν αναφερθεί επίσης προσπάθειες διάγνωσης βλαβών κινητήρων οι οποίες
κάνουν χρήση της πληροφορίας που εµπεριέχεται στην τάση ή το ρεύµα λειτουργίας του
κινητήρα χωρίς φορτίο. Οι τυχόν βλάβες, µηχανικές ή ηλεκτρικές, αναµένεται να
δηµιουργήσουν µια διακύµανση σ' αυτά τα µετρούµενα χαρακτηριστικά και η εξέταση του
σήµατος (της τάσης ή του ρεύµατος του κινητήρα) αποτελεί την είσοδο ταξινοµητών οι
οποίοι θα κατατάξουν τον κινητήρα σε κατάσταση βλάβης ή εύρυθµης λειτουργίας. Τέτοια
µέθοδο χρησιµοποιούν οι Röpke and Filbert (1994), σε εφαρµογή εκτός γραµµής
παραγωγής αλλά µε µικρή επιτυχία στην εξακρίβωση βλαβών που οφείλονται σε µηχανικά
αίτια. Σήµα εισόδου από την τάση του κινητήρα χρησιµοποιούν και οι Burth et al. (1996)
για να εξετάσουν µηχανικές βλάβες που οφείλονται στον ρότορα ή στις εδράσεις του
κινητήρα. Χρησιµοποιούν ένα παραµετρικό µοντέλο του κινητήρα και προσοµοιώνουν µ'
αυτό τις πιθανές βλάβες. Κάθε νέος κινητήρας προς εξέταση συγκρίνεται µε τα
αποτελέσµατα του µοντέλου και ταξινοµείται κατάλληλα. Η εργασία αυτή αποτελεί
κλασική περίπτωση όπου απαιτείται γνώση από το αναλυτικό µοντέλο του συστήµατος
έτσι ώστε να ενσωµατώνει τις πιθανές βλάβες. Οι παραδοχές που απαιτούνται για την
εφαρµογή του µοντέλου µειώνουν τις πιθανότητες για εφαρµογή σε παρόµοια προβλήµατα
και την επέκτασή του σε συνθετότερα ηλεκτροµηχανικά συστήµατα.
Αντίστοιχα, η αναγνώριση προτύπου σε φάσµατα έχει να επιδείξει πολλές
εφαρµογές σε διάφορους επιστηµονικούς τοµείς, αλλά δεν έχει παρουσιαστεί εφαρµογή
στην γραµµή παραγωγής η οποία θα χρησιµοποιείται για διάγνωση της ποιότητας του
παραγοµένου προϊόντος µέσω ανάλυσης κραδασµών. Οι Meier et al. (1994), αναφέρουν
ότι είναι δυνατή η αντικατάσταση του έµπειρου εργάτη-ελεγκτή σε µια γραµµή
παραγωγής
κεραµικών
πλακιδίων
µε
χρήση
θεωρίας
αναγνώρισης
προτύπου,
υποκαθιστώντας τον µε ένα σύστηµα που θα χρησιµοποιεί το ακουστικό σήµα από µια µη
καταστροφική κρούση στην επιφάνεια του πλακιδίου, για να ταξινοµήσει το προϊόν
ανάλογα µε την ποιότητά του. Στην συγκεκριµένη προσέγγιση δεν δίνονται λεπτοµέρειες
για την εφαρµογή πέρα από τα σχετικά στάδια που περιλαµβάνουν µεταξύ άλλων την
κλασική µετατροπή του σήµατος στο πεδίο της συχνότητας,
την εξαγωγή των
διαχωριστικών χαρακτηριστικών και την απαραίτητη διαδικασία της κατηγοριοποίησης.
- 21 -
ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ∆ΙΑΓΝΩΣΗ ΒΛΑΒΩΝ ΜΕΣΩ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΟΥ
Στον έλεγχο της παραγωγής οι Tumer et al. (1996), παρουσίασαν ένα σύστηµα
διάγνωσης ελαττωµατικών ανταλλακτικών που προέρχονται από περιστροφικές µήτρες
(καλούπια). Ο έλεγχος πραγµατοποιείται µε βάση την ποιότητα της επιφάνειας του
καλουπιού και η ανάλυση του περιοδικού σήµατος των ανωµαλιών της επιφάνειας δίνουν
τα κατάλληλα χαρακτηριστικά για να προβούµε τόσο στην διάγνωση των καλουπιών όσο
και στον προσδιορισµό της προσδοκώµενης ποιότητας των προϊόντων. Στην εργασία όµως
αυτή παρουσιάζεται κυρίως η καταλληλότητα του µετασχηµατισµού Karhunen-Loeve για
την δηµιουργία χαρακτηριστικών διαχωρισµού, χωρίς να αναλύονται αποτελέσµατα από
πραγµατικά δεδοµένα ή να γίνεται προσοµοίωση της ταξινόµησης.
Σύµφωνα
µε
την
προσέγγιση
των
Zieba
et
al.
(1994),
µπορούµε
να
χρησιµοποιήσουµε σήµα κραδασµών που προέρχεται από σηµεία κοντά στις άκρες
κοπτικών εργαλείων σε εργαλειοµηχανές αριθµητικού ελέγχου, για να παρακολουθήσουµε
την κατάσταση της µηχανής και την ποιότητα του παραγοµένου προϊόντος. Η ανάλυση του
σήµατος στο πεδίο της συχνότητας µε την χρήση του αλγορίθµου GLR (γενικευµένος
λόγος πιθανοφάνειας) µπορεί να ανιχνεύσει απότοµες µεταβολές και συνεπώς να
αποφανθεί για την κατάσταση του ελεγχοµένου αντικειµένου στην µεταβολή του χρόνου.
Η διάκριση του προϊόντος στην συγκεκριµένη εφαρµογή γίνεται σε τρεις κλάσεις
(καλό/κακό/αταξινόµητο).
Συνοψίζοντας, πρέπει να τονιστεί ότι η ανάγκη για αυτοµατοποίηση της διάγνωσης
στην γραµµή παραγωγής υπαγορεύει την αντικατάσταση-υποβοήθηση του ανθρώπινου
παράγοντα µε µεθόδους όπως η αναγνώριση προτύπου. Μέχρι στιγµής, δεν έχει υποπέσει
στην αντίληψή µας εφαρµογή, η οποία να κάνει χρήση της θεωρίας ανάλυσης κραδασµών,
και σε συνδυασµό µε την αναγνώριση προτύπου να µπορεί να ταξινοµήσει ικανοποιητικά
σύνθετα περιστρεφόµενα ηλεκτροµηχανικά συστήµατα, ανάλογα µε την κατάστασή τους
στην παραγωγή και συγκεκριµένα στο στάδιο της συναρµολόγησης.
- 22 -
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
3
∆ιατύπωση
του
προβλήµατος
και
περιγραφή των απαιτήσεων της διάγνωσης
3.1 Εισαγωγή
Οι οικιακές συσκευές (πλυντήρια) που εξετάζονται αποτελούν µια ενδιαφέρουσα
περίπτωση για την ανάπτυξη διαγνωστικών συστηµάτων. Παρά το ότι αυτά τα προϊόντα
χαρακτηρίζονται ως σχετικά χαµηλού επιπέδου τεχνολογίας και χαµηλού κόστους
παραγωγής, ο µεγάλος αριθµός παραγοµένων κοµµατιών (4000-5000 προϊόντα/ηµέρα σε
ένα µεσαίας παραγωγικότητας εργοστάσιο) και
κατασκευαστών που
ο σχετικά µεγάλος αριθµός των
ανταγωνίζονται σκληρά για ένα υψηλότερο µερίδιο αγοράς,
δικαιολογούν πλήρως υψηλές επενδύσεις στην ποιότητα του τελικού προϊόντος [MEDEA
(1996)].
Οικιακές συσκευές όπως τα πλυντήρια αποτελούνται από πολλά ηλεκτροµηχανικά
υποσυστήµατα και περιλαµβάνουν κινούµενα µέρη που είναι επιρρεπή σε βλάβες ή
γενικότερα είναι εύκολο να εκτραπούν από µια εύρυθµη λειτουργία. Οι αποκλίσεις αυτές,
είτε είναι προοίµιο µιας τελικής και ολοκληρωτικής βλάβης, είτε προκαλούν δυσφορία
λόγω θορύβου και δονήσεων. Τα αποδεκτά όρια δονήσεων σε ηλεκτροκινητήρες που
πρωτοβγαίνουν από την γραµµή παραγωγής, συνήθως προσδιορίζονται µε εµπειρικό
τρόπο από τον χειριστή [Hamer (1988)] µε αποτέλεσµα να µην υπάρχει προκαθορισµένος
τρόπος διαχωρισµού αποδεκτών και µη αποδεκτών µονάδων. Συνήθως, ο έλεγχος του
παραγοµένου προϊόντος στην γραµµή παραγωγής εξαντλείται στο ηλεκτρικό µέρος των
συσκευών. ∆εν είθισται στην βιοµηχανική παραγωγή να πραγµατοποιείται έλεγχος και
23
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
διάγνωση βλαβών στο µηχανικό µέρος παρά το ότι συχνά αναφέρονται τέτοιες βλάβες
στο τελικό προϊόν [Paone and Scalise (1997), Fogliardi (1997)].
3.2 Έλεγχος ποιότητας της παραγωγής πλυντηρίων στην Ευρωπαϊκή
Ένωση
Έρευνα αγοράς που παρουσιάστηκε στα πλαίσια του προγράµµατος MEDEA
(Standards, Measurements, and Testing) για τον ποιοτικό έλεγχο λευκών οικιακών
συσκευών (πλυντήρια πιάτων και ρούχων) [MEDEA 1996], ανέδειξε την ανάγκη που
υπάρχει στους περισσότερους σηµαντικούς ευρωπαίους κατασκευαστές, για µια
αυτοµατοποιηµένη διαδικασία ελέγχου που
θα επιτρέψει την αποµόνωση των
ελαττωµατικών συσκευών στο στάδιο της παραγωγής και θα µειώσει το υψηλό ποσοστό
βλαβών που εµφανίζονται στην πρώτη περίοδο λειτουργίας τους ("παιδική θνησιµότητα").
Η ευρωπαϊκή βιοµηχανία µε παραγωγή της τάξης των 14 106 µονάδων το χρόνο
ενδιαφέρεται άµεσα για την µείωση του ποσοστού των βλαβών που παρουσιάζεται κατά
τον πρώτο χρόνο λειτουργίας και ανέρχεται σε 24%. Απ' αυτές τις βλάβες το 20% αφορά
µηχανικές βλάβες συναρµολόγησης όπως αυτές που αποτελούν το αντικείµενο διάγνωσης
αυτής της εργασίας. Θεωρώντας το επιπλέον κόστος της επισκευής (αφού η συσκευή
εγκαταλείψει το στάδιο παραγωγής) κατά την περίοδο της εγγύησης
/συσκευή,
περίπου 30
προκύπτει µια ετήσια εξοικονόµηση της τάξης των 15 106 /έτος
αν
επιτευχθεί διάγνωση σε επίπεδο 95%.
3.3 Κατηγορίες βλαβών που απασχολούν τους κατασκευαστές
Οι µηχανικές βλάβες που απασχολούν ιδιαίτερα τους κατασκευαστές είναι αυτές που
αναφέρονται στο στάδιο της συναρµολόγησης και όχι κατασκευαστικές αστοχίες στα
επιµέρους εξαρτήµατα, αφού αυτές θα αποµονωθούν αργά ή γρήγορα και θα αποµονωθεί
το αίτιο που τις προκάλεσε. Οι βλάβες που παρουσιάζονται στο στάδιο της
συναρµολόγησης είναι ιδιαίτερα δύσκολο να εντοπιστούν και οφείλονται κατά κύριο λόγο
24
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
στον ανθρώπινο παράγοντα. Μεταξύ άλλων, η έρευνα αυτή [MEDEA (1996)] προσδιόρισε
και κατέταξε τα συχνότερα και σηµαντικότερα προβλήµατα συναρµολόγησης σε
κατηγορίες ως ακολούθως:
Ελλιπής ή χαλαρή σύνδεση συγκεκριµένων αρµολογήσεων εξαιτίας απουσίας
κατάλληλου κοχλία ή εξαιτίας κακής ροπής σύσφιξης (missing or loose screws and other
tight coupling problems).
Κακή απορρόφηση κραδασµών λόγω κακής συναρµολόγησης του συστήµατος
αντίβαρων ή λάθους κατά την συναρµολόγηση των τριβέων (shock absorbers’ and
bearings’ wrong assembly).
Κακή ευθυγράµµιση του τυµπάνου ή/και του γραναζιού µετάδοσης κίνησης
(misalignment of drum and motor pulley).
Χαλαρή τάση στον ιµάντα κίνησης (wrong belt tension).
Χαλαρά κολάρα στήριξης ηλεκτροκινητήρα (electric motor clamping screws).
Λάθος τύπος ελατηρίων κατά την συναρµολόγηση (use of different type of springs ).
Απελευθέρωση αντίβαρων (releasing of the shock absorber).
3.4 Σχεδιαστικές απαιτήσεις του βιοµηχανικού κατασκευαστή
Ο στόχος του βιοµηχανικού κατασκευαστή είναι να µειώσει στο ελάχιστο τα
προαναφερθέντα προβλήµατα. Οι απαιτήσεις του για το διαγνωστικό σύστηµα
υπαγορεύουν
παράλληλα
κάποιους
περιορισµούς-απαιτήσεις
που
αφορούν
την
λειτουργικότητα και την βιωσιµότητά του:
Ο χρόνος ελέγχου στην γραµµή παραγωγής δεν πρέπει να υπερβαίνει τα δύο λεπτά.
25
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
Για να είναι ελκυστική η επένδυση στην βιοµηχανία κάτω από τις παρούσες
συνθήκες της αγοράς, το κόστος του διαγνωστικού συστήµατος θα πρέπει να περιοριστεί
κάτω από τα 100000 .
Το σύστηµα θα πρέπει να είναι ευέλικτο όσον αφορά τις αλλαγές στην γραµµή
παραγωγής. Μετά από κατάλληλη περίοδο εκπαίδευσης θα πρέπει να είναι ικανό προς
διάγνωση.
Εάν είναι δυνατόν, θα ήταν ικανοποιητικό ένα επίπεδο διάγνωσης άνω του 90%,
αφού ένα επίπεδο έως 80% είναι υλοποιήσιµο µε άλλες απλές µεθόδους χαµηλού κόστους
οι οποίες όµως είναι µη αυτοµατοποιηµένες και χρονοβόρες καθώς απαιτούν την
αποσυναρµολόγηση του προϊόντος.
3.5 Περιγραφή της διαδικασίας πρόσκτησης δεδοµένων από τους
κραδασµούς
Στο συγκεκριµένο πρόβληµα προτιµήθηκε η χρήση laser ιντερφεροµετρικών
αισθητήρων για την πρόσκτηση των δεδοµένων. Η ταχύτητα µέτρησης, η µη ευαισθησία
στον βιοµηχανικό θόρυβο και το γεγονός ότι η µέτρηση δεν επηρεάζεται από την επαφή
του αισθητήρα, είναι οι βασικοί λόγοι της επιλογής αυτής. Πάντως δεν έχει αναφερθεί
µέχρι τώρα στην βιβλιογραφία η χρήση τέτοιων αισθητήρων για µέτρηση κραδασµών και
ιδιαίτερα σε γραµµή παραγωγής, γεγονός που εντάσσει αυτήν την εφαρµογή τους ως
καινοτοµική. Η αρχή λειτουργίας και οι ιδιαιτερότητες λόγω της χρήσης του
συγκεκριµένου τύπου αισθητήρων αναφέρονται αναλυτικά στο παράρτηµα 7.1. Στις υπό
έλεγχο συσκευές έχουν τοποθετηθεί ανακλαστήρες σε προκαθορισµένα σηµεία. Οι θέσεις
των σηµείων αυτών έχουν επιλεγθεί εµπειρικά και φαίνονται αναλυτικά στο σχήµα 3.1.
Πρέπει να λεχθεί ότι δεν υπάρχει θεωρητικό υπόβαθρο το οποίο να στηρίζει αυτή την
επιλογή όσον αφορά τις θέσεις και τον αριθµό των σηµείων. Στην
µέχρι τώρα
βιβλιογραφία [Brüel & Kjær (1980), Αδαµόπουλος (1988)] αναφέρονται κριτήρια για τα
σηµεία επιλογής τοποθέτησης αισθητήρων επαφής στην διάγνωση βλαβών κινητήρων
µέσω κραδασµών. Σύµφωνα µε αυτά, η βασική αρχή στη τοποθέτηση των
26
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
επιταχυνσιοµέτρων είναι
ότι ο κύριος άξονας ευαισθησίας του αισθητήρα πρέπει να
συµπίπτει µε την διεύθυνση µέτρησης που παρουσιάζει την µέγιστη τιµή στην περιοχή που
µας ενδιαφέρει. Το σηµείο επαφής καθορίζεται κατά την αντίληψη του έµπειρου
σχεδιαστή του συστήµατος, µε γνώµονα την καλύτερη θέση που θα αποδώσει κραδασµό, ο
οποίος θα οφείλεται από συγκεκριµένη πηγή. Για παράδειγµα για ανίχνευση βλάβης στους
τριβείς, το αισθητήριο πρέπει να τοποθετηθεί κοντά στα έδρανα των τριβέων, ώστε να
αποφύγουµε όσο είναι δυνατόν αποσβέσεις του σήµατος των κραδασµών.
Στην περίπτωση των µετρήσεων αυτής της εργασίας, η επιλογή των συγκεκριµένων
σηµείων έγινε µε γνώµονα τα ακόλουθα κριτήρια:
Να καλυφθεί γεωµετρικά όσο το δυνατόν περισσότερη επιφάνεια, η οποία όµως
ταυτόχρονα θα πρέπει να είναι ελεύθερη προς µέτρηση. Τα σηµεία θα πρέπει επίσης να
είναι τοποθετηµένα κατά τέτοιο τρόπο που να δίνουν µετρήσεις και προς τους τρεις άξονες
στο χώρο.
Να ληφθούν υπόψη ιδιαιτερότητες κατασκευής, όπως περιοχές µε διαφορετική
κατανοµή βάρους (για παράδειγµα η περιοχή γύρω από την πόρτα φόρτωσης των ρούχων).
Να αποφευχθούν όσο είναι δυνατόν σηµεία δυσπρόσιτα στους οπτικούς αισθητήρες
ή σηµεία που µπορεί λόγω θέσης να δώσουν εσφαλµένες ενδείξεις.
Να µετρηθούν σηµεία που προβλέπεται να έχουν υψηλές τιµές ταλάντωσης κατά την
λειτουργία.
Αποτελεί πάντως αντικείµενο περαιτέρω έρευνας ο προσδιορισµός των βέλτιστων
σηµείων µετρήσεων. ∆υστυχώς τα σηµεία αποτελούν "ελεύθερη µεταβλητή" στο
σχεδιασµό του συστήµατος µε την έννοια του ότι δεν είναι γνωστός ούτε ο βέλτιστος
αριθµός ούτε η βέλτιστη θέση. Έτσι αναγκαστικά µε βάση τα προαναφερθέντα κριτήρια
θα επιλεχθούν οι θέσεις και µε βάση την επιτυχία διάγνωσης θα κρατήσουµε τα σηµεία
µέτρησης που δίνουν καλύτερη πληροφορία ταξινόµησης. Οι πλεονάζοντες αισθητήρες
(redundant sensors) αν και χρησιµοποιούνται συχνά για την επαλήθευση των µετρήσεων
[Willsky (1976), Frank (1990)],
στην παρούσα τουλάχιστον φάση θα πρέπει να
αποφευχθούν διότι αυξάνουν το κόστος.
27
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
Με την βοήθεια αισθητήρων (ιντερφεροµέτρων laser) γίνονται ακριβείς µετρήσεις
των µετατοπίσεων των δονήσεων όταν τίθεται σε λειτουργία η προς έλεγχο συσκευή. Ο
κινητήρας του πλυντηρίου λειτουργεί για 2 περίπου λεπτά στη µέγιστη ταχύτητα
περιστροφής (πρόγραµµα φυγοκέντρησης).Οι µετρήσεις αφορούν το πλάτος και την
ταχύτητα των µετατοπίσεων καθώς και την γωνιακή ταχύτητα του κάδου. Οι χρονοσειρές
αυτές έχουν µετρηθεί µε δειγµατοληψία ανά 20-22 sec (συχνότητα δειγµατοληψίας=2000
Hz) και αφορούν τόσο την στάσιµη (steady state) όσο και την µεταβατική κατάσταση
(transient state) λειτουργίας της συσκευής.
Ως είσοδος θεωρείται µόνο η χρονοσειρά της ταχύτητας των µετατοπίσεων διότι το
αισθητήριο λαµβάνει µόνο αυτή την πληροφορία, ενώ το πλάτος της ταλάντωσης
προκύπτει από την ολοκλήρωση των τιµών της χρονοσειράς της ταχύτητας.
Σχήµα 3.1 Σηµεία µέτρησης κραδασµών στην επιφάνεια και στον κάδο του πλυντηρίου
Θεωρούµε ότι υπάρχουν οι ακόλουθες κατηγορίες συσκευών κατά το στάδιο αυτό:
Συσκευές τύπου z χωρίς καµία βλάβη.
Συσκευές τύπου b µε χαλαρή ή ελλιπή σύσφιγξη των κοχλιών του κινητήρα.
Συσκευές τύπου p µε χαλαρά ή κακορυθµισµένα αντίβαρα.
Συσκευές τύπου g µε παραµορφωµένο ή µετατοπισµένο το γρανάζι µετάδοσης
κίνησης.
28
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
Συσκευές τύπου m µε χρήση ελατηρίων εσφαλµένου τύπου.
Συσκευές τύπου h µε απελευθερωµένο πλήρως το σύστηµα των αντίβαρων.
Η χρονοσειρά της ταχύτητας χωρίζεται σε τέσσερις περιοχές µε βάση τις στροφές
του κινητήρα:
Περιοχή στάσιµης κατάστασης κινητήρα (steady state part).
Περιοχή ανόδου στροφών κινητήρα (rising transient part).
Περιοχή πτώσης στροφών κινητήρα (falling transient part).
Περιοχή χαµηλών στροφών κινητήρα (idle speed part).
Από αυτές τις περιοχές οι περιοχές 3 και 4 δεν θα εξεταστούν στην παρούσα
εργασία. Στην περιοχή 3, η τιµή της γωνιακής ταχύτητας πέφτει γρήγορα στην µηδενική
τιµή και στην περιοχή 4 οι τιµές της γωνιακής ταχύτητας είναι µικρές. Επίσης η περιοχή 2
δεν τηρεί την προϋπόθεση που απαιτείται στον µετασχηµατισµό Fourier για στασιµότητα
(stationarity) µε συνέπεια επίσης να µην εξετάζεται αφού θα είναι προτιµότερη µια άλλη
µετατροπή στο πεδίο της συχνότητας όπως τα wavelets. Έτσι, στην εργασία αυτή η
προσοχή θα εστιαστεί στην περιοχή 1 της στάσιµης κατάστασης, λόγω απλότητας του
σήµατος χωρίς όµως να αποκλείεται να διαφεύγουν πολύτιµες πληροφορίες από τις άλλες
περιοχές.
3.6 ∆οµή δεδοµένων
Επειδή δεν έχει ξαναχρησιµοποιηθεί σε γραµµή παραγωγής σύστηµα το οποίο να
κάνει χρήση ιντερφεροµετρικών αισθητήρων, χρειάστηκε να αναπτυχθεί ένα πρωτότυπο
πειραµατικό σύστηµα. Αυτό το σύστηµα έπρεπε να βελτιωθεί παράλληλα µε την ανάπτυξη
του λογισµικού του διαγνωστικού συστήµατος, όσον αφορά τον χρόνο πρόσκτησης των
δεδοµένων και την ευκολία επανάληψης των µετρήσεων. Αυτό είχε σαν αποτέλεσµα τον
µικρό αριθµό δειγµάτων από τις κατηγορίες και την αδυναµία συχνών επαναλήψεων της
δειγµατοληψίας. Κατά την φάση του σχεδιασµού και της αποτίµησης του διαγνωστικού
29
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
συστήµατος λήφθηκαν δεδοµένα σε εργαστηριακό περιβάλλον από πλυντήρια στα οποία
προκαλούνταν οι προαναφερθείσες βλάβες συναρµολόγησης. Η διαδικασία αυτή για την
συλλογή των δεδοµένων έγινε εκτός γραµµής παραγωγής (off-line), αλλά µετά από την
πρόσκτηση των δεδοµένων υπάρχει η ευχέρεια προσοµοίωσης της διαδικασίας σαν να
ήταν στη γραµµή παραγωγής έτσι ώστε να είναι δυνατές οι αντίστοιχες υποθέσεις
εργασίας.
Αναγκαστικά, επειδή κατά την φάση του σχεδιασµού του διαγνωστικού συστήµατος
δεν είναι γνωστά τα απαραίτητα σηµεία δειγµατοληψίας και το πόσος χρόνος µέτρησης
θεωρείται ικανοποιητικός, ο όγκος των δεδοµένων είναι µεγάλος σε σχέση µε την
πληροφορία που εµπεριέχουν. Αναµένεται στο τελικό στάδιο, κατά το οποίο θα έχει
αποφασιστεί το ποια είναι η σηµαντική πληροφορία, να έχουµε αισθητά µειωµένο όγκο
δεδοµένων στην είσοδο. Στη περίοδο της εκµάθησης του διαγνωστικού συστήµατος, ο
υπολογιστικός φόρτος και ο όγκος των δεδοµένων θα είναι σαφώς υψηλότερος από ότι στη
λειτουργία στην γραµµή παραγωγής (on-line), αλλά αυτό δεν απασχολεί ιδιαίτερα µια και
ο χρόνος εκµάθησης δεν είναι κρίσιµος κατά την φάση λειτουργίας του συστήµατος και
µπορεί να πραγµατοποιηθεί εκτός γραµµής παραγωγής (off-line).
Για κάθε σηµείο µέτρησης όπως αυτά φαίνονται στο σχήµα 3.1 και για κάθε τύπο
συσκευής όπως περιγράφτηκαν προηγούµενα ελήφθησαν χρονοσειρές κραδασµών
διάρκειας 20-22 sec µε συχνότητα δειγµατοληψίας 2KHz που αφορούσαν τις υπό εξέταση
περιοχές στροφών κινητήρα. Στο σχήµα 3.2 παρουσιάζεται µια τέτοια χαρακτηριστική
χρονοσειρά για τρία σηµεία µέτρησης µε την αντίστοιχη ένδειξη των στροφών του
κινητήρα. Η µέτρηση των στροφών του κινητήρα γίνεται µε ένα απλό φωτοευαίσθητο
αισθητήρα που µπορεί να ανιχνεύσει µε ευκολία την περιστροφή του κάδου από την οποία
προκύπτει η ταχύτητα περιστροφής του κινητήρα.
Τα δεδοµένα αυτά ελήφθησαν µέσω των αισθητήρων και αποθηκεύτηκαν για
επεξεργασία σε αρχεία µε ονοµασία κωδικοποιηµένη σύµφωνα µε την µέτρηση. Έτσι κάθε
µέτρηση αφορούσε:
30
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
Σχήµα 3.2 ∆είγµα χρονοσειράς κραδασµού µηχανής τύπου z στα σηµεία 6,8,9 µε
την αντίστοιχη ένδειξη των στροφών του κινητήρα.
1.Ένα συγκεκριµένο τύπο µηχανής (κατάσταση οµαλής λειτουργίας ή καταστάσεις
βλαβών): z, b, g, h, m, p.
2. Ένα συγκεκριµένο σηµείο: 01, 02, … ,12
Οι µετρήσεις επαναλαµβάνονταν και για την ίδια µηχανή
για να ελεγχθεί
η
επαναληψιµότητα του πειράµατος. Συνολικά, ελήφθησαν περίπου 3700 µετρήσεις όπως
φαίνεται αναλυτικά στον πίνακα 7.3 του παραρτήµατος. Στην πορεία της έρευνας κάποια
31
∆ΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΑΠΑΙΤΗΣΕΩΝ ΤΗΣ ∆ΙΑΓΝΩΣΗΣ
σηµεία µέτρησης καταργήθηκαν λόγω δυσκολίας πρόσβασης αλλά οι υπάρχουσες
µετρήσεις στο βαθµό που µπορούσαν να δώσουν πληροφορία αξιολογήθηκαν κατάλληλα.
Ενδεικτικά, ο συνολικός όγκος των δεδοµένων των µετρήσεων για την περιοχή
κατάστασης στην φάση του σχεδιασµού του συστήµατος ήταν της τάξης των 120ΜΒ (σε
ASCII µορφή) και οι δυνατοί συνδυασµοί σηµείων – βλαβών καθώς και οι διαφορετικές
στρατηγικές σχεδιασµού του διαγνωστικού συστήµατος καθιστούσαν το πρόβληµα
εξαιρετικά πολύπλοκο.
Σχήµα 3.3 ∆ιάταξη συστήµατος πρόσκτησης δεδοµένων κατά την διάρκεια των µετρήσεων.
Η διάταξη του συστήµατος µέσω της οποίας πραγµατοποιήθηκαν οι µετρήσεις
φαίνεται στο σχήµα 3.3. Σ' αυτήν φαίνεται ότι για κάθε σηµείο µέτρησης θα πρέπει να
επαναληφθεί η διαδικασία µέτρησης καθώς υπάρχει ένα µόνο ιντερφερόµετρο laser. Στο
τελικό διαγνωστικό σύστηµα για κάθε απαιτούµενο σηµείο µέτρησης θα αντιστοιχεί και
ένα αισθητήριο αλλά όλα θα καταλήγουν σε ένα ελεγκτή.
32
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
4 Θεωρητικό υπόβαθρο
4.1 Πρόσκτηση δεδοµένων και προεπεξεργασία του σήµατος εισόδου
Πριν ξεκινήσει οποιαδήποτε διαδικασία µετατροπής ενός σήµατος εισόδου για
εξαγωγή χαρακτηριστικών ή κατηγοριοποίηση του, είθισται να υπόκειται σε µια
διαδικασία προετοιµασίας που καλείται προεπεξεργασία. Η γνώση για την φύση του
σήµατος εισόδου αποτελεί και τον βασικό οδηγό για το ποια ακριβώς θα είναι αυτή η
διαδικασία. Η ποιότητα του σήµατος εισόδου είναι θεµελιώδους σηµασίας καθώς είναι
γνωστό ότι ισχύει ο κανόνας "κακή ποιότητα εισόδου-κακή ποιότητα εξόδου" όπως και σε
κάθε άλλη περίπτωση πληροφοριακού συστήµατος. Ο έλεγχος της ποιότητας εισόδου που
αφορά τους αισθητήρες και την τυχόν ύπαρξη θορύβου στο σήµα, παρά το ότι είναι
υψηλής σηµασίας, ξεφεύγει από τα όρια αυτής της εργασίας και αποτελεί αντικείµενο
περαιτέρω έρευνας όπως θα αναφερθεί σε επόµενη ενότητα. Παρά ταύτα στην αναλυτική
περιγραφή του συστήµατος των αισθητήρων στο παράρτηµα 7.1 επισηµαίνονται
σφάλµατα µέτρησης που µπορεί να επηρεάσουν το αποτέλεσµα.
Στην περίπτωση της συγκεκριµένης εφαρµογής της εργασίας εξετάζεται ένα
περιοδικό σήµα του οποίου η πηγή των ταλαντώσεων δεν είναι σταθερή σε όλη την
διάρκεια της δειγµατοληψίας. Φυσικό επακόλουθο είναι και τα µετρούµενα σήµατα, τα
οποία είναι κραδασµοί οφειλόµενοι στην πηγή, να ενσωµατώνουν αυτή την µεταβολή της
περιοδικότητας. Έτσι µε βάση τον διαχωρισµό που έγινε στην ενότητα 0 σε τέσσερις
περιοχές ανάλογα µε τις στροφές του κινητήρα θα πρέπει στην προεπεξεργασία να βρεθεί
ένας τρόπος ώστε το σήµα εξόδου να διαχωριστεί στις τέσσερις αυτές περιοχές. Αυτό,
παρότι οι περιοχές είναι ευδιάκριτες (σχήµα 3.2), θα πρέπει να γίνει µε αυτοµατοποιηµένο
τρόπο κάνοντας χρήση είτε ορίων, µέσα στα οποία θα θεωρείται
33
ότι ο κινητήρας
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
βρίσκεται στην r (r=1,2,3,4) περιοχή στροφών, είτε µέσω ελέγχου υποθέσεων όπου θα
ελέγχονται κατάλληλες µεταβλητές, µέσω των οποίων θα είναι δυνατόν να αποφανθεί
κανείς για το αν ο κινητήρας βρίσκεται σε σταθερές ή µεταβλητές στροφές.
4.2 Μετατροπή στο πεδίο της συχνότητας
Ο Shumway (1982), στην εργασία του που αφορά την εξαγωγή χαρακτηριστικών σε
χρονοσειρές, επεσήµανε τα πλεονεκτήµατα που έχει η εξέταση των σηµάτων προς
διαχωρισµό, όταν πραγµατοποιείται στο πεδίο της συχνότητας και όχι στο πεδίο του
χρόνου. Σε παρόµοιες εφαρµογές µε αυτή που πραγµατεύεται αυτή η εργασία, η
µετατροπή στον χώρο της συχνότητας είναι µία από τις πιο συνηθισµένες µεθόδους που θα
απαλλάξει τα µετέπειτα στάδια της κατηγοριοποίησης από τον µεγάλο όγκο των
δεδοµένων και θα αποµονώσει ευκολότερα τα χαρακτηριστικά. ∆εν θα πρέπει να
αγνοείται, ότι η πηγή των κραδασµών στο υπό εξέταση σύστηµα είναι ένας κινητήρας και
συνεπώς εξετάζουµε ένα σύνθετο περιστρεφόµενο σύστηµα του οποίου οι µετρήσεις του
θα έχουν σαν κύριο χαρακτηριστικό την περιοδικότητα. Αναµένεται λοιπόν, ότι αν
υπάρχουν κάποια ιδιαίτερα χαρακτηριστικά που προσδιορίζουν τις κατηγορίες της
κατάστασης, θα έχουν και αυτά περιοδικό χαρακτήρα.
Κάνοντας χρήση µεθόδων που µετατρέπουν το σήµα από το πεδίο του χρόνου στο
πεδίο της συχνότητας, έχουµε επιπλέον το πλεονέκτηµα της σύγκρισης οµοειδών
χαρακτηριστικών (π.χ. πλάτη συχνοτήτων) και ευκολότερης ερµηνείας
της φυσικής
σηµασίας αυτών των χαρακτηριστικών. Για παράδειγµα µια ένδειξη στο πεδίο των
συχνοτήτων στα 50Hz µπορεί να υποδηλώνει επίδραση από την συχνότητα του δικτύου
παροχής ρεύµατος (για την Ελλάδα).
4.2.1 ∆ιακριτός µετασχηµατισµός Fourier (DFT)
Ο διακριτός µετασχηµατισµός Fourier, που θα αναφέρεται στην συνέχεια ως DFT
(Discrete Fourier Transform) για συντοµία, είναι ένας µετασχηµατισµός από το πεδίο του
34
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
χρόνου στο πεδίο της συχνότητας που χρησιµοποιείται όταν η δειγµατοληψία του
σήµατος πραγµατοποιείται ανά τακτά χρονικά διαστήµατα. Αποτελεί προσέγγιση του
κλασικού συνεχούς µετασχηµατισµού Fourier που βασίστηκε στην εργασία του Γάλλου
µαθηµατικού J. B. Fourier το 1807 για την µετάδοση θερµότητας (το άρθρο του αρχικά
απορρίφθηκε από την Ακαδηµία των Επιστηµών στο Παρίσι λόγω µη αυστηρής
µαθηµατικής τεκµηρίωσης!). Η βασική ιδέα του µετασχηµατισµού είναι ότι πλήθος
χρονοσειρών που εµφανίζονται κατά κόρον σε φυσικά συστήµατα, µπορούν να
εκφρασθούν σαν άπειρη σειρά ηµιτονοειδών όρων.
Η χρησιµοποίηση ηλεκτρονικών υπολογιστών στην επεξεργασία σήµατος επιβάλλει
την χρήση της διακριτής µορφής του µετασχηµατισµού Fourier αφού οι Η/Υ δεν µπορούν
να επεξεργαστούν αναλογικό σήµα παρά µόνο αν αυτό µετατραπεί σε ψηφιακό µέσω
κατάλληλης
διάταξης
(A/D
converter).
Έτσι
ανά
τακτά
χρονικά
διαστήµατα
πραγµατοποιείται δειγµατοληψία από το αναλογικό σήµα. Το χρονικό διάστηµα Ts µεταξύ
δύο δειγµατοληψιών λέγεται περίοδος δειγµατοληψίας. Αντίστοιχα χρησιµοποιείται ο όρος
συχνότητα δειγµατοληψίας
fs=1/Ts (µετριέται σε Hz). Αν το υπό εξέταση σήµα
µεταβάλλεται συχνά στην µονάδα του χρόνου, αυτό µεταφράζεται σε παρουσία
συνιστωσών υψηλών συχνoτήτων στο πεδίο της συχνότητας. Συνεπώς, όσο υψηλότερες
συχνότητες θέλουµε να εξετάσουµε, τόσο µικρότερη περίοδο δειγµατοληψίας θα πρέπει να
εφαρµόσουµε. Αν η συχνότητα δειγµατοληψίας δεν είναι µεγάλη τότε εµφανίζεται το
φαινόµενο παραπλάνησης (aliasing), όπου συνιστώσες υψηλών συχνοτήτων εµφανίζονται
λανθασµένα σαν συνιστώσες χαµηλών συχνοτήτων. Το θεώρηµα του Nyquist αναφέρει ότι
για να ξεπεραστεί αυτό το πρόβληµα θα πρέπει η συχνότητα δειγµατοληψίας να είναι
µεγαλύτερη ή ίση από το διπλάσιο της µεγαλύτερης συχνότητας που υπάρχει στο σήµα
[Smith and Smith (1995)].
Η διακριτή µορφή του µετασχηµατισµού Fourier DFT που επιτρέπει να
υπολογίσουµε το k στοιχείο του µετασχηµατισµένου σήµατος στο πεδίο των συχνοτήτων
X ( f ) , µιας χρονοσειράς x (t ) µε n στοιχεία είναι:
n −1
X (k ) = ∑ x( t )e
⎛ 2π ⎞
− ikn ⎜
⎟
⎝ n ⎠
(4.1)
t =0
35
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Ο υπολογισµός µπορεί να γίνει µέσω µιας οικογένειας αλγορίθµων η οποία
ονοµάζεται Fast Fourier Transform (FFT) και επιτρέπει την µείωση των πράξεων για τον
υπολογισµό της (4.1) και συνεπώς την εξοικονόµηση πολύτιµου υπολογιστικού χρόνου.
Παρά το ότι είναι δυνατόν να κατασκευαστούν αλγόριθµοι
FFT που να δουλεύουν
ικανοποιητικά για οποιοδήποτε πλήθος σηµείων, η µέγιστη αποτελεσµατικότητα
επιτυγχάνεται για πλήθος n που αποτελεί δύναµη του 2. Έτσι, συνηθίζεται να
συµπληρώνεται το σήµα µε µια ακολουθία µηδενικών όταν δεν υπάρχει µεγάλο δείγµα, ή
στην αντίθετη περίπτωση να περικόπτεται ώστε το n να πάρει την επιθυµητή τιµή.
Το γράφηµα του µέτρου της (4.1) ως προς την αντίστοιχη συχνότητα καλείται
φάσµα συχνοτήτων ή φάσµα και δίνει την πληροφορία για το ποιες συχνότητες είναι
παρούσες στο αρχικό σήµα x (t ) . Έτσι, οι κορυφές του γραφήµατος (peaks) δείχνουν τις
σηµαντικές συχνότητες υπό την προϋπόθεση ότι η συχνότητα δειγµατοληψίας είναι
σύµφωνη µε το θεώρηµα του Nyquist. Συνηθίζεται να εξετάζονται ορισµένες µόνο
περιοχές συχνοτήτων ή/και συχνότητες που εµφανίζουν στο φάσµα ορισµένα µόνο πλάτη.
Η επεξεργασία αυτή που ονοµάζεται φιλτράρισµα (filtering) µπορεί να γίνει είτε στην
πηγή του σήµατος µε κατάλληλα φίλτρα είτε εκ των υστέρων στην επεξεργασία του
φάσµατος.
Ολοκληρώνοντας το φάσµα παίρνουµε το αντίστοιχο ενεργειακό φάσµα το οποίο
δίνει πληροφορία για το ενεργειακό περιεχόµενο µιας περιοχής συχνοτήτων. Η
πληροφορία αυτή µπορεί να είναι σηµαντική στην περίπτωση της διάγνωσης βλαβών διότι
υψηλή ενέργεια σε µια περιοχή συχνοτήτων µπορεί να µεταφράζεται σε ύπαρξη βλάβης.
4.2.2 Κυµατίδια (Wavelets)
Μια πιθανή προσέγγιση αντί του µετασχηµατισµού Fourier θα ήταν η χρήση των
κυµατιδίων (wavelets) των οποίων η πρώτη βασική εφαρµοσµένη χρήση σε ανάλυση
χρονοσειρών σεισµικών δεδοµένων έγινε από τους Goupilliaud, Grossmann and Morlet
36
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
(1984). Ένα µειονέκτηµα της ανάλυσης Fourier που αναφέρεται στην βιβλιογραφία
[Newland 1993] σε σχέση µε τα κυµατίδια, είναι η αδυναµία προσδιορισµού στο πεδίο
του χρόνου των σηµείων που αντιστοιχούν σε συνιστώσες συχνοτήτων οι οποίες
εµφανίζονται ως σηµαντικές στο πεδίο της συχνότητας. Έτσι εάν σε κάποια στιγµή στην
χρονοσειρά του σήµατος xt(t) υπάρχει µια τοπική περιοδικότητα, αυτή θα συνεισφέρει
στο κατά Fourier µετασχηµατισµένο σήµα αλλά δεν θα είναι δυνατός ο εντοπισµός της
χρονικής στιγµής που έλαβε χώρα (στον x-άξονα του χρόνου).
Στην συγκεκριµένη εφαρµογή δεν αποδεικνύεται ότι το προς επεξεργασία σήµα,
στην περιοχή της στάσιµης κατάστασης έχει και την ιδιότητα να διατηρεί σταθερές τις
εµπεριεχόµενες συχνότητες και συνεπώς να έχει την ιδιότητα της στασιµότητας.
Μπορούµε όµως να υποθέσουµε από την φύση των δεδοµένων ότι η προσέγγιση µέσω
µετασχηµατισµού Fourier ενδείκνυται περισσότερο γι' αυτή την περιοχή ελέγχου
λειτουργίας. Η δε χρήση των κυµατιδίων θα ήταν προτιµότερο να εφαρµοστεί στις
περιοχές µεταβατικής κατάστασης (ανύψωσης και πτώσης στροφών του κινητήρα) όπου
όµως υπάρχει αντικειµενικό πρόβληµα προσδιορισµού τους και σχετικά µικρός αριθµός
σηµείων δειγµατοληψίας.
4.3 Κανονικοποίηση
Με τον όρο κανονικοποίηση εννοούνται οι διαδικασίες µετασχηµατισµού των
δεδοµένων που θα επιτρέψουν την ορθολογική σύγκρισή τους. Οι λόγοι για µια τέτοια
ενέργεια επιβάλλονται από το γεγονός ότι αστάθµητοι παράγοντες κατά την µέτρηση
αλλά και η αδυναµία επανάληψης των ίδιων ακριβώς συνθηκών κατά την διάρκεια της
δειγµατοληψίας, οδηγούν στη σύγκριση ανόµοιων δεδοµένων. Μια άλλη αιτία για την
εφαρµογή κανονικοποίησης των δεδοµένων είναι ότι µέσω αυτής δηµιουργούµε "ένα
κοινό παρονοµαστή", ο οποίος συνήθως έχει φυσική σηµασία και διευκολύνει την
σύγκριση µεταξύ των δεδοµένων.
Οι δυο πιο συνηθισµένοι τρόποι κανονικοποίησης ενός διανύσµατος X, n
δεδοµένων, που προέρχονται από την µέτρηση ενός φαινοµένου είναι:
37
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
X* =
X
(4.2)
n
∑X
i =1
i
και
X
X* =
(4.3)
n
∑X
i =1
2
i
µε X * το κανονικοποιηµένο διάνυσµα. Στην δεύτερη περίπτωση το πλεονέκτηµα
είναι η εξασφάλιση του µη µηδενισµού του παρονοµαστή εκτός βέβαια από την ακραία
περίπτωση που όλα τα στοιχεία του διανύσµατος είναι µηδενικά.
Στην εργασία αυτή χρησιµοποιείται µια διαδικασία κανονικοποίησης η οποία
εφαρµόζεται όταν έχουµε µετατροπή σήµατος στο πεδίο της συχνότητας. Για να έχουµε
στην έξοδο του µετασχηµατισµού Fourier, ένα σήµα έτσι ώστε µια µονάδα στο πεδίο του
χρόνου να αντιστοιχεί σε µια µονάδα στο πεδίο της συχνότητας, θα πρέπει το k στοιχείο
του µετασχηµατισµένου σήµατος στο πεδίο των συχνοτήτων της σχέσης (4.1)
να
κανονικοποιηθεί σύµφωνα µε την ακόλουθη σχέση:
X (k ) =
*
2 X (k )
n
(4.4)
4.4 Εκτιµήτριες πυκνότητας πυρήνα (KDE)
Ένα χρήσιµο βοήθηµα στην στατιστική µε το οποίο αναπαρίσταται η συχνότητα
εµφάνισης δεδοµένων και δίνει µια εκτίµηση της συνάρτησης πυκνότητας πιθανότητας,
είναι το ιστόγραµµα. Με το ιστόγραµµα απεικονίζεται η συχνότητα εµφάνισης τιµών
µέτρησης ενός πληθυσµού, κατανεµηµένη σε ίσα διαστήµατα τέτοια ώστε να καλύπτουν
όλο το πεδίο µετρήσεων. Αποτελεί δηλαδή την απεικόνιση της διακριτής πυκνότητας
πιθανότητας των δεδοµένων.
38
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Τα ιστογράµµατα όµως έχουν τα ακόλουθα µειονεκτήµατα:
Η επιλογή του αριθµού και κατ' επέκταση του µεγέθους των διαστηµάτων είναι
αυθαίρετη και επηρεάζει την τελική µορφή του διαγράµµατος.
Τα κλασικά ιστογράµµατα αδυνατούν να αναπαραστήσουν δεδοµένα που
προέρχονται από χώρους µεγαλύτερους του ℜ.
Ο διαχωρισµός ανάµεσα σε δύο διαστήµατα είναι κλιµακωτός ενώ θα ήταν
προτιµότερη µια οµαλότερη γραφική αναπαράσταση όπως αυτή της κατανοµής.
Οι εκτιµήτριες πυκνότητας πυρήνα (Kernel Density Estimators, που θα αναφέρονται
στην συνέχεια ως KDE)- που στην απλή τους µορφή µπορούν να θεωρηθούν σαν
εξοµαλυσµένα ιστογράµµατα - αντιµετωπίζουν σε αρκετό βαθµό τα προαναφερθέντα
µειονεκτήµατα. Οι βασικές ιδέες περιγράφονται αρχικά από τον Silverman (1986), και οι
τελευταίες βελτιώσεις που αφορούν την αντίστοιχη θεωρία βρίσκονται στο βιβλίο των
Wand and Jones (1995). Η προσέγγιση αυτή αποτελεί µη παραµετρική µέθοδο εκτίµησης
της κατανοµής των δεδοµένων, αφού η πληροφορία για να σχηµατιστεί η τελική µορφή
της συνάρτησης υπολογίζεται από τα ίδια τα δεδοµένα και όχι από την εκτίµηση κάποιων
παραµέτρων της κατανοµής τους.
4.4.1 KDE για δεδοµένα σε µία διάσταση
Με δεδοµένα Ν δείγµατα X 1 , X 2 ,..., X N µια KDE µπορεί να σχηµατισθεί αν
παράγουµε µία καµπύλη µέσω συγκεκριµένης µαθηµατικής συνάρτησης για κάθε σηµείο
και στην συνέχεια αθροίσουµε τις αντίστοιχες τεταγµένες για κάθε σηµείο του x-άξονα. Η
µαθηµατική συνάρτηση K ( x ) ονοµάζεται πυρήνας (kernel) και συνήθως είναι µία
39
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
συµµετρική συνάρτηση πυκνότητας πιθανότητας που ολοκληρώνεται στην µονάδα. Ισχύει
∞
δηλαδή:
∫ K (x )dx = 1 . Συνηθίζεται η χρήση η χρήση της κανονικής κατανοµής.
−∞
Μαθηµατικά µια KDE ορίζεται ως,
N
⎛ x − Xi ⎞
ˆf ( x ) = 1
K⎜
⎟
∑
Nh i =1 ⎝ h ⎠
(4.5)
και αποτελεί µια εκτιµήτρια της πυκνότητας πιθανότητας που εµφανίζουν τα
δεδοµένα.
Θα πρέπει να παρατηρηθεί ότι η µεταβλητή h είναι αυθαίρετα επιλεγµένη και
επηρεάζει την τελική µορφή του γραφήµατος της εκτιµήτριας. Υψηλές τιµές του h
υπερεξοµαλύνουν ενώ αντίθετα χαµηλές τιµές του h υποεξοµαλύνουν το γράφηµα. Το h
µπορεί να αντιστοιχηθεί µε το µέγεθος των διαστηµάτων σε ένα ιστόγραµµα όπου µικρό
µέγεθος διαστήµατος δίνει µικρή εξοµάλυνση ενώ µεγάλο υπερεξοµαλύνει. Σύµφωνα µε
τον Silverman (1986), υπάρχει δυνατότητα για επιλογή µεταβλητού h µε κριτήριο την
πυκνότητα των δειγµάτων για µια συγκεκριµένη περιοχή.
4.4.2 KDE για δύο και περισσότερες διαστάσεις δεδοµένων
Ο ορισµός που αναφέρθηκε σε δεδοµένα µιας διάστασης µπορεί να επεκταθεί και
στην περίπτωση των δύο διαστάσεων. Σ' αυτή την περίπτωση, αν τα δεδοµένα είναι ζεύγη
( X i , Yi ) , τότε η συνάρτηση πυρήνα είναι συνάρτηση δύο µεταβλητών και η µεταβλητή h
ορίζεται πλέον ως πίνακας:
⎡h 2
H =⎢ 1
⎣0
0⎤
⎥
h22 ⎦
Έτσι η KDE γίνεται:
40
(4.6)
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
ˆf ( x , y ) =
1
Nh1 h 2
N
⎛ x − X i y − Yi
,
h2
⎝ h1
∑ K ⎜⎜
i =1
⎞
⎟⎟
⎠
(4.7)
και τα h1, h2 έχουν τον ίδιο ρόλο στην εξοµάλυνση όπως και προηγουµένως στην
περίπτωση της µίας διάστασης το h, αλλά κάθε ένα επιδρά σε διαφορετική κατεύθυνση
(σύµφωνα µε τους άξονες).
4.4.3 Απεικόνιση ισοϋψών (contouring)
Μια ενδιαφέρουσα εφαρµογή που έχουν οι KDE για δεδοµένα σε δύο διαστάσεις,
πέρα από το ότι δίνουν την πυκνότητα των δεδοµένων (στον z-άξονα) µε γραφική
εποπτεία χωρίς ασυνέχειες, είναι η χρήση των ισοϋψών καµπυλών για την οριοθέτηση
περιοχών στις οποίες παρατηρείται υψηλή συγκέντρωση δεδοµένων [Bowman and Foster
(1993)].
Για να σχηµατιστούν οι ισοϋψείς αρχικά θα πρέπει τα δεδοµένα (X,Y) να
καταταχθούν κατά αύξουσα σειρά ανάλογα µε την πυκνότητα που εµφανίζουν στην KDE
f(X,Y). Η ισοϋψής που σχηµατίζεται µε βάση την KDE και περικλείει p% από τα
καταταγµένα ζεύγη δίνει την δυνατότητα της απεικόνισης στο επίπεδο των περιοχών που
περικλείουν τα p% "πιο πυκνά " σηµεία του δείγµατος. Στην περίπτωση που το p είναι
µεγάλο, πρόκειται για περιοχές που είναι χαρακτηριστικές για τον δειγµατόχωρο. Αν
παρατηρηθούν νέα δεδοµένα, αναµένεται µε µεγαλύτερη πιθανότητα να παρουσιαστούν
σ' αυτές τις περιοχές.
Στην περίπτωση που είναι επιθυµητή η ταξινόµηση των δεδοµένων, οι ισοϋψείς
παρέχουν πληροφορία για περιοχές µεγάλης συγκέντρωσης στο επίπεδο. ∆ιαφοροποιήσεις
ανάµεσα σε οµάδες δεδοµένων δύο µεταβλητών αναµένεται να εµφανίσουν και διαφορές
στις απεικονίσεις των ισοϋψών τους. Η ποιότητα όµως αυτών των ενδείξεων είναι
συνάρτηση του αριθµού των δεδοµένων.
41
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Τα εξωκείµενα των ισοϋψών σηµεία (outliers), µπορούν επίσης να δώσουν
σηµαντική πληροφορία: µπορούν να χαρακτηρίσουν δεδοµένα που δεν κατανέµονται στο
επίπεδο σύµφωνα µε την πλειονότητα των δεδοµένων (περιοχές υψηλής πυκνότητας).
Αυτά τα σηµεία πιθανόν να µην είναι αντιπροσωπευτικά του δείγµατος και θα πρέπει να
διαπιστωθεί ο λόγος που αποκλίνουν (π.χ. λόγω θορύβου στις µετρήσεις). Σε περίπτωση
που υφίσταται µεγάλο δείγµα είναι δυνατόν να αποκλειστούν από το δείγµα που θα
χρησιµεύσει στην διαδικασία της εκµάθησης θεωρώντας ότι συντελούν στην χειροτέρευση
του λόγου σήµατος προς θόρυβο.
Στο σχήµα 4.1 παρουσιάζεται ένα παράδειγµα που αφορά δεδοµένα από επιλεγµένα
µέγιστα (κορυφές) φάσµατος µιας κατηγορίας προϊόντων (οκτώ χαρακτηριστικά, από 60
δείγµατα συσκευών καλής ποιότητας, από ένα σηµείο µέτρησης). Σύµφωνα µε την
προαναφερθείσα διαδικασία:
για προεπιλεγµένες τιµές h1=6.06 και
h2=0.0294
παρουσιάζονται η KDE για κανονική κατανοµή καθώς και οι ισοϋψείς για ποσοστό
25%,50% και 75%. Οι περιοχές υψηλής πυκνότητας εµφανίζονται ξεκάθαρα είτε ως
κορυφές στο τρισδιάστατο γράφηµα είτε ως περικλειόµενες από ισοϋψείς καµπύλες
υψηλού ποσοστού. Τα εξωκείµενα των ισοϋψών δεδοµένα, µπορούν να χαρακτηριστούν
ως λιγότερο χαρακτηριστικά της συγκεκριµένης κατηγορίας.
Συγκρίνοντας τις ισοϋψείς από διαφορετικές κατηγορίες δεδοµένων για τα ίδια
ποσοστά p µπορούν να προκύψουν πολύτιµα συµπεράσµατα. Οι περιοχές υψηλής
συγκέντρωσης που θα ορίζουν οι ισοϋψείς υψηλής συγκέντρωσης για κάθε κατηγορία και
οι οποίες δεν θα
επικαλύπτονται από άλλες, θα χαρακτηρίζουν περιοχές που είναι
χαρακτηριστικές για αυτήν την κατηγορία. Θα είναι δηλαδή περιοχές που θα διαχωρίζουν
ουσιαστικά µια κατηγορία από άλλες. Έτσι, ύπαρξη τέτοιων περιοχών µπορεί να µειώσει
τον χώρο των δεδοµένων αφού αναζητούµε µόνο τα δεδοµένα εκείνα που διαφοροποιούν
τις κατηγορίες.
42
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
4
.5 Μετασχηµατισµός Karhunen-Loeve
Ο µετασχηµατισµός Karhunen-Loeve (KL) αποτελεί ένα γραµµικό µετασχηµατισµό
µείωσης της διάστασης των δεδοµένων, κάνοντας στη ουσία ανάλυση σε κύριες
συνιστώσες. Ο µετασχηµατισµός KL συναντά ευρεία εφαρµογή σε περιπτώσεις που
θέλουµε να µειώσουµε τον αριθµό των δεδοµένων µας χωρίς να χάσουµε σηµαντικό µέρος
της πληροφορίας [Fukunaga (1972)]. Πρόσφατες εφαρµογές του KL πάνω σε φάσµατα σε
συνδυασµό µε την αναγνώριση προτύπου έχουν αναφερθεί από τους Tumer et al.(1996),
Obaitat (1993), Huynh et al. (1998).
Ο µετασχηµατισµός KL βασίζεται στην εξής απλή ιδέα: αν οι µεταβλητές είναι
συσχετισµένες σε µεγάλο βαθµό, µε το να προβληθούν σε ένα καινούργιο σύστηµα µε
λιγότερες συντεταγµένες (κύριες συνιστώσες) οι οποίες θα είναι ασυσχέτιστες µεταξύ
τους, επιτυγχάνεται η διατήρηση της πληροφορίας µειώνοντας ταυτόχρονα τα δεδοµένα.
Στην ιδανική περίπτωση, λίγες από τις κύριες συνιστώσες θα είναι σηµαντικές και η
43
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Σχήµα 4.1. Απεικόνιση KDE (κανονικής κατανοµής) στο επίπεδο και στο χώρο για 60 ζεύγη χαρακτηριστικών µε τις αντίστοιχες
ισοϋψεις 25%, 50% και 75%
44
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
προβολή αυτή βοηθώντας στην καλύτερη κατανόηση των δεδοµένων επιτρέπει να
προχωρήσουµε σε περαιτέρω ανάλυση. Στην πράξη, η ερµηνεία των προβολών στο
καινούργιο σύστηµα δεν είναι εύκολη και έτσι ο µετασχηµατισµός χρησιµεύει
κυρίως ως προκαταρκτικό στάδιο µείωσης της διάστασης των δεδοµένων.
Ο µετασχηµατισµός KL µπορεί να θεωρηθεί ως ένας γραµµικός µετασχηµατισµός
των N δειγµάτων των αρχικών δεδοµένων Xi∈ℜn i=1,…,N. Έστω C x ∈ℜnxn ο πίνακας της
δειγµατικής συνδιασποράς του X∈ℜNxn και Α∈ℜnxn ο πίνακας των κανονικοποιηµένων
ιδιοδιανυσµάτων του C x , ο οποίος χρησιµοποιείται
ως τελεστής για τον γραµµικό
µετασχηµατισµό. Ο µετασχηµατισµός είναι της µορφής,
Z = XA T
(4.8)
όπου Ζ είναι τα δεδοµένα µετασχηµατισµένα στις συνιστώσες του νέου συστήµατος.
Οι άξονες του νέου συστήµατος είναι κάθετοι µεταξύ τους και κείνται στις
κατευθύνσεις όπου τα αρχικά δεδοµένα παρουσιάζουν την µεγαλύτερη διασπορά. Κάθε
γραµµή του πίνακα Α αντιστοιχεί σε µια ιδιοτιµή του C x . Το κατά πόσο αυτή η προβολή
στους νέους άξονες αναπαριστά τα αρχικά δεδοµένα προσδιορίζεται από την αντίστοιχη
ιδιοτιµή. Η τιµή της αντίστοιχης ιδιοτιµής
εκφράζει την πληροφορία που
αντικατοπτρίζεται σ' αυτήν την προβολή µε κριτήριο την διασπορά.
Κανονικά είναι δυνατόν να υπολογιστούν τόσες κύριες συνιστώσες όσες και οι
µεταβλητές. Στην πράξη κάποιες µεταβλητές είναι γραµµικά εξαρτηµένες µε αποτέλεσµα
οι ιδιοτιµές και συνεπώς οι κύριες συνιστώσες να είναι µικρές ή µηδέν (επειδή ο C x είναι
συµµετρικός οι ιδιοτιµές του είναι πραγµατικές). Έτσι στις περισσότερες εφαρµογές
επιλέγονται τόσες κύριες συνιστώσες όσες το άθροισµα των αντιστοίχων ιδιοτιµών τους
ξεπεράσει ένα ικανοποιητικό ποσοστό (για παράδειγµα το 90%). Αν δηλαδή διατάξουµε
τις ιδιοτιµές,
λ1 > λ 2 > ... > λ d > ... > λ n > 0
45
(4.9)
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
πρέπει να επιλέξουµε ένα επίπεδο r για τις d πρώτες ιδιοτιµές ώστε,
d
∑λ
i
∑λ
i
i =1
n
i =1
> r ,0 < r ≤1
(4.10)
Ο πίνακας µετασχηµατισµού Α*∈ℜdxn που θα χρησιµοποιηθεί σύµφωνα µε την
σχέση (4.8) για να µειώσει τα δεδοµένα, προκύπτει από τον Α διατάσσοντας τις γραµµές
του σύµφωνα µε την διάταξη των ιδιοτιµών της σχέσης (4.10) και κρατώντας τις d πρώτες.
Έτσι η µείωση των δεδοµένων στις d κύριες συνιστώσες γίνεται µέσω του ακόλουθου
µετασχηµατισµού,
X* = XA *T
(4.11)
Πρέπει να επισηµανθεί ότι η προβολή που πραγµατοποιείται µέσω του KL δεν είναι
απαραίτητα και η καλύτερη µε κριτήριο τον διαχωρισµό των κλάσεων. Ο
µετασχηµατισµός KL προβάλλει µε το κριτήριο της µέγιστης διασποράς που δεν είναι
πάντα κριτήριο διαχωρισιµότητας (σχήµα 4.2) [Shimshoni (1995)]. Επίσης, εξαρτάται
ισχυρά από το δείγµα αφού η προσθήκη λίγων νέων δεδοµένων µπορεί να αλλάξει κατά
πολύ τις προβολές στον νέο χώρο [Chatfield and Collins (1980)].
Σχήµα 4.2 Η προβολή στον άξονα µέγιστης διασποράς δεν διαχωρίζει απαραίτητα καλύτερα τις
κλάσεις [Shimshoni (1995)]
46
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
4.6 Ταξινόµηση µε χρήση αποστάσεων
Μια αρκετά δηµοφιλής µέθοδος ταξινόµησης δεδοµένων στον ℜn µε n µεγάλο είναι
η χρήση αποστάσεων. Οι κατηγορίες σχηµατίζουν νέφη σηµείων και λογικά ένα
αταξινόµητο νέο σηµείο θα έχει µεγαλύτερη πιθανότητα να ανήκει στην κατηγορία από
την οποία έχει την µικρότερη απόσταση. Προϋπόθεση βέβαια είναι οι κατηγορίες στον nδιάστατο χώρο να είναι διαχωρίσιµες. Αν τα όρια των κατηγοριών είναι δυσδιάκριτα, τότε
η κατηγοριοποίηση του σηµείου µε βάση την απόστασή του από τα κέντρα των νεφών,
έχει µικρότερη πιθανότητα επιτυχίας.
Ταξινοµητές όπως ο K-NN (K Nearest Neighbors) κάνουν χρήση αυτής της λογικής
και αναζητούν τις κατηγορίες των Κ σηµείων της "γειτονιάς" για να αποφασίσουν σε ποια
κατηγορία ανήκει ένα νέο σηµείο [Duda and Hart (1973)]. Αντίστοιχα υπάρχουν ασαφείς
ταξινοµητές µε τους οποίους µπορούν να οριστούν ασαφείς περιοχές και πάλι µε χρήση
αποστάσεων να αποφασιστεί σε ποια κατηγορία ανήκει το αταξινόµητο σηµείο κρίνοντας
από την συνάρτηση συµµετοχής του για κάθε κατηγορία (Fuzzy C-means) [Bezdek
(1981)].
Ο µέσος και η διασπορά των σηµείων κάθε κατηγορίας είναι δύο σηµαντικές
παράµετροι στην ταξινόµηση µε χρήση αποστάσεων. Ο µέσος m(ή κέντρο βάρους των
σηµείων) Ν δειγµάτων στον n-διάστατο χώρο, αποτελεί µια τυπική τιµή που αναµένεται
να βρίσκεται στο κέντρο αυτής της υποπεριοχής του χώρου που ορίζει η κατηγορία.
Αντίστοιχα η διασπορά V ορίζει το µέγεθος αυτής της υποπεριοχής. Κάνοντας χρήση της
τυπικής απόκλισης s αντί της διασποράς, είναι δυνατόν σε συνδυασµό µε τον µέσο να
εκτιµηθούν οι υποπεριοχές αυτές. Αν για παράδειγµα τα δεδοµένα ακολουθούν κανονική
κατανοµή, αναµένεται ότι θα βρίσκονται εντός κάποιων ορίων (για παράδειγµα στον ℜ η
περιοχή m±2s θα περικλείει το 95% και η περιοχή m±s θα περικλείει το 68%).
47
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Αν x,y είναι δύο σηµεία στον ℜn τα µέτρα των αποστάσεων τους . , θα πρέπει
αξιωµατικά να ικανοποιούν τους ακόλουθους όρους:
x, y ≥ 0
x, x = 0
x, y = y, x
x, y ≤ x , z + y , z
Επίσης αν το µέτρο της απόστασης δύο σηµείων x, y οριστεί κατά Minkowski [Jain
and Dubes (1988)]:
⎛ n
x, y = ⎜⎜ ∑ a (jx ) − a (jy )
⎝ j =1
1
r
⎞r
⎟ , r ≥1
⎟
⎠
(4.12)
µε a j τις συντεταγµένες των σηµείων x, y στον ℜn τότε για r =2 η (4.12) υπολογίζει
το µέτρο της γνωστής ευκλείδειας απόστασης ενώ για r =1 και r =∞ υπολογίζει αντίστοιχα
τα µέτρα Manhatan και Sup.
4.6.1 Ευκλείδεια απόσταση και απόσταση Mahalanobis
Αν θέλουµε να υπολογίσουµε την ευκλείδεια απόσταση στο τετράγωνο µεταξύ ενός
σηµείου x και του µέσου m ενός νέφους σηµείων για να εξακριβώσουµε πόσο κοντά
στον πυρήνα του νέφους βρίσκεται αυτό το σηµείο θα έχουµε:
d (x ) = (x − m ) (x − m )
T
(4.13)
Εν γένει ένας ταξινοµητής διαχωρίζει τον χώρο των χαρακτηριστικών σε
υποπεριοχές που ονοµάζονται περιοχές απόφασης. Όλα τα σηµεία που εµπίπτουν σε µία
περιοχή ανήκουν στην ίδια κατηγορία. Οι περιοχές αυτές συνήθως είναι συνεχείς στο
48
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
χώρο αλλά υπάρχουν και περιπτώσεις όπου ο χώρος µιας κατηγορίας δεν παρουσιάζει
συνοχή. Ο διαχωρισµός αυτών των περιοχών γίνεται µέσω ορίων που για χαρακτηριστικά
σε διαστάσεις µεγαλύτερες του 3 είναι υπερεπίπεδα. Στην περίπτωση των ταξινοµητών
που λειτουργούν µε αποστάσεις τα όρια αυτά απέχουν εξίσου από δύο ή περισσότερους
πυρήνες. Για παράδειγµα στο σχήµα 4.3 µε χρήση του µέτρου της ευκλείδειας απόστασης
στον ℜ2 τα όρια αυτά µεταξύ δύο περιοχών i και j ορίζονται από την γραµµή που είναι
κάθετη στην ευθεία που ενώνει τα αντίστοιχα κέντρα m i και m j . Το πόσο καλά λοιπόν θα
γίνει η ταξινόµηση εξαρτάται από την συνοχή του νέφους των σηµείων µέσα στις περιοχές
απόφασης.
Σχήµα 4.3 Χωρισµός του χώρου σε υποπεριοχές και απόδοση ενός σηµείου σε µια υποπεριοχή
υπολογίζοντας την απόστασή του από τα αντίστοιχα κέντρα
Η ευκλείδεια απόσταση ενός σηµείου από ένα κέντρο στο επίπεδο µετριέται µέσω
της ακτίνας που σχηµατίζουν οµόκεντροι κύκλοι χωρίς να λαµβάνεται υπόψη η κατανοµή
του νέφους των σηµείων από τα οποία προέκυψε το κέντρο. Αν θέλουµε να λάβουµε
υπόψη και αυτόν τον παράγοντα τότε µπορούµε να υπολογίσουµε την απόσταση
Mahalanobis στο τετράγωνο:
h( x ) = ( x − m ) C −1 ( x − m )
T
(4.14)
όπου το σηµείο x και ο µέσος m είναι ορισµένοι όπως και προηγουµένως στην
ευκλείδεια απόσταση και ο πίνακας
C −1
είναι ο αντίστροφος του πίνακα
συµµεταβλητότητας των χαρακτηριστικών. Στον πίνακα αυτόν το στοιχείο c (i , j ) δείχνει
την συσχέτιση του χαρακτηριστικού i µε το χαρακτηριστικό j. Στην περίπτωση της
απόστασης
Mahalanobis
οι
διαχωριστικές
49
επιφάνειες
είναι
ελλειψοειδή
(ή
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
υπερελλειψοειδή) µε κέντρο τον µέσο m που εκφράζουν την απόσταση σε πολλαπλάσια
της τυπικής απόκλισης (σχήµα 4.4). Στην ειδική περίπτωση που τα χαρακτηριστικά είναι
ασυσχέτιστα και οι διασπορές είναι ίσες µε την µονάδα, δηλαδή ο πίνακας C −1 είναι ο
µοναδιαίος, η απόσταση Mahalanobis γίνεται ίση µε την ευκλείδεια.
Σχήµα 4.4 Ευκλείδεια απόσταση και απόσταση Mahalanobis για το ίδιο νέφος σηµείων
Συνεπώς η χρήση της απόστασης Mahalanobis υπερτερεί της ευκλείδειας
εκµεταλλευόµενη καλύτερα τις πληροφορίες του δείγµατος αφού:
Συνυπολογίζει την πληροφορία από τυχόν συσχετισµό των δεδοµένων.
Προτείνει καµπύλες διαχωρισµού οι οποίες έχουν µεγαλύτερη πιθανότητα να
περικλείουν τα δεδοµένα, επειδή η µορφή τους κατασκευάζεται µε βάση την διασπορά των
δεδοµένων στον χώρο.
∆ίνει δυνατότητα για αυτόµατη κλιµάκωση (scaling) στους άξονες συντεταγµένων.
Το µεγάλο µειονέκτηµα της απόστασης Mahalanobis είναι ο υπολογισµός του C −1
ιδιαίτερα στην περίπτωση που έχουµε µεγάλο αριθµό χαρακτηριστικών και µικρό αριθµό
δείγµατος λόγω προβληµάτων στην αντιστροφή του. Αν τα χαρακτηριστικά έχουν µειωθεί
50
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
σε d, ισχύει δηλαδή x ∈ ℜd και υπάρχει πληροφορία από N δείγµατα, τότε ουσιαστικά
εκτιµώνται τα d2 στοιχεία του C (ή έστω τα d(d-1)/2 αφού ο C είναι συµµετρικός) µέσω N
δειγµάτων. Αυτό το γεγονός για µικρό d δεν αποτελεί πρόβληµα αλλά αν για παράδειγµα
d=100 για µια καλή εκτίµηση απαιτούνται περίπου 5000 παραδείγµατα. Συνεπώς για να
εφαρµοστεί η απόσταση Mahalanobis θα πρέπει πρώτα ο χώρος των χαρακτηριστικών να
έχει µειωθεί αποτελεσµατικά.
4.6.2 Απόσταση Bayes
Όπως αναφέρθηκε για την αναγνώριση προτύπου στον ορισµό 2.1, στόχος είναι η
κατάταξη ενός προτύπου x σε µια γνωστή κλάση, έστω wi . Η γνώση για το πόσο συχνά
παρατηρούνται δείγµατα από την κλάση wi θα µπορούσε να βοηθήσει σ' αυτήν την
προσπάθεια. Αυτή η γνώση εκφράζεται µε την εκ των προτέρων γνωστή πιθανότητα
p (wi ) ενώ η δεσµευµένη πιθανότητα σύµφωνα µε την οποία το παρατηρούµενο πρότυπο
x ανήκει στην wi , είναι η p (wi | x ) .
Ένας ταξινοµητής κατά Bayes θα αποδώσει το πρότυπο x στην wi αν [Barschdorff
(1991)]:
p(wi | x ) > p(w j | x ) , ∀i ≠ j
(4.15)
Κάνοντας χρήση του τύπου του Bayes η (4.15) γίνεται:
p(wi ) p( x | wi ) > p (w j ) p (x | w j ) , ∀i ≠ j
(4.16)
Το πλεονέκτηµα στην σχέση (4.16) είναι ότι συνήθως είναι γνωστές εκ των
προτέρων οι πιθανότητες p (wi ) και p(w j ) , ενώ συχνά θεωρείται η κατανοµή των
δεδοµένων κανονική, µε αποτέλεσµα να είναι εύκολο να υπολογιστούν οι p( x | wi ) ,
p(x | w j ) . Σε περίπτωση κανονικής κατανοµής ισχύει,
51
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
p ( x | wi ) =
1
(2π ) 2 C i
n
1
2
⎤
⎡ 1
T
exp ⎢ − ( x − mi ) C i−1 ( x − mi )⎥
⎦
⎣ 2
(4.17)
µε n την διάσταση του προτύπου x και m i , C i−1 τον εκτιµούµενο µέσο και
συνδιασπορά
αντίστοιχα για την κανονικά κατανεµηµένη κλάση wi . Παίρνοντας
λογαρίθµους το πρώτο µέλος της ανισότητας της (4.16) γίνεται:
log p (wi ) p( x | wi ) = log p(wi ) −
1
1
n
T
log 2π − log C i − ( x − mi ) C i−1 ( x − mi )
2
2
2
(4.18)
Αφαιρώντας τον όρο −
n
log 2π , ο οποίος παραµένει ίδιος ∀ i , και παρατηρώντας
2
ότι ο τελευταίος όρος είναι η απόσταση Mahalanobis στο τετράγωνο h ( x ) της (4.14), η
απόσταση στο τετράγωνο κατά Bayes ορίζεται:
d i ( x ) = − log p(wi ) +
1
log C i + h( x )
2
(4.19)
και η επιλογή για το που θα αποδοθεί το πρότυπο γίνεται µε βάση την µικρότερη
απόσταση. Συνεπώς αποδίδουµε το πρότυπο x στην wi αν,
d i (x ) < d j (x ) , ∀i ≠ j
Η απόσταση Bayes
διαφέρει από την
(4.20)
Mahalanobis
στο ότι ενσωµατώνει
πληροφορία που αφορά την εκ των προτέρων γνωστή πιθανότητα p (wi ) . Πρέπει να
επισηµανθεί, ότι η απόσταση Bayes µπορεί να πάρει και αρνητικές τιµές λόγω του πρώτου
όρου και συνεπώς θα πρέπει να χρησιµοποιείται µόνο για συγκρίσεις και όχι ως απόλυτο
µέτρο απόστασης.
Συνοψίζοντας, οι προαναφερθείσες αποστάσεις µπορούν να χρησιµοποιηθούν σε µία
διάταξη αναγνώρισης προτύπου όπως φαίνεται στο σχήµα 4.5. Αν m1 , m 2 ,..., m k και
C1 ,C 2 ,...,C k
είναι οι µέσοι και οι συνδιασπορές δεδοµένων των k κατηγοριών
w1 , w2 ,..., wk
και
p (w1 ), p (w 2 ),..., p (w k ) οι αντίστοιχες εκ των προτέρων γνωστές
52
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
πιθανότητες εµφάνισης προτύπων των κατηγοριών αυτών, τότε ένα νεοεµφανιζόµενο
δεδοµένο είναι δυνατόν να ταξινοµηθεί σε µια κατηγορία από τις w1 , w2 ,..., wk ,
χρησιµοποιώντας το κριτήριο της ελάχιστης απόστασης (ευκλείδειας, Mahalanobis ή
Bayes).
Σχήµα 4.5 ∆ιάταξη αναγνώρισης προτύπου µέσω αποστάσεων
4.7 Ο αλγόριθµος FCM (Fuzzy c-means)
Ο αλγόριθµος (FCM) αποτελεί µια τεχνική κατηγοριοποίησης η οποία κατατάσσει
τα δεδοµένα σε κατηγορίες ανάλογα µε το βαθµό συµµετοχής τους, ο οποίος
προσδιορίζεται
αντίστοιχα
από
µια
συνάρτηση
συµµετοχής.
Η
τεχνική
αυτή
πρωτοπαρουσιάστηκε από τον Bezdek (1981) και βελτιώσεις σχετικά µε την εφαρµογή
του παρουσιάζονται από τους Cannon et al. (1986). Αποτελεί µέθοδο µη εποπτευόµενης
κατηγοριοποίησης, δηλαδή δεν προϋποθέτει γνώση των κατηγοριών.
Ο αλγόριθµος ξεκινά µε τον υπολογισµό της ευκλείδειας απόστασης ανάµεσα σε
κάθε σηµείο στον d-διάστατο χώρο των χαρακτηριστικών και σε αυθαίρετα επιλεγµένα
53
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
κέντρα για κάθε κατηγορία. Οι υπολογισµοί αυτοί παρέχουν µια πρώτη εκτίµηση για τον
βαθµό συµµετοχής του συγκεκριµένου σηµείου σε κάθε κατηγορία. Στην συνέχεια γίνεται
προσπάθεια ελαχιστοποίησης µιας κατάλληλης αντικειµενικής συνάρτησης µε σκοπό την
µετακίνηση των κέντρων κάθε κλάσης σε τέτοιο σηµείο στον d-διάστατο χώρο ώστε να
ελαχιστοποιείται ένα µέτρο απόστασης.
Έστω ℜd ο µειωµένος d-διάστατος χώρος των χαρακτηριστικών (feature space) όπου
τα στοιχεία x
ℜd είναι τα διανύσµατα των χαρακτηριστικών. Κάθε τέτοιο διάνυσµα x
=(x1,x2,…,xd) έχει ως στοιχεία του d πραγµατικούς αριθµούς. Έστω επίσης ότι X είναι ένα
υποσύνολο του ℜd . Μια συνάρτηση u: X
[0,1] είναι δυνατόν να αποδίδει το βαθµό
συµµετοχής του x στο X. Σηµειώνεται ότι έτσι σχηµατίζονται άπειρα ασαφή σύνολα που
σχετίζουν το x µε το X. Για να διαχωριστεί το Χ σε κατάλληλα ασαφή υποσύνολα,
ορίζεται ο ασαφής τοµέας c ( fuzzy c partition) ως ακολούθως:
Ορισµός 4.1 [Bezdek (1981)]:
∆εδοµένου ενός πεπερασµένου συνόλου X
ℜd και ενός ακεραίου c, όπου 2 c
d, οι
ασαφείς τοµείς c µπορούν να αναπαρασταθούν από ένα πίνακα U (c×d) του οποίου τα
στοιχεία ορίζονται ακολούθως:
1. Η γραµµή i του Ui=(ui1,ui2,….,uid) αντιπροσωπεύει την i-οστή συνάρτηση συµµετοχής
του x στον i τοµέα του X. Εκφράζει δηλαδή το κατά πόσο το x ανήκει στον i τοµέα.
2. Η στήλη j του Uj=(u1j,u2j,….,ucj)Τ αντιπροσωπεύει την j-οστή συνολική συνάρτηση
συµµετοχής του j-οστού
δεδοµένου του x, στο X. Εκφράζει το κατά πόσο
"συµµετέχει" το xj στον i τοµέα.
Ισχύουν δε, τα ακόλουθα:
c
∑u
ik
= 1 , ∀k
(4.21a)
i =1
d
0 < ∑ u ik < d , ∀ i
(4.21b)
k =1
54
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Ο αλγόριθµος FCM προσεγγίζει µε επαναληπτικό τρόπο το ελάχιστο µιας
αντικειµενικής συνάρτησης χρησιµοποιώντας ένα µέτρο (για παράδειγµα εσωτερικό
γινόµενο) για να υπολογίσει την οµοιότητα. Η διαφοροποίηση είναι αποτέλεσµα της
εφαρµογής ενός εκθετικού βάρους q στις τιµές της συνάρτησης συµµετοχής που
χρησιµοποιούνται στον ορισµό της συνάρτησης.
Ορισµός 4.2 [Bezdek (1981)]:
Ένα FCM συναρτησοειδές (fuzzy c-means functional) ορίζεται:
d
c
J m ( U , m ) = ∑∑ ( u ik ) q ( d ik ) 2
(4.22)
k =1 i =1
όπου U είναι ένας ασαφής c τοµέας του X, m=(m1,m2,….,md)
κλάσης (ή πρωτότυπο) , 1
i
ℜd είναι το κέντρο της i
c και (dik)2=||xk-mi||2, µε ||.|| οποιαδήποτε µορφή µέτρου
απόστασης (όπως το εσωτερικό γινόµενο), και q
[1, ).
Ο σχηµατισµός των ασαφών c τοµέων γίνεται µε τον προσδιορισµό του m που
ελαχιστοποιεί την (4.22) µέσω αναδροµικών σχέσεων που περιγράφονται αναλυτικά από
τον Bezdek (1981) και ο αλγόριθµος συγκλίνει πάντα (στην χειρότερη περίπτωση σε
τοπικά ελάχιστα). Το Jm είναι συνεπώς ένα κριτήριο τετραγωνικού σφάλµατος και έτσι η
ελαχιστοποίηση του παράγει ασαφείς τοµείς κατά αυτή την έννοια. Η χρήση
του
αλγορίθµου FCM απαιτεί τον ορισµό παραµέτρων όπως το είδος του µέτρου απόστασης
||.||. Για παράδειγµα µπορεί να χρησιµοποιηθεί, εκτός της κλασικής Ευκλείδειας
απόστασης, η απόσταση Mahalanobis. Η παράµετρος q για τις περισσότερες εφαρµογές
µεταβάλλεται στο διάστηµα 1 q 5 χωρίς να αναφέρεται στην βιβλιογραφία τρόπος
βέλτιστης επιλογής της και επηρεάζει την λύση ως προς την ασάφεια των τοµέων που
παράγονται: αν q→1 τότε παράγονται µη ασαφείς τοµείς (hard c-means, µε τιµές uik 0 ή
1) ενώ αν q→∞ το m τείνει στο κεντροειδές των δεδοµένων. Η συνήθης τιµή του q στην
βιβλιογραφία είναι q=2 και η χρησιµοποιούµενη απόσταση είναι συνήθως ευκλείδεια.
55
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Εναλλακτικές µορφές του FCM που να οδηγούν στο σχηµατισµό τοµέων µε
υπερελλειψοειδή µορφή έχουν παρουσιαστεί από τους Gustafson and Kessel (1979), Gath
and Geva(1989). Ενώ ο FCM έχει το µειονέκτηµα της δηµιουργίας σφαιρικών τοµέων
περίπου ίδιου µεγέθους, οι προαναφερθέντες µορφές δηµιουργούν ελλειψοειδή µε µέγεθος
ανάλογο της διασποράς των δεδοµένων. Πάντως δεν είναι απαραίτητο αυτοί οι τοµείς να
δώσουν καλύτερη διαχωρισιµότητα στις κλάσεις [Kruse et al.(1994)], όπως είναι και το
ζητούµενο. Αν τα δεδοµένα δεν σχηµατίζουν συµπαγή νέφη αλλά αποτελούν µια οµάδα
(για παράδειγµα αν σχηµατίζουν δακτυλίους), οι προαναφερθέντες αλγόριθµοι θα
δυσκολευτούν να αναγνωρίσουν τους τοµείς. Στην περίπτωση αυτή, που είναι
συνηθισµένη στις εφαρµογές αναγνώρισης εικόνων, εφαρµόζονται άλλοι αλγόριθµοι όπως
ο FKR [Man and Gath (1994)].
Στην συγκεκριµένη εφαρµογή, είναι γνωστές οι πιθανές κατηγορίες που µπορεί να
εµφανιστούν στις υπό έλεγχο συσκευές (είναι το σύνολο των πιθανών βλαβών µαζί µε την
περίπτωση οµαλής λειτουργίας). Έτσι, παρότι θα ήταν λογικό εκ πρώτης όψεως να
χρησιµοποιηθούν µόνο εποπτευόµενοι αλγόριθµοι, εφαρµόστηκε
ο αλγόριθµος FCM
περισσότερο λόγω της ιδιότητάς του να σχηµατίζει χωρίς εποπτεία τις κλάσεις στον χώρο
των χαρακτηριστικών και έτσι να δίνει ενδείξεις για την ποιότητα των επιλεγµένων
χαρακτηριστικών. Έτσι αν δεν καταφέρει ο ταξινοµητής να διαχωρίσει ικανοποιητικά τις
κλάσεις κατά την φάση της εκµάθησης, είναι βέβαιο ότι δεν θα είναι δυνατόν να
προχωρήσει σε γενίκευση. Αντίστοιχα ένας διαχωρισµός στην φάση της εκµάθησης θέτει
τα θεµέλια για µια πιθανή ικανότητα γενίκευσης και επιδοκιµάζει την ποιότητα των
επιλεχθέντων χαρακτηριστικών.
56
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
4.8 Ταξινόµηση µέσω του προσαρµοζόµενου δικτύου ασαφούς λογικής
ANFIS
Όπως έχει ήδη αναφερθεί, ο στόχος της αναγνώρισης προτύπου είναι η απόδοση
ενός αντικειµένου σε µια κατηγορία αντικειµένων οµοειδών προς αυτό. Όταν η διαδικασία
αυτή είναι πλήρως επεξηγήσιµη τότε ο αλγόριθµος καλείται διαφανής [Zadeh (1977)], ενώ
στη αντίθετη περίπτωση αδιαφανής. Ο άνθρωπος χρησιµοποιεί κατά κόρον αδιαφανείς
αλγορίθµους κατηγοριοποίησης στις αναγνωρίσεις αντικειµένων που πραγµατοποιεί.
Μια προσέγγιση κατηγοριοποίησης, είναι η χρήση κανόνων ασαφούς λογικής προς
εξαγωγή συµπεράσµατος, αναφορικά µε το σε ποια κλάση ανήκει ένα αντικείµενο που
παρουσιάζει κάποια συγκεκριµένα χαρακτηριστικά. Για να επιτευχθεί η κατηγοριοποίηση,
χρειάζεται να βρεθούν οι κατάλληλοι κανόνες και οι αντίστοιχες συναρτήσεις συµµετοχής
σύµφωνα µε την θεωρία της ασαφούς λογικής [Zadeh (1977)], που θα βοηθήσουν στην
αντιστοίχηση του αντικείµενου στην κατηγορία του. Πρόκειται όµως για µια αντιστοίχηση
από τον χώρο των χαρακτηριστικών στον χώρο των κατηγοριών, για την οποία δεν
υπάρχουν πληροφορίες. Συνεπώς δεν υπάρχει γνώση των κανόνων που την διέπουν. Η
µόνη πληροφορία που µπορεί να αντληθεί είναι µέσω παραδειγµάτων. Ένα δίκτυο που θα
µπορούσε να πραγµατοποιήσει την αντιστοίχηση και να την αναπροσαρµόσει µε βάση την
πληροφορία που δέχεται από τα παραδείγµατα είναι το ANFIS (Adaptive-Network-Based
Fuzzy Inference System) [Jang (1993)].
Ο αλγόριθµος του δικτύου υπολογίζει µέσω αναδροµικής βελτιστοποίησης (backpropagation) παραµέτρους ενός συστήµατος ασαφούς επαγωγικής λογικής FIS (Fuzzy
Inference System), χρησιµοποιώντας την πληροφορία µάθησης που δέχεται από νέα
δεδοµένα (παραδείγµατα). Στην συνέχεια παρουσιάζεται µια συνοπτική περιγραφή του
αλγορίθµου ενώ αναλυτικότερη περιγραφή υπάρχει στο [Jang (1993)].
57
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Υπάρχουν πέντε διακριτά επίπεδα στο δίκτυο του ANFIS. Κάθε επίπεδο αντιστοιχεί
σε ένα συγκεκριµένο τµήµα ενός συστήµατος επαγωγής ασαφούς λογικής. Στο σχήµα 4.6
παρουσιάζεται η αντιστοιχία για ένα σύστηµα δύο εισόδων και δύο κανόνων. Θεωρείται
ότι αυτό το σύστηµα επαγωγής ασαφούς λογικής κάνει χρήση κανόνων τύπου Sugeno
[Takagi and Sugeno (1983)]. Η γενική µορφή αυτών των κανόνων για ένα σύστηµα δύο
εισόδων είναι:
EAN x=A KAI y=B TOTE f=px+qy+r
(4.23)
µε A και B τιµές που προκύπτουν από ασαφή σύνολα και p,q,r παράµετροι που
καθορίζουν το αποτέλεσµα του επαγωγικού τµήµατος του κανόνα. Στην περίπτωση αυτής
της εργασίας οι είσοδοι θα είναι κάποια χαρακτηριστικά και η έξοδος θα είναι µία
κατηγορία, χρησιµοποιώντας την ικανότητά του αλγορίθµου να αυτοπροσαρµόζει την
αντιστοίχηση εισόδων-εξόδου, τροποποιώντας τις συναρτήσεις συµµετοχής. Ξεκινώντας
από αυθαίρετα ορισµένες συναρτήσεις συµµετοχής, στόχος είναι µε την βοήθεια των
παραδειγµάτων, να τροποποιηθούν κατά
τέτοιο τρόπο, ώστε το σύστηµα επαγωγής
ασαφούς λογικής να αντιστοιχεί ικανοποιητικά τα χαρακτηριστικά ενός αντικειµένου σε
συγκεκριµένη κατηγορία.
Μια συνήθης συνάρτηση συµµετοχής είναι η ακόλουθη,
µAi ( x ) =
1
⎡⎛ x − c
i
1 + ⎢⎜⎜
a
⎢⎣⎝ i
⎞
⎟⎟
⎠
2
⎤
⎥
⎥⎦
bi
(4.24)
όπου µΑi η συνάρτηση συµµετοχής της εισόδου x και a i , bi , ci παράµετροι που
µεταβάλλονται κατά την εκτέλεση του αλγορίθµου.
58
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
4.6 Σύστηµα ασαφούς επαγωγικής λογικής δύο εισόδων και δύο κανόνων και το αντίστοιχο δίκτυο
ANFIS [Jang (1993)]
Στο δεύτερο επίπεδο οι ποσότητες που αντιστοιχούν στις συναρτήσεις συµµετοχής
για κάθε είσοδο πολλαπλασιάζονται αναµεταξύ τους. Για το παράδειγµα των δύο εισόδων
του σχήµατος 4.6 ισχύει:
wi = µAi ( x )µBi ( y )
(4.25)
Στο τρίτο επίπεδο υπολογίζεται η ποσότητα:
wi =
wi
∑ wi
(4.26)
Στο τέταρτο επίπεδο εισάγονται οι παράµετροι pi , qi , ri :
wi f i = wi ( pi x + qi y + ri )
(4.26)
και στο πέµπτο επίπεδο αθροίζονται όλοι οι κόµβοι του δικτύου,
f = ∑ wi f i
(4.27)
59
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Ο Jang (1993) αποδεικνύει ότι επειδή οι παράµετροι της σχέσης (4.26) αποτελούν
γραµµικούς συνδυασµούς της εξόδου, είναι δυνατόν να εκτιµηθούν νέες βελτιωµένες
pi∗ , qi∗ ,ri∗ µέσω παραδειγµάτων αντιστοίχησης εισόδου-εξόδου µε χρήση ελαχίστων
τετραγώνων.
Ακόµα
αποδεικνύει
ότι
ανατρέχοντας
αντίστροφα
το
δίκτυο
χρησιµοποιώντας µια συνάρτηση σφάλµατος Ε( pi∗ , qi∗ ,ri∗ , pi , qi , ri ) και παρατηρώντας ότι
κάθε κόµβος είναι συνάρτηση του προηγούµενου οι παράµετροι a i , bi , c i µπορούν να
βελτιωθούν. Έτσι, σε κάθε βήµα του αλγορίθµου (epoch) πραγµατοποιείται ένα ευθύ και
ένα ανάδροµο πέρασµα. Στο ευθύ οι παράµετροι a i , bi , c i κρατούνται σταθερές ενώ οι
p i , q i ,ri µεταβάλλονται µε βάση την πληροφορία από τα δεδοµένα. Στο ανάδροµο
πέρασµα συµβαίνει το αντίθετο: οι παράµετροι
p i , q i ,ri διατηρούνται σταθερές και
µεταβάλλονται οι a i , bi , c i .
To δίκτυο ANFIS παρουσιάζει µειονεκτήµατα που εµφανίζουν τα νευρωνικά δίκτυα.
Κατά την φάση εκµάθησης, υπερβολική εκπαίδευση (overtraining), θα έχει σαν
αποτέλεσµα το δίκτυο να "µάθει" να αντιστοιχεί και την παραµικρή µεταβολή από τον
χώρο εισόδου, η οποία µπορεί να οφείλεται σε θόρυβο, µε συνέπεια να µην µπορεί να
γενικεύσει (generalise) µε επιτυχία την αντιστοιχία εισόδου-εξόδου σε νέα δεδοµένα. Αυτό
έχει ως αποτέλεσµα
το δίκτυο να έχει πολύ καλές επιδόσεις στην ταξινόµηση των
παραδειγµάτων, αλλά να αδυνατεί να κατηγοριοποιήσει νέα δεδοµένα.
Υπάρχουν αρκετές σχεδιαστικές παράµετροι όπως είναι η επιλογή του αριθµού των
συναρτήσεων συµµετοχής
που επηρεάζουν την επίδοση του δικτύου (το σχήµα των
συναρτήσεων βελτιστοποιείται κατά την διάρκεια του αλγορίθµου). Οµέγιστος αριθµός
κανόνων υπολογίζεται σύµφωνα µε τον τύπο,
Rules = Mfsinputs
(4.28)
όπου Rules είναι το πλήθος των κανόνων, Mfs είναι το πλήθος των συναρτήσεων
συµµετοχής και inputs είναι ο αριθµός των εισόδων, τότε πολύ εύκολα φαίνεται ότι για
µεγάλο αριθµό εισόδων θα αυξηθεί υπερβολικά το µέγεθος του δικτύου και συνεπώς θα
πολλαπλασιαστούν οι αντίστοιχοι υπολογισµοί. Το πρόβληµα που είναι ήδη γνωστό από
την θεωρία δικτύων ως "κατάρα των διαστάσεων" ("curse of dimensionality") [Bellman
60
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
(1961)], δεν αντιµετωπίζεται εύκολα και γι' αυτό το δίκτυο θα πρέπει να εφαρµοστεί µετά
από µείωση του αριθµού των εισόδων.
Το βασικό όµως πλεονέκτηµα του δικτύου ANFIS είναι ότι αν επιτευχθεί η
αποµόνωση κάποιων σηµαντικών χαρακτηριστικών (µε κριτήριο την διαχωρισιµότητα)
και αν επιβεβαιωθεί η αντιστοίχηση µε αρκετά παραδείγµατα, είναι δυνατόν να
µετατραπεί η επαγωγική διαδικασία σε µια µορφή που είναι αρκετά πιο κοντά στην
ανθρώπινη. Η απόφαση ταξινόµησης µπορεί να γίνεται µε κανόνες όπως ο ακόλουθος:
ΕΑΝ f1=A1 ΚΑΙ f2=A2 ΚΑΙ…fd=Ad ΤΟΤΕ xi∈ wj(µj)
(4.29)
ο οποίος µεταφράζεται µε την πρόταση: "αν τα χαρακτηριστικά f1…fd του
αντικειµένου xi πάρουν τις τιµές A1… Ad, τότε το xi ανήκει στην κλάση wj µε βαθµό
συµµετοχής µj". Πρέπει να παρατηρηθεί ότι στην ουσία, οι τιµές των χαρακτηριστικών οι
οποίες είναι καθαρές τιµές (crisp) αποδίδονται στα ασαφή σύνολα A1… Ad, των οποίων η
µορφή των συναρτήσεων συµµετοχής έχει αναπροσαρµοστεί κατά την εκµάθηση του
αλγορίθµου, πριν ενεργοποιηθεί ο κανόνας που θα αποδώσει το αντικείµενο στην κλάση
του. Το αποτέλεσµα της κατηγοριοποίησης µέσω του ANFIS µε την µορφή συνάρτησης
συµµετοχής υπερτερεί από µια κατηγοριοποίηση µε αδιαφανή διαδικασία που παράγουν
τα περισσότερα νευρωνικά δίκτυα, γιατί δίνει την δυνατότητα προσδιορισµού της
ποιότητας της ταξινόµησης (όσο πιο υψηλή είναι η συνάρτηση συµµετοχής τόσο πιο καλή
είναι η κατηγοριοποίηση). Αυτό δίνει την δυνατότητα είτε χαρακτηρισµού της ποιότητας
των παραδειγµάτων, είτε καθορισµού "γκρίζων" περιοχών όπου θα αναβάλλεται η
απόφαση ταξινόµησης για τα αντικείµενα ελέγχου και θα προωθούνται για πιο ενδελεχή
επανεξέταση µε κλασικές µεθόδους.
4.9 Ο αλγόριθµος ID3
Ο ID3 είναι ένας αλγόριθµος κατάταξης γνωστός για την απλότητα και την
αποτελεσµατικότητά του [Quinlan, (1986)], ο οποίος κατασκευάζει κανόνες διαχωρισµού
µεταξύ κλάσεων έχοντας ως είσοδο ένα σύνολο παραδειγµάτων. Ο αλγόριθµος
61
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
διαχειρίζεται τα παραδείγµατα και τις τιµές των χαρακτηριστικών και παράγει ένα σύνολο
κανόνων µε µορφή δέντρου απόφασης. Οι κόµβοι του δέντρου αντιστοιχούν σε ελέγχους
τιµών χαρακτηριστικών ενώ τα κλαδιά του δέντρου είναι οι δυνατές τιµές των αντίστοιχων
χαρακτηριστικών. Κάθε φύλλο αναπαριστά µια κλάση και κάθε µονοπάτι από τη ρίζα ως
ένα φύλλο του δέντρου αποτελεί και έναν κανόνα κατάταξης παραδειγµάτων σε µία
κλάση.
Ο ID3 είναι αναδροµικός αλγόριθµος και ο διαχωρισµός µεταξύ παραδειγµάτων
διαφορετικών κλάσεων γίνεται µε τη µεγιστοποίηση µιας συνάρτησης υπολογισµού της
πληροφοριακής ισχύος των χαρακτηριστικών των παραδειγµάτων. Πρακτικά, ένα
χαρακτηριστικό έχει τόσο µεγαλύτερη πληροφοριακή ισχύ, όσο οι τιµές του στο σύνολο
των παραδειγµάτων επιτυγχάνουν όσο το δυνατό µεγαλύτερο διαχωρισµό µεταξύ των
παραδειγµάτων που ανήκουν σε διαφορετική κλάση. Το χαρακτηριστικό µε τη µεγαλύτερη
πληροφοριακή ισχύ καθίσταται κόµβος του δέντρου και δηµιουργούνται τόσα κλαδιά,
όσες και οι τιµές του. Το σύνολο των παραδειγµάτων χωρίζεται σε τόσα υποσύνολα, όσες
και οι οµάδες παραδειγµάτων που έχουν µία συγκεκριµένη τιµή στο χαρακτηριστικό που
επιλέχτηκε και κάθε υποσύνολο ορίζεται ως το σύνολο παραδειγµάτων για τον αντίστοιχο
κλάδο του δέντρου απόφασης. Σε κάθε βήµα ο αλγόριθµος ID3 προσπαθεί να
δηµιουργήσει υποσύνολα του αρχικού συνόλου παραδειγµάτων, έτσι ώστε τα
παραδείγµατα κάθε υποσυνόλου να ανήκουν σε µία και µόνο κλάση.
Ο αλγόριθµος σε µεταγενέστερες µορφές του ενισχύθηκε µε µηχανισµούς
αντιµετώπισης ειδικών σχέσεων εξαρτήσεων χαρακτηριστικών που αποτελούσαν το
κυριότερο αδύνατο σηµείο του, στην αρχική του έκδοση. Έτσι στον NewID [Quinlan,
(1986)] ορίστηκε µία σχέση διάταξης κατά την επιλογή των χαρακτηριστικών (ordering)
καθώς και τρόποι αντιµετώπισης άγνωστων τιµών χαρακτηριστικών. Στον IDDD [Gaga et
al., (1993), ∆ούνιας (1995)], εισήχθηκαν σχέσεις εξάρτησης (dependencies) µεταξύ
χαρακτηριστικών όπως "απλές εξαρτήσεις" ή "εξαρτήσεις αποκλεισµού". Άλλες εκδόσεις
του ΙD3 αποτελούν οι ID5 [Utgoff, (1991)] και EG2 [Nunez (1991)] που χρησιµεύουν ως
εργαλεία αυτόµατης πρόσληψης δεδοµένων καθώς και η πιο βελτιωµένη και πρόσφατη
έκδοση του, C4.5, [Quinlan (1993)]. Η έκδοση που χρησιµοποιείται στην παρούσα
εργασία είναι αυτή του ΝewId (θα τον αναφέρουµε πάντως ως ID3 για ευκολία) και η
62
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
υπολογιστική του υλοποίηση στη µορφή αυτή οφείλεται στην οµάδα του ινστιτούτου
Turing (1993).
Στην συνέχεια, παρατίθεται ένα παράδειγµα [Quinlan, (1986)] όπου παρουσιάζονται
στην αρχή για απλούστευση δύο µόνο κλάσεις. Έστω ότι το σύνολο των Ν παραδειγµάτων
περιέχει ew1 παραδείγµατα της κλάσης w1 και ew2 παραδείγµατα της κλάσης w2. Έστω
ακόµα ότι :
1.
Κάθε σωστό δέντρο απόφασης κατατάσσει τα παραδείγµατα µε αναλογία ίδια
αυτής του συνόλου εκπαίδευσης. Ένα τυχαίο παράδειγµα ανήκει στην κλάση w1 µε
πιθανότητα ew1 /(ew1+ew2) και στην κλάση w2 µε πιθανότητα ew2 /(ew1+ ew2).
2.
Το δέντρο απόφασης χρησιµοποιείται για να κατατάξει παραδείγµατα στην
κλάση w1 ή w2. Έτσι θεωρείται ως γεννήτρια µηνυµάτων w1 και w2 και η απαιτούµενη
πληροφορία (σε bit) για τη δηµιουργία αυτών των µηνυµάτων σύµφωνα µε την θεωρία
πληροφοριών είναι:
I (ew1 , ew 2 ) = −
ew 2
ew1
ew 2
ew1
log 2
log 2
−
ew1 + ew 2
ew1 + ew 2 ew1 + ew 2
ew1 + ew 2
(4.30)
Αντίστοιχα, γενικεύοντας για w1,...,wk δυνατές κλάσεις και ew1,...,ewk πλήθος
παραδειγµάτων κάθε κλάσης, έχουµε :
ewi
k
I ( ew1 ,..., ew k ) = − ∑
i =1
∑
k
ew j
j =1
log 2
ew i
∑
k
ew j
j =1
(4.31)
Αν το πεδίο τιµών του χαρακτηριστικού f, χωριστεί σε fa1, fa2, ...,fau περιοχές τότε
το σύνολο των N παραδειγµάτων διαιρείται σε u αντίστοιχα υποσύνολα όπου καθένα
περιέχει τα παραδείγµατα που για το χαρακτηριστικό f, βρίσκονται στην περιοχή τιµών faj,
j=1...u.
Έστω πάλι για λόγους απλούστευσης k=2 (δύο κλάσεις) και η περιοχή faj, j=1...u,
περιέχει ew1j παραδείγµατα της κλάσης w1 και ew2j της κλάσης w2. Η απαιτούµενη
πληροφορία κατάταξης στην w1 ή στην w2 χρησιµοποιώντας τα παραδείγµατα που
63
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
εµφανίζουν τιµές στις περιοχές faj σύµφωνα µε την σχέση (4.30), είναι Ι(ew1j, ew2j).
Συνολικά για όλες τις περιοχές τιµών του χαρακτηριστικού f, η απαιτούµενη πληροφορία
κατάταξης στην w1 ή στην w2 µετριέται µε την ακόλουθη συνάρτηση εντροπίας:
∑
E( f ) = ∑
∑
u
j =1
k
i =1
k
ewij
ewi
i =1
I ( ew1 j , ew2 j ,K , ewkj )
(4.32)
Η δε ποσότητα,
gain( f ) = I ( ew1 , ew2 ,K , ewk ) − E( f )
(4.33)
ορίζεται ως η πληροφοριακή ισχύς του χαρακτηριστικού f.
Ο αλγόριθµος υπολογίζει την πληροφοριακή ισχύ κάθε χαρακτηριστικού και
επιλέγει εκείνο µε την µεγαλύτερη πληροφοριακή ισχύ, που το ονοµάζουµε πιο
διαχωριστικό, ή πιο πληροφοριακό. Αυτό το χαρακτηριστικό γίνεται κόµβος του δέντρου,
δηµιουργούνται τόσα κλαδιά όσες και οι δυνατές τιµές του και τα παραδείγµατα
χωρίζονται στα αντίστοιχα υποσύνολα. Σε περίπτωση που δύο ή περισσότερα
χαρακτηριστικά έχουν την ίδια πληροφοριακή ισχύ, επιλέγεται όποιο εµφανίζεται πρώτο
στην περιγραφή της εφαρµογής.
Αν και η αρχική µορφή του ID3 επεξεργαζόταν µόνο ονοµαστικές (nominal) τιµές
χαρακτηριστικών, οι µεταγενέστερες εκδόσεις του (NewId) προβλέπουν την αντιµετώπιση
χαρακτηριστικών µε αριθµητικές τιµές, πραγµατικές ή ακέραιες. Συγκεκριµένα όταν ένα
αριθµητικό χαρακτηριστικό επιλέγεται ως κόµβος του δένδρου, υπολογίζεται στατιστικά
από τα παραδείγµατα εκείνη η αριθµητική τιµή που διαχωρίζει καλύτερα τις κλάσεις, η
οποία ονοµάζεται σηµείο διαχωρισµού (split point). ∆ηµιουργείται τότε ένας κλάδος για
τα παραδείγµατα µε τιµές χαρακτηριστικού µεγαλύτερες του σηµείου διαχωρισµού κι ένας
κλάδος µε τιµές µικρότερες αυτού. Ο τρόπος που γίνεται ο διαχωρισµός σε περίπτωση
αριθµητικών τιµών χαρακτηριστικών έχει γίνει αντικείµενο εκτενούς µελέτης στη
βιβλιογραφία λόγω της ιδιαιτερότητάς του ανάλογα µε το χώρο εφαρµογής [Fayyad &
Irani (1992), Van de Merckt (1992), Spangler et al. (1992)].
64
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Αν το πεδίο τιµών διαιρεθεί σε δύο περιοχές, δηλαδή fa1 και fa2 (u=2), τότε κάθε
κόµβος του δένδρου διαιρείται σε δύο κλάδους. Ορίζοντας αsplit (σηµείο διαχωρισµού),
την τιµή του χαρακτηριστικού f που διαχωρίζει το πεδίο τιµών σε fa1και fa2 περιοχές, τότε
βάσει των ανισοτήτων,
asplit ≤ α(f)
(4.33a)
asplit > α(f)
(4.33b)
και
κάθε κόµβος του δένδρου χωρίζεται σε δύο κλάδους όπου κάθε κλάδος επαληθεύει
συγκεκριµένο αριθµό παραδειγµάτων από κάθε κλάση. Το δένδρο απόφασης για ένα µόνο
χαρακτηριστικό f είναι της µορφής του σχήµατος 4.7.
Σχήµα 4.7 ∆ιαχωρισµός κλάσεων µε βάση το σηµείο διαχωρισµού
Γενικεύοντας
για
περισσότερα
χαρακτηριστικά,
το
δένδρο
απόφασης
κατασκευάζεται τοποθετώντας στην ρίζα το χαρακτηριστικό µε την µεγαλύτερη
πληροφορική ισχύ. Το σηµείο διαχωρισµού για το χαρακτηριστικό αυτό διαχωρίζει τα
παραδείγµατα σε δύο υποσύνολα. Το επόµενο πιο πληροφοριακό χαρακτηριστικό
τοποθετείται ως κόµβος χωρίζοντας πάλι τα παραδείγµατα και η διαδικασία
επαναλαµβάνεται έως ότου καταλήξουµε σε κόµβο µε παραδείγµατα από µία κλάση. Στην
χειρότερη περίπτωση ο κόµβος που καταλήγει το δένδρο (φύλλο) επαληθεύει ένα µόνο
παράδειγµα από µία κλάση.
65
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Στην συγκεκριµένη εφαρµογή ο αλγόριθµος χρησιµοποιήθηκε για την εξαγωγή των
διακριτικών χαρακτηριστικών και όχι για την ταξινόµηση των δεδοµένων. Ενδιαφέρει
δηλαδή να προσδιοριστούν τα χαρακτηριστικά που προσφέρουν ικανοποιητικό
διαχωρισµό των κλάσεων, ή αν έχουν επιλεχθεί µε άλλη µέθοδο, να αξιολογηθεί αυτή η
επιλογή µε κριτήριο την πληροφοριακή τους ισχύ. Με αυτή την λογική, µειώνονται τα
χαρακτηριστικά είτε στα απολύτως απαραίτητα που προσφέρουν σύµφωνα µε τον ID3
δυνατότητα διαχωρισµού, είτε επιλέγονται τα d περισσότερο διαχωριστικά που θα
επιτρέψουν στον ταξινοµητή στην επόµενη φάση να επιτελέσει ικανοποιητική ταξινόµηση.
Η επιλογή των χαρακτηριστικών γίνεται µε βάση τα ακόλουθα κριτήρια:
Πληροφοριακή ισχύς: τα χαρακτηριστικά όσο πιο κοντά βρίσκονται στην ρίζα του
δένδρου απόφασης, τόσο περισσότερη πληροφοριακή ισχύ διαχωρισµού εµπεριέχουν.
Συχνότητα εµφάνισης στο δένδρο απόφασης: η εµφάνιση κάποιου χαρακτηριστικού
σε πολλές θέσεις του δένδρου, δηλώνει ότι το χαρακτηριστικό έχει βαρύνουσα σηµασία
στην διαδικασία διαχωρισµού.
66
ΘΕΩΡΗΤΙΚΟ ΥΠΟΒΑΘΡΟ
Επιβεβαίωση
πολλών
παραδειγµάτων:
όσο
περισσότερα
παραδείγµατα
επαληθεύονται στην απόληξη του δένδρου µέσω ενός χαρακτηριστικού, τόσο πιο καλή
γενίκευση του διαχωρισµού προσφέρει.
Συνοψίζοντας παρατίθεται το διάγραµµα 4.9, που παρουσιάζει τον τρόπο µε τον
οποίο η θεωρία που παρουσιάστηκε σ' αυτή την ενότητα θα εφαρµοστεί σύµφωνα µε τα
στάδια που αναπτύχθηκαν στο κεφάλαιο 2.4.
67
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
5
Ανάπτυξη
ενός
αυτοµατοποιηµένου
συστήµατος ταξινόµησης
5.1 Εισαγωγή
Στις προηγούµενες ενότητες αναπτύχθηκαν το θεωρητικό υπόβαθρο και τα κίνητρα
για την πραγµατοποίηση αυτής της εργασίας. Ο στόχος αυτού του κεφαλαίου είναι να
παρουσιάσει τον τρόπο µε τον οποίο οι µέθοδοι που αναπτύχθηκαν µπορούν να
συνδυαστούν, ώστε να αναπτυχθεί ένα πρωτότυπο σύστηµα µε ικανοποιητικές επιδόσεις,
το οποίο να µπορεί να διαγνώσει σε βιοµηχανική γραµµή παραγωγής βλάβες
συναρµολόγησης πλυντηρίων. Έτσι θα περιγραφούν η µεθοδολογία και τα πρακτικά
προβλήµατα
που
παρουσιάστηκαν
σ'
αυτή
την
προσπάθεια.
Παρά
το
ότι
χρησιµοποιήθηκαν δεδοµένα που αφορούσαν συγκεκριµένα προϊόντα (πλυντήρια)
ευελπιστούµε ότι η µεθοδολογία έχει εφαρµογή σε γραµµή παραγωγής παροµοίων
ηλεκτροµηχανικών συστηµάτων που περιέχουν κινητήρες.
Τα βασικά στάδια που περιλαµβάνει ο σχεδιασµός του συστήµατος τα οποία
αναπτύχθηκαν στο κεφάλαιο 0 και ιδιαίτερα αυτό της επιλογής των χαρακτηριστικών και
του ταξινοµητή επικαλύπτονται µε τέτοιο τρόπο, που τα αποτελέσµατα τα οποία
προκύπτουν στις φάσεις αυτές αλληλεπιδρούν αναµεταξύ τους. Έτσι, η επιλογή των
χαρακτηριστικών θεωρείται επιτυχής ανάλογα µε τα αποτελέσµατα που δίνει ο
ταξινοµητής. Αλλά και αντίστροφα, η επιτυχία του ταξινοµητή εξαρτάται από την επιλογή
των κατάλληλων χαρακτηριστικών.
68
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
5.2 Προτεινόµενη µοντελοποίηση και ορισµός του προβλήµατος
Θεωρείται ότι στο συγκεκριµένο πρόβληµα υπάρχουν l αισθητήρες µέτρησης. Κάθε
αισθητήρας δίδει nο µετρήσεις σηµείων δειγµατοληψίας, κάθε φορά που εξετάζεται µια
µηχανή τύπου j, από k διαφορετικές περιπτώσεις (καταστάσεις ή κλάσεις µηχανής). Έτσι
για κάθε εξεταζόµενη µηχανή σχηµατίζεται ο πίνακας,
X o, j
⎡ x o ( 1 ) ⎤ ⎡ x o ( 1,1 ) x o ( 1,2 )
⎢ x ( 2 )⎥ ⎢ x ( 2 ,1 ) x ( 2 ,2 )
o
⎥=⎢ o
=⎢ o
⎢ L ⎥ ⎢ L
L
⎢
⎥ ⎢
⎣ x o ( l ) ⎦ ⎣ x o ( l ,1 ) x o ( l ,2 )
L x o ( 1, n o ) ⎤
L x o ( 2 , n o )⎥
⎥
L
L ⎥
⎥
L xo ( l ,no ) ⎦
(5.1)
όπου µε τον δείκτη o δηλώνεται ότι πρόκειται για το πλήρες σήµα της µέτρησης, το
οποίο αντιστοιχεί σε όλες τις περιοχές στροφών του κινητήρα όπως αυτές έχουν
περιγραφεί στο κεφάλαιο 3.5. Στην περίπτωση της εργασίας αυτής, l=1,…,12 (σηµεία
µέτρησης), nο≅40000 (σηµεία δειγµατοληψίας από τους αισθητήρες στο πεδίο του
χρόνου), και j=1,…,5 (οι εξεταζόµενες πιθανές διαφορετικές καταστάσεις της µηχανής).
Θεωρείται ακόµα ότι η λήψη των δεδοµένων του πίνακα Χο έχει γίνει ενώ οι στροφές
του κινητήρα (σε rpm) δίνονται από την ακόλουθη χρονοσειρά:
v o ( t ) t = 1,..., n o
(5.2)
Το πρόβληµα λοιπόν µπορεί να τοποθετηθεί ως εξής:
Με δεδοµένα παραδείγµατα Χο από µετρήσεις σε διαφορετικού τύπου µηχανές, να
βρεθούν τα κατάλληλα διαχωριστικά χαρακτηριστικά από το σήµα του Χο και ο
κατάλληλος ταξινοµητής, µέσω των οποίων θα µπορεί να αναγνωριστεί ικανοποιητικά µια
νέα µέτρηση και να καταταχθεί ορθά σε µία από τις προαποφασισµένες κατηγορίες. Σ'
αυτόν τον ορισµό του προβλήµατος ο όρος ικανοποιητικά σηµαίνει ότι το σύστηµα
πετυχαίνει επιδόσεις ορθής ταξινόµησης πάνω από 90%.
69
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
5.3 Προεπεξεργασία του σήµατος
5.3.1 Προσδιορισµός της στάσιµης κατάστασης του περιοδικού σήµατος
Πριν το σήµα µετασχηµατισθεί από το πεδίο του χρόνου στο πεδίο της συχνότητας
µέσω του µετασχηµατισµού Fourier, θα πρέπει να διαχωριστεί η περιοχή στάσιµης
κατάστασης, αφού αποτελεί προϋπόθεση για την εφαρµογή του µετασχηµατισµού η
σχετική στασιµότητα του περιοδικού σήµατος.
Για να επιτευχθεί αυτό κάνουµε αρχικά την παραδοχή ότι η χρονοσειρά των
στροφών του κινητήρα στην περιοχή στάσιµης κατάστασης ακολουθεί κανονική
κατανοµή. Εξετάζοντας ένα κινητό "παράθυρο" δεδοµένων µήκους nW, ορίζεται η
µεταβλητή,
nW −1
W=
1
2
∑ (v
i =1
o
nW
∑ (v
i =1
όπου v o = 1
nW
nW
∑v
i =1
o
( i + 1 ) − v o ( i ))
o
( i ) − vˆ o )
2
(5.3)
2
(i ) είναι ο δειγµατικός µέσος του "παραθύρου". Με βάση την
θεωρία ελέγχου υποθέσεων και εφαρµογές της στην διάγνωση βλαβών [Pouliezos and
Stavrakakis (1994)], αν nW > 25, η µεταβλητή,
u = ( 1 − W ) ( nW − 1 )( nW + 1 ) / 2
(5.4)
ακολουθεί κανονική κατανοµή µε µηδενικό µέσο και µπορούµε να αποφανθούµε για
το αν βρισκόµαστε σε περιοχή στάσιµης κατάστασης ορίζοντας ένα επίπεδο ε έτσι ώστε,
70
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
u>ε : περιοχή όπου οι στροφές του κινητήρα σηµειώνουν αξιόλογη µεταβολή
u<ε : περιοχή όπου οι στροφές του κινητήρα παραµένουν σταθερές
Η εφαρµογή του συγκεκριµένου ελέγχου δεν επιβεβαίωσε ότι η u έχει µηδενικό
µέσο, γεγονός που µάλλον αναιρεί την αρχική παραδοχή, αλλά έδωσε ικανοποιητικά
αποτελέσµατα διαχωρισµού για τιµή του ε=20 (σχήµα 5.1). Στην πράξη επίσης,
παρουσιάζεται το πρόβληµα του υψηλού υπολογιστικού φόρτου αφού θα πρέπει να
υπολογιστούν οι ποσότητες W και u για κάθε σηµείο του σήµατος, γεγονός
που
αποθαρρύνει την χρήση του αλγορίθµου σε λειτουργία πραγµατικού χρόνου. Για να
ξεπεραστεί αυτή η δυσκολία µπορεί να µειωθεί η συχνότητα δειγµατοληψίας µε
αποτέλεσµα να µειωθεί το nο, προσδοκώντας ότι δεν έχουµε κατέβει κάτω από το όριο της
συχνότητας Nyquist. Επίσης, παρατηρώντας ότι ο υπολογισµός της σχέσης (5.3) είναι
επαναληπτικός και ότι στην ουσία κάθε φορά µόνο δύο ποσότητες διαφέρουν (αυτή που
εισάγεται στο "παράθυρο" και αυτή που εξάγεται από αυτό), ο υπολογιστικός φόρτος είναι
δυνατόν να µειωθεί µε κατάλληλες µεταβλητές αποθήκευσης.
71
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Εφαρµόζοντας τον αλγόριθµο µε τις προαναφερθείσες τροποποιήσεις µπορεί να
υπολογιστεί σε ικανοποιητικό χρόνο η χρονοσειρά στάσιµης κατάστασης,
v s ( t ) = v o ( t ) , t = b1 ,...,b f
(5.5)
όπου b1 είναι το σηµείο που ισχύει για πρώτη φορά η ανισότητα u<ε και bf το σηµείο
που παύει να ισχύει. Με το ίδιο σκεπτικό αποµονώνεται η περιoχή των δεδοµένων του
υποπίνακα του Χο, της (5.1) για κάθε µηχανή τύπου j, στα n σηµεία που ισχύει η µόνιµη
κατάσταση,
X s,j
⎡ x s ( 1 ) ⎤ ⎡ x s ( 1,1 ) x s ( 1,2 )
⎢ x ( 2 )⎥ ⎢ x ( 2 ,1 ) x ( 2 ,2 )
s
⎥=⎢ s
=⎢ s
⎢ L ⎥ ⎢ L
L
⎢
⎥ ⎢
⎣ x s ( k )⎦ ⎣ x s ( k ,1 ) x s ( k ,2 )
72
x s ( 1, n ) ⎤
L x s ( 2 , n )⎥
⎥
L
L ⎥
⎥
L x s ( k , n )⎦
L
(5.6)
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Το σήµα στην συνέχεια κανονικοποιήθηκε µε βάση την σχέση (4.4) Έτσι, ισχύει ότι
µια µονάδα στο πεδίο του χρόνου αντιστοιχεί σε µια µονάδα στο πεδίο της συχνότητας.
Αυτό σηµαίνει για παράδειγµα, ότι µια µονάδα ενός ηµιτονοειδούς σήµατος στο πεδίο του
χρόνου, αντιστοιχεί σε µια µονάδα στο πεδίο της συχνότητας. Για να εφαρµόζεται
αλγόριθµος FFT, επιλέχθηκε αριθµός σηµείων n=214=16384, ώστε να ταυτίζεται µε
κάποια δύναµη του δύο. Απ' αυτά τα 1240 αντιστοιχούν στην περιοχή συχνοτήτων 0150Hz. Ένα παράδειγµα φάσµατος µε βάση τα προαναφερθέντα για µια µηχανή χωρίς
βλάβη (τύπου z) και για το σηµείο µέτρησης 6 παρουσιάζεται στο σχήµα 5.2.
5.4 Επιλογή χαρακτηριστικών
Όπως έχει ήδη επισηµανθεί, το πιο δύσκολο στάδιο στην ανάπτυξη αυτού του
αυτοµατοποιηµένου συστήµατος ταξινόµησης, είναι η επιλογή χαρακτηριστικών τέτοιων
ώστε να µπορούν να τροφοδοτήσουν τον κατάλληλο ταξινοµητή, µε σκοπό να ληφθεί η
απόφαση για την κατάταξη της µηχανής στην κατάλληλη κλάση. ∆εν υπάρχει στην
73
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
βιβλιογραφία θεωρία που να προσδιορίζει µια συγκεκριµένη µεθοδολογία για την επιλογή
των κατάλληλων χαρακτηριστικών και γι' αυτό κάθε προσέγγιση εκτός από την περίπτωση
που έχουµε εµφανή διαχωριστικά χαρακτηριστικά µπορεί να θεωρηθεί καινοτοµική.
Υπάρχουν βέβαια περιπτώσεις που τα χαρακτηριστικά αυτά είναι προφανή αφού γίνει η
µετατροπή του σήµατος στο πεδίο της συχνότητας [Tate (1996)], αλλά αυτό εξαρτάται από
το είδος της συγκεκριµένης εφαρµογής και την επιλογή των χαρακτηριστικών. Συνεπώς η
προσέγγιση που επιλέχθηκε βασίζεται στην λογική επιλογή χαρακτηριστικών που
αναµένεται να δώσουν επαρκή διαχωρισµό των κλάσεων και ανάλογα µε την επιτυχία που
θα έχουν σε διαφορετικούς ταξινοµητές, υποδεικνύεται το πιθανό επόµενο βήµα για
βελτίωση.
Πριν προχωρήσουµε στην επιλογή χαρακτηριστικών, έγιναν µερικές παρατηρήσεις
που αφορούσαν την µορφή του σήµατος στο πεδίο της συχνότητας. Με απλή παρατήρηση
προκύπτει, πως δεν υπάρχουν σηµαντικές συνιστώσες στο πεδίο της συχνότητας για
περιοχές άνω των 150Hz (σχήµα 5.3). Παρατηρούνται βέβαια συνιστώσες στο φάσµα άνω
των 150 Hz, όπως κάποιες αρµονικές των 50Ηz (µε σηµαντικότερη αυτή των 200 Hz),
αλλά από ενδεικτικά αποτελέσµατα δεν φαίνεται εµπεριέχουν διακριτικά χαρακητριστικά.
Οι όποιες ελάχιστες συνιστώσες παρατηρούνται πάνω από την συχνότητα των 150Hz
αποδίδονται σε θόρυβο ή σε αρµονικές που όµως δεν µπορούν να δώσουν χρήσιµη
πληροφορία καθώς είναι εξαιρετικά χαµηλού πλάτους. Γενικά πάντως, η παράθεση
φασµάτων από παραδείγµατα των κλάσεων των µηχανών δεν έδωσε προφανή
διαχωριστικά χαρακτηριστικά βασισµένα στον απλό οπτικό έλεγχο.
74
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Σχήµα 5.3 Οι σηµαντικές συνιστώσες στο πεδίο της συχνότητας εµφανίζονται στην περιοχή 0-150Hz
5.4.1 Μέγιστα φάσµατος (κορυφές)
Η αρχική ιδέα για τον εντοπισµό διακριτικών χαρακτηριστικών ήταν να εξετασθεί η
πληροφορία που πιθανώς εµπεριέχεται στα µέγιστα του φάσµατος. Τα µέγιστα του
φάσµατος στο πεδίο της συχνότητας που προκύπτoυν µετά από µετασχηµατισµό Fourier
όπως ήδη αναφέρθηκε στο κεφάλαιο 0, εκφράζουν τις χαρακτηριστικές συχνότητες του
περιοδικού σήµατος. Με
δεδοµένη την υψηλή συχνότητα δειγµατοληψίας (2KHz) η
ανάλυση στο πεδίο των συχνοτήτων είναι περίπου 0.1Hz και θεωρείται ικανοποιητική. Αν
θεωρήσουµε το σήµα X στο πεδίο των συχνοτήτων, τότε ως κορυφές ή τοπικά µέγιστα
του φάσµατος τάξης j ορίζονται τα σηµεία,
X i = max(X i − j ...X i ...X i + j )
75
(5.7)
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Τα σηµαντικότερα (µεγαλύτερα) απ΄ αυτά τα µέγιστα του πλάτους και οι αντίστοιχες
συχνότητες, αποτελούν πιθανά διακριτικά χαρακτηριστικά αφού αναµένεται ότι τυχόν
βλάβες θα προκαλέσουν αυξοµειώσεις του πλάτους, ή µετατοπίσεις στον άξονα της
συχνότητας των κορυφών αυτών. Ενώ το σύνολο των κορυφών είναι της τάξης του 102, οι
σηµαντικές κορυφές είναι σαφώς λιγότερες µε συνέπεια να περιοριζόµαστε για λόγους
οικονοµίας υπολογισµών αρχικά στις δέκα και στην συνέχεια στις οκτώ σηµαντικότερες.
Πρέπει να σηµειωθεί, ότι οι κορυφές στο φάσµα αντιστοιχούν σε περιοχές µε έντονο
ενεργειακό περιεχόµενο και µάλιστα ανάλογο του τετραγώνου του πλάτους της
συνιστώσας της συχνότητας. Αν θεωρηθεί ότι µια βλάβη συνδέεται µε έντονο ενεργειακό
περιεχόµενο, τότε είναι λογικό να
εξετασθούν αυτές οι περιοχές συχνοτήτων ως
υποψήφιες για διαχωριστικά χαρακτηριστικά. Έτσι τα ζεύγη πλάτη-συχνότητες που
εµφανίστηκαν τα µέγιστα αποτέλεσαν την πρώτη προσέγγιση για την εύρεση
χαρακτηριστικών. Επίσης, εξετάσθηκαν ως πιθανά διαχωριστικά χαρακτηριστικά µόνο τα
µέγιστα ή µόνο οι συχνότητες εµφάνισης των σηµαντικότερων µεγίστων.
5.4.2 Χρήση KDE για την εξέταση των µεγίστων του φάσµατος
Όπως αναπτύχθηκε στο κεφάλαιο 0, µε την χρήση KDE είναι δυνατόν να
υποδειχθούν περιοχές στο επίπεδο όπου παρατηρείται υψηλή συγκέντρωση δεδοµένων.
Στην εργασία χρησιµοποιήθηκε η µεθοδολογία αυτή, για να προσδιοριστούν τέτοιες
περιοχές υψηλής συγκέντρωσης στο φάσµα, θεωρώντας όµως ως δεδοµένα µόνο τα
σηµαντικά µέγιστα όπως αυτά ορίσθηκαν στην προηγούµενη ενότητα και όχι όλα τα
σηµεία του φάσµατος για λόγους οικονοµίας των απαιτούµενων υπολογισµών. Έτσι,
εξετάσθηκαν οι συγκεντρώσεις των σηµαντικών κορυφών και µε την εφαρµογή των
ισοϋψών προσδιορίστηκαν οι περιοχές υψηλής συγκέντρωσης για δεδοµένα που
αφορούσαν µηχανές ίδιου τύπου και µετρήσεις που ελήφθησαν από το ίδιο σηµείο.
Η χρήση των KDE είχε δύο στόχους:
Ο πρώτος είναι ο προσδιορισµός περιοχών πλάτους-συχνότητας, χαρακτηριστικών
για την κάθε κατηγορία, έτσι ώστε να σχηµατιστεί ένας "χάρτης" των περιοχών των
76
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
κατηγοριών
που µας ενδιαφέρουν να αναγνωρίσουµε στην συνέχεια µέσω της
ταξινόµησης.
Ο δεύτερος στόχος ήταν να συγκρίνουµε τις περιοχές των κατηγοριών και στην
περίπτωση που δεν επικαλύπτονται να θεωρήσουµε ότι αποτελούν χαρακτηριστικές
περιοχές διάκρισης µεταξύ των κατηγοριών και συνεπώς τα αντίστοιχα πλάτη-συχνότητες
είναι τα ζητούµενα διακριτικά χαρακτηριστικά.
Για να υλοποιηθούν οι προαναφερθέντες στόχοι, σχηµατίσθηκαν οι KDE µε βάση
την κανονική κατανοµή, των δέκα σηµαντικότερων κορυφών για κάθε δείγµα από τις
κατηγορίες προς εξέταση. Ένα παράδειγµα µιας τέτοιας τρισδιάστατης απεικόνισης όπου
στον z-άξονα παρουσιάζεται η ποσοστιαία πυκνότητα των δεδοµένων φαίνεται στο σχήµα
5.4. Σ' αυτήν την περίπτωση παρουσιάζεται η κατανοµή της πυκνότητας που είχαν οι δέκα
σηµαντικότερες κορυφές όλων των δειγµάτων µηχανών τύπου b για το σηµείο µέτρησης 1.
Στην αναπαράσταση της KDE χρησιµοποιήθηκε ως συνάρτηση πυρήνα η κανονική
κατανοµή και ορίσθηκε h=[1 , 0.01] για λόγους καλύτερης εποπτείας.
77
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
∆υστυχώς, µετά από ενδελεχή παρατήρηση των KDE για κάθε σηµείο και για κάθε
τύπο µηχανής δεν προέκυψαν προφανή διακριτικά χαρακτηριστικά. Η παράθεση των
περιοχών υψηλής συγκέντρωσης για κάθε κατηγορία συνήθως επικαλύπτονταν και η
ύπαρξη αρκετών σηµείων εκτός των περιοχών που όριζαν οι ισοϋψείς οδηγούσε στο
συµπέρασµα ότι οι περιοχές αυτές δεν αποτελούν κριτήριο διαχωρισµού. Στο σχήµα 5.5
παρουσιάζεται ένα χαρακτηριστικό παράδειγµα µιας τέτοιας σύγκρισης. Απεικονίζονται οι
ισοϋψείς των KDE µε συνάρτηση πυρήνα την κανονική κατανοµή, οι οποίες περικλείουν
το 90% των δέκα σηµαντικότερων κορυφών του φάσµατος για τις κατηγορίες z,b,h,m,p
στο σηµείο µέτρησης 2. Η µεταβλητή h επιλέχθηκε στο 1Hz για τον άξονα x και 1⋅10-2mm
στον άξονα y για όλες τις κατηγορίες, πάλι για λόγους καλύτερης εποπτείας.
Σχήµα 5.5 Παράθεση των ισοϋψών KDE (σε ποσοστό 90%) για τα δέκα σηµαντικότερα τοπικά
µέγιστα στο φάσµα όλων των δειγµάτων µηχανών τύπου z,b,hm,p στο σηµείο µέτρησης 2
78
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
5.4.3 Περιττές αρµονικές
Είναι φανερό από το σχήµα 5.5 αλλά και από τις παρατηρήσεις στα υπόλοιπα σηµεία
ότι τα σηµαντικά µέγιστα κατανέµονται σε συγκεκριµένες περιοχές συχνοτήτων οι οποίες
είναι πολλαπλάσια µιας βασικής συχνότητας. Η βασική αυτή συχνότητα είναι 6.8 Hz,
αλλά γενικά µπορεί να κυµαίνεται 6-7.5 Hz και αντιστοιχεί στην συχνότητα περιστροφής
του κάδου (≅ 400 rpm). Το γεγονός αυτό θεωρείται αναµενόµενο αφού η γενεσιουργός
αιτία των περιοδικών σηµάτων που εµφανίζονται στο φάσµα, είναι η περιστροφή του
κινητήρα του πλυντηρίου µε αυτό τον αριθµό στροφών.
Συγκεκριµένα παρατηρήθηκαν σηµαντικά µέγιστα στα περιττά πολλαπλάσια της
βασικής συχνότητας (περιττές αρµονικές). Πρακτικά, το γεγονός ότι η βασική συχνότητα
δεν είναι η ίδια σε κάθε δείγµα έχει ως συνέπεια να µην είναι εύκολο να προσδιοριστούν
επακριβώς οι συχνότητες οι οποίες αποτελούν τις περιττές αρµονικές. Έτσι είναι δυνατόν
να οριστούν περιοχές συχνοτήτων στις οποίες αναµένεται να παρουσιαστεί η βασική
συχνότητα και αντίστοιχα περιοχές των περιττών αρµονικών στις οποίες πιθανώς θα
παρουσιαστούν σηµαντικά µέγιστα. Στην πράξη ορίστηκε µια περιοχή 6.7Hz±mHz όπου
µετά από πειραµατισµό µε την τιµή του m, η βασική συχνότητα εντοπίστηκε πάντα στο
διάστηµα 6.7Hz±1Hz. Έτσι, αν οριστεί ως a ( f ) το πλάτος α που εµφανίζεται στην
συχνότητα f τότε µε τον ακόλουθο τύπο,
f i = f (max([a (6.7i − mi )...a (6.7i + mi )])) i=3,5,7,9,…
(5.8)
οι τιµές fi αντιπροσωπεύουν για i=1 την βασική συχνότητα και για i=3,5,7,…τις
περιττές αρµονικές. Στην ουσία ορίζεται µια περιοχή κοντά στην βασική συχνότητα
µεταξύ συγκεκριµένων ορίων και θεωρείται ως βασική συχνότητα η εντός των ορίων
υπάρχουσα µέγιστη κορυφή. Αντίστοιχα, περιττές αρµονικές θεωρούνται οι συχνότητες
εµφάνισης µεγίστων µέσα στις περιοχές που ορίζουν τα περιττά πολλαπλάσια των ορίων.
Τα χαρακτηριστικά που επιλέγονται σ' αυτή την περίπτωση είναι οι κορυφές (πλάτη), που
παρατηρούνται σ' αυτές τις περιττές αρµονικές. Οι άρτιες αρµονικές πιθανότατα να
αλληλοαναιρούνται.
79
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
5.4.4 Χρήση του αλγορίθµου ID για εύρεση σηµείων µε πληροφορία στο
φάσµα
Όπως αναφέρθηκε στο κεφάλαιο 0, ο αλγόριθµος ID παράγει ένα σύνολο κανόνων
µε τη µορφή δέντρου απόφασης, στο οποίο οι κόµβοι του δέντρου αντιστοιχούν σε
ελέγχους τιµών χαρακτηριστικών, ενώ τα κλαδιά του δέντρου είναι οι δυνατές τιµές των
αντίστοιχων
χαρακτηριστικών.
Στην
συγκεκριµένη
χρησιµοποιήθηκε για να επισηµάνει ποια πιθανώς
εργασία,
ο
αλγόριθµος
ID
είναι τα σηµαντικά διαχωριστικά
χαρακτηριστικά, ανάλογα µε το πληροφοριακό περιεχόµενο που εµπεριέχουν. Έτσι, αφού
στο δένδρο απόφασης κάθε φύλλο αναπαριστά µια κλάση και κάθε µονοπάτι από τη ρίζα
ως ένα φύλλο του δέντρου αποτελεί και έναν κανόνα κατάταξης παραδειγµάτων σε µία
κλάση, όσο κοντύτερα στην ρίζα βρίσκεται κάποιος κόµβος-χαρακτηριστικό, τόσο πιο
σηµαντική πληροφορία διαχωρισµού δίνει.
Για να προσδιοριστούν οι συχνότητες που εµφανίζουν σηµαντική πληροφορία
διαχωρισµού θα έπρεπε να δοθούν ως χαρακτηριστικά και τα 1240 σηµεία του
µετασχηµατισµού Fourier για την περιοχή των 0-150Hz. Έτσι κάθε σηµείο του
µετασχηµατισµού που αντιστοιχεί σε µια συχνότητα δόθηκε ως πιθανό διακριτικό
χαρακτηριστικό. Στην συνέχεια δόθηκαν παραδείγµατα από όλες τις κατηγορίες των
µηχανών. Επισηµαίνεται ότι τα παραδείγµατα αυτά αφορούν µετρήσεις ενός
συγκεκριµένου σηµείου, θεωρώντας αρχικά τουλάχιστον ότι κάθε σηµείο είναι µια
ανεξάρτητη πηγή πληροφορίας. Για την λήψη απόφασης σχετικά µε το αν ένα σήµα S(f,a),
όπου µε f συµβολίζεται η συχνότητα του σήµατος και µε a το αντίστοιχο πλάτος, ανήκει
στην κλάση wj σχηµατίζονται κανόνες όπως:
ΑN a (f1)≤p1 KAI ΑN a (f2) ≤p2 KAI … ΤΟΤΕ S(f,a)∈wj (5.9)
οι οποίοι αντιστοιχούν σε δένδρα απόφασης όπως στο σχήµα 5.6.
80
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Στην πράξη εφαρµόστηκε ο αλγόριθµος IDDD++ µια εξελιγµένη µορφή του NewID
[Gaga et al. (1993)] για αριθµητικές τιµές σε ένα σύστηµα Sun Sparc4. Στο σχήµα 5.7
παρουσιάζεται το δένδρο απόφασης για το σηµείο 8 για πέντε διαφορετικές κατηγορίες
µηχανών (z,b,h,m,p) µε πληροφορία που προέρχεται από 270 παραδείγµατα.
Ένα σηµαντικό πρόβληµα του αλγορίθµου είναι ότι στην περίπτωση που δεν βρεθεί
ένα σηµαντικό διαχωριστικό χαρακτηριστικό ανατρέχει την λίστα των χαρακτηριστικών
και θεωρεί τα πρωτοεµφανιζόµενα σ' αυτήν ως σηµαντικά. Αυτό έχει ως αποτέλεσµα να
εµφανίζονται συχνά οι χαµηλές συχνότητες παραπλανητικά, ως έχουσες σηµαντική
διαχωριστική πληροφορία. Θεωρώντας ότι τόσο χαµηλές συνιστώσες (0-2Hz) µάλλον δεν
έχουν φυσική σηµασία συνδεόµενη µε τις καταστάσεις προς ταξινόµηση αγνοούµε αυτά
τα χαρακτηριστικά. Έτσι στο παράδειγµα του σχήµατος 5.7 χρησιµοποιείται η πληροφορία
που υπάρχει στους σκιασµένους κόµβους του δένδρου απόφασης και οι οποίοι στην
συνέχεια απολήγουν σε επιλογή ταξινόµησης του σήµατος στα "φύλλα" του δένδρου.
Ένας κόµβος, ο οποίος αντιστοιχεί σε µία συγκεκριµένη συχνότητα, αποτελεί πιθανώς
σηµαντικό διαχωριστικό χαρακτηριστικό όσο πιο κοντά βρίσκεται στην ρίζα και όσο πιο
81
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
πολλά παραδείγµατα επαληθεύει. Για παράδειγµα στο σχήµα 5.7 η "διαδροµή"
{5.45Hz-99.22Hz-6.78Hz-30.7Hz} περιλαµβάνει σηµαντικές συχνότητες γιατί βρίσκονται
κοντά στην ρίζα του δένδρου απόφασης αλλά και κυρίως γιατί επαληθεύουν αρκετά
παραδείγµατα χωρίς να είναι ταυτόχρονα στην περιοχή των χαµηλών συχνοτήτων.
Η εξέταση µεγάλου αριθµού χαρακτηριστικών οδηγεί αντίστοιχα σε υψηλό φόρτο
υπολογισµών γεγονός που οδήγησε σε προσπάθεια για µείωση του χώρου των
χαρακτηριστικών. Ένας άλλος λόγος γι' αυτή τη µείωση είναι το γεγονός ότι το
ενδιαφέρον για εύρεση κατάλληλων των χαρακτηριστικών δεν πρέπει να περιορίζεται σε
συγκεκριµένες συχνότητες, αλλά να εστιάζεται σε ευρύτερες περιοχές συχνοτήτων διότι µ'
αυτόν τον τρόπο έχουµε µεγαλύτερη πιθανότητα να ισχύει η γενίκευση της ιδιότητας του
διαχωρισµού. Ένας τρόπος για να επιτευχθεί αυτή η προσέγγιση είναι να διαιρεθεί ο
άξονας των συχνοτήτων του φάσµατος σε ίσες περιοχές και σχηµατιστούν τα αθροίσµατα
πλατών του φάσµατος, που αντιστοιχούν στις περιοχές αυτές. Έτσι, αν ανά δέκα σηµεία
82
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
του φάσµατος αντιστοιχηθεί ένα νέο σηµείο µε το άθροισµά τους, τα δεδοµένα θα
µειωθούν στο 1/10 και θα αντιπροσωπεύουν από ποιοτικής άποψης την τετραγωνική ρίζα
της συνολικής ενέργειας που εµφανίζεται στο φάσµα ανά περίπου 1.2Hz.
Συνεπώς αν Χs είναι ο πίνακας του φάσµατος όπως ορίστηκε στην σχέση (5.6) τότε ο
πίνακας,
Xe s , j
⎡ 10
⎢ ∑ x s (1, i )
⎡ xe s (1) ⎤ ⎢ i =1
⎢ xe (2) ⎥ ⎢ 10
x s (2, i )
= ⎢ s ⎥ = ⎢∑
i
=
1
⎢ L ⎥ ⎢
L
⎢
⎥
⎣xe s (k )⎦ ⎢ 10
⎢∑ x s ( k , i )
⎢⎣ i =1
20
∑ x (1, i)
s
⎤
N
L
∑ x (1, i) ⎥
s
⎥
x
(
2
,
i
)
∑ s ⎥⎥
i =11
i = N −9
⎥
L
L
L
20
N
⎥
L
x
(
k
,
i
)
x
(
k
,
i
)
∑
∑ s ⎥⎥⎦
s
i =11
i = N −9
i =11
20
∑ x s (2, i) L
i = N −9
N
(5.10)
έχει το 1/10 των σηµείων του Χs και τα στοιχεία του εκφράζουν ποσότητες ανάλογες
της τετραγωνικής ρίζας της ενέργειας. Με βάση το τροποποιηµένο αυτό φάσµα
83
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
σχηµατίζονται τα αντίστοιχα δένδρα απόφασης και εξάγονται τα σηµαντικά διαχωριστικά
χαρακτηριστικά. Παράδειγµα ενός τέτοιου δένδρου για το σηµείο 8 φαίνεται στο σχήµα
5.8. Κάθε µεταβλητή x του δένδρου αντιστοιχεί σε δέκα συχνότητες του µετασχηµατισµού
Fourier ορίζοντας έτσι µια περιοχή συχνοτήτων.
Τα προκύπτοντα σηµαντικά χαρακτηριστικά αποτελούν είσοδο στους ταξινοµητές
και συνεπώς το τελικό κριτήριο για το αν έγινε σωστή επιλογή τους είναι το κατά πόσο
επιτυγχάνεται σωστή ταξινόµηση ενός νέου σήµατος. Ο αριθµός των διακριτικών
χαρακτηριστικών που προκύπτουν µέσω της µεθοδολογίας που αναπτύχθηκε, δεν είναι ο
ίδιος για κάθε σηµείο αφού τα δένδρα απόφασης µπορεί να διαφέρουν και στα επίπεδα και
στο µέγεθος και στους κόµβους που εµπεριέχουν, προκειµένου να απολήξουν στα φύλλα
ταξινόµησης στις διάφορες κατηγορίες. Σχετικά µε τα αποτελέσµατα που αφορούν τα
δένδρα που παρήχθησαν ανά σηµείο και για τις πέντε βασικές κατηγορίες (z,b,h,m,p)
έγιναν οι ακόλουθες παρατηρήσεις:
Όλα τα δένδρα απόφασης οδηγούσαν πάντα σε κανόνες ταξινόµησης µε σχετικά
λίγους κόµβους. Αυτό σηµαίνει ότι δεν είναι πολλά τα σηµαντικά διαχωριστικά
χαρακτηριστικά και ότι οι κλάσεις είναι τελικώς διαχωρίσιµες. Ο αριθµός των σηµαντικών
χαρακτηριστικών που προσδιορίστηκε µέσω του αλγορίθµου ID ήταν 12-17 ανά σηµείο
µέτρησης.
Επαληθεύθηκε το γεγονός ότι υπάρχουν περιοχές συχνοτήτων των οποίων τα πλάτη
µάλλον αποτελούν διαχωριστικά χαρακτηριστικά και στις οποίες συνεπώς θα έπρεπε να
επικεντρωθεί η έρευνα. Οι περιοχές αυτές φαίνεται να έχουν σχέση µε τις περιττές
αρµονικές της βασικής συχνότητας γεγονός που ενισχύει τις ενδείξεις των ισοϋψών που
αναφέρθηκαν σε προηγούµενη ενότητα και τις απλές παρατηρήσεις στο φάσµα. Στο
γράφηµα 5.9 εµφανίζεται το ιστόγραµµα του πλήθους εµφάνισης σηµαντικών
χαρακτηριστικών όπως τα προσδιόρισε ο αλγόριθµος ID, ανά περιοχές συχνοτήτων, για τα
σηµεία 1,2,5,6,8 και 9.
Επισηµαίνεται, ότι παρά το ότι υπάρχουν πάντα κανόνες που δίνουν ταξινόµηση, το
ιδανικό θα ήταν να επαληθεύονταν όλα τα παραδείγµατα, γεγονός που θα καθιστούσε τα
χαρακτηριστικά που το επιτύγχαναν ιδιαίτερα σηµαντικά. Είναι όµως λίγες οι φορές που
84
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
συµβαίνει αυτό και έτσι θα πρέπει ίσως να αναζητηθεί συνδυασµός κάποιων σηµείων
ώστε να εκµεταλλευθούµε ταυτόχρονα τη πληροφορία που υπάρχει σε περισσότερα από
ένα σηµεία.
Γράφηµα 5.9 Ιστόγραµµα εµφάνισης συχνοτήτων όπου παρατηρούνται διαχωριστικά χαρακτηριστικά
για τις κατηγορίες z,b,h,m,p, σύµφωνα µε τον αλγόριθµο ID για τα σηµεία µέτρησης {1,2,5,6,8,9}
5.4.5 Έλεγχος σηµαντικών χαρακτηριστικών µε βάση την στατιστική
συµπεριφορά του φάσµατος
Είναι λογικό ψάχνοντας για σηµαντικά διαχωριστικά χαρακτηριστικά στα φάσµατα
των διαφόρων κατηγοριών να εξετασθούν οι πιθανές σηµαντικές στατιστικές διαφορές. Οι
διαφορές αυτές συνήθως συνδέονται µε βασικές στατιστικές µετρήσεις όπως ο µέσος και η
διασπορά. Η παραδοχή που γίνεται συνήθως σ' αυτές τις περιπτώσεις είναι ότι
τα
δείγµατα ενός πληθυσµού (στην συγκεκριµένη περίπτωση κάθε διαφορετικός πληθυσµός
αποτελείται από µετρήσεις διαφορετικού τύπου µηχανής) ακολουθούν την κανονική
κατανοµή. Με βάση αυτή την παραδοχή, µπορεί να ελεγχθεί µε κλασικούς ελέγχους
υποθέσεων αν διαφέρουν οι µέσοι δύο πληθυσµών ή οι διασπορές τους.
Έτσι, αν mi, mj και Vi, Vj, είναι αντίστοιχα οι µέσοι και οι διασπορές των N1
δειγµάτων της κλάσης i και των N2 δειγµάτων της j, υπό την προϋπόθεση ότι τα δείγµατα
είναι κατανεµηµένα σύµφωνα µε την κανονική κατανοµή, ισχύει [Shimshoni (1995)] ότι ο
λόγος των διασπορών τους ακολουθεί την κατανοµή F µε (N1 , N2) βαθµούς ελευθερίας,
FN1 , N 2 ~
Vi
Vj
(5.11)
85
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Αναζητήθηκαν συχνότητες που να εµφανίζουν στατιστικά σηµαντικές διαφορές στην
διασπορά µεταξύ των διαφορετικών τύπων των µηχανών, µε σκοπό τα αντίστοιχα πλάτη
να χρησιµεύσουν ως σηµαντικά διαχωριστικά χαρακτηριστικά. Επειδή εκτελώντας τους
ελέγχους για επίπεδα σηµαντικότητας 5% και 10%,
δεν επισηµάνθηκαν σηµαντικές
διαφορές στις συγκρίσεις των στατιστικών αυτών µεγεθών, θεωρήθηκε ότι πιθανά
διαχωριστικά χαρακτηριστικά µπορεί να βρίσκονται στις περιοχές συχνοτήτων στις οποίες
παρατηρείται έστω κάποια µικρή διαφοροποίηση. Με τις ακόλουθες συναρτήσεις
ορίζονται οι λόγοι των µέσων,
⎧ mi
⎪m
⎪
rm = ⎨ j
m
⎪ j
⎪⎩ m i
mi ≥ m j
(5.12)
mi < m j
και των διασπορών,
⎧ Vi
⎪V
⎪
rV = ⎨ j
V
⎪ j
⎪⎩ Vi
Vi ≥ V j
(5.13)
Vi < V j
καθώς και οι αντίστοιχες διαφορές τους,
dm = mi − m j
(5.14)
dV = Vi − V j
(5.15)
και
Οι συχνότητες στις οποίες οι συναρτήσεις εµφανίζουν τοπικά µέγιστα πιθανότατα
αντιστοιχούν σε σηµαντικά διακριτικά χαρακτηριστικά.
86
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Στο γράφηµα 5.10 παρουσιάζεται το ιστόγραµµα των συχνοτήτων των σηµαντικών
διαχωριστικών χαρακτηριστικών για το σηµείο 2 σε µηχανές χωρίς βλάβη (τύπου z) και σε
µηχανές µε βλάβη (τύπου b,m,p,h). Για τον συνδυασµό αυτών των στατιστικών
ποσοτήτων και για µεγάλο µέγεθος δείγµατος το 95% τα σηµεία ακολουθούν κανονική
κατανοµή και βρίσκονται µέσα στα όρια m ± 2 V . Παρόµοια, εξετάζοντας τα µέγιστα
της συνάρτησης
(
l = m i − m j − 2 Vi − V j
)
(5.16)
βρίσκονται τα σηµεία τα οποία ορίζουν περιοχές που διαφέρουν κατ' αυτή την
έννοια.
Συνοψίζοντας αυτήν την ενότητα παραθέτουµε τις διαφορετικές κατηγορίες
διαχωριστικών χαρακτηριστικών οι οποίες θα αποτελέσουν είσοδο για τους ταξινοµητές:
Κορυφές φάσµατος (πλάτη-συχνότητες).
Τοπικά µέγιστα στις περιττές αρµονικές της βασικής συχνότητας περιστροφής του
κινητήρα.
∆ιαχωριστικά χαρακτηριστικά σηµεία που προκύπτουν από την αξιολόγηση της
πληροφοριακής ισχύος που αποδίδει ο αλγόριθµος ID είτε στο φάσµα είτε σε περιοχές του
όπου έχει υπολογιστεί το αντίστοιχο άθροισµα των πλατών.
87
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Χαρακτηριστικά που προκύπτουν από στατιστική διαφοροποίηση του µέσου µεταξύ
των δειγµάτων δύο οµάδων, ή της διασποράς τους, ή του συνδυασµού τους.
5.5 Ταξινόµηση
5.5.1 Χρήση του αλγορίθµου FCM για την εξέταση του διαχωρισµού των
κλάσεων
Τα διακριτικά χαρακτηριστικά που περιγράφηκαν στις προηγούµενες ενότητες,
αποτέλεσαν είσοδο σε ταξινοµητές όπως οι αποστάσεις και το δίκτυο ANFIS. Πριν όµως
χρησιµοποιηθούν ως είσοδος έγινε χρήση του αλγορίθµου FCM για να διαπιστωθεί αν
εφαρµόζοντας έναν µη εποπτευόµενο ταξινοµητή τα δεδοµένα θα σχηµατίσουν και τις
απαιτούµενες κλάσεις. Συγκεκριµένα εξετάστηκε το πώς θα ταξινοµηθούν τα
παραδείγµατα αυτά σε διαχωρίσιµες κλάσεις, αν δεν δοθεί στον ταξινοµητή η πληροφορία
προέλευσης κλάσης αλλά µόνον ο αριθµός των κλάσεων.
Για τον έλεγχο αυτό χρησιµοποιήθηκαν ως διακριτικά χαρακτηριστικά µόνο οι
µεγαλύτερες κορυφές του φάσµατος και τα µέγιστα που εµφανίζονται στις περιττές
αρµονικές. Ικανοποιητικός διαχωρισµός επετεύχθη µόνο µετά από µείωση των
διαστάσεων των διανυσµάτων των χαρακτηριστικών µέσω του µετασχηµατισµού
Karhunen-Loeve. Ενώ για παράδειγµα, τα διανύσµατα των χαρακτηριστικών που
περιλάµβαναν τα δέκα πρώτα µέγιστα του φάσµατος, δεν σχηµάτιζαν όταν προβάλλονταν
στον ℜ10 ξεχωριστά νέφη σηµείων για κάθε κατηγορία, αν γινόταν µείωση στον ℜ3 –
όπου σηµειωτέον υπήρχε και οπτική εποπτεία των σχηµατιζόµενων κλάσεων – µέσω του
µετασχηµατισµού Karhunen-Loeve, τα νέα νέφη παρουσίαζαν οµοιογένεια.
88
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Υπενθυµίζεται ότι ο αλγόριθµος FCM χρησιµοποιεί ένα µέτρο απόστασης για να
αποδώσει το βαθµό συµµετοχής ενός σηµείου σε ένα νέφος σηµείων που ορίζει µια κλάση.
Στην πράξη χρησιµοποιήθηκε η ευκλείδεια
απόσταση και στην περίπτωση που
εξετάζονταν ο σχηµατισµός δύο κλάσεων κριτήριο για να αποδοθεί ένα σηµείο σε µία
κλάση ήταν ο βαθµός συµµετοχής να είναι άνω του 0.5. Στην περίπτωση που υπήρχαν
περισσότερες κλάσεις το σηµείο αποδίδεται στην κλάση µε το µεγαλύτερο βαθµό
συµµετοχής. Στο γράφηµα 5.11 παρουσιάζονται οι βαθµοί συµµετοχής, για δείγµα 18
µηχανών των σηµείων 9 και 6, για 4 κλάσεις (5z,5b,5p,3g). Πριν την εφαρµογή του FCM
έχει προηγηθεί µείωση του πλήθους των χαρακτηριστικών (περιττές αρµονικές) από τον
ℜ8 στον
ℜ3 µέσω του µετασχηµατισµού KL. Ο διαχωρισµός των κλάσεων στο
παράδειγµα είναι πλήρης και στα δύο σηµεία αν και στην δεύτερη µηχανή παρατηρείται
χαµηλός βαθµός συµµετοχής της κυρίαρχης κλάσης.
Γράφηµα 5.11 Κατηγοριοποίηση χαρακτηριστικών σε κλάσεις (5z,5b,5p,3g) µε
χρήση του αλγορίθµου FCM
Για να πραγµατοποιηθεί η µείωση του χώρου µέσω ανάλυσης σε κύριες συνιστώσες
εφαρµόστηκε ο µετασχηµατισµός KL για κάθε σύνολο δεδοµένων κάθε κατηγορίας
ξεχωριστά. Αυτό σηµαίνει ότι µε βάση την διασπορά των δεδοµένων κάθε κατηγορίας
γίνεται η προβολή τους σε διαφορετικές κύριες συνιστώσες για κάθε κατηγορία µέσω του
πίνακα µετασχηµατισµού. Στην περίπτωση που εφαρµοσθεί ένας ενιαίος πίνακας
µετασχηµατισµού χρησιµοποιώντας την διασπορά όλων των δεδοµένων, οι προβολές των
89
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
σηµείων στις νέες διαστάσεις δεν διαχωρίζονται ικανοποιητικά. Το γεγονός αυτό
δηµιουργεί πρόβληµα στην περίπτωση που εµφανίζεται ένα νέο σήµα εισόδου, αφού δεν
είναι γνωστή εκ των προτέρων η κλάση στην οποία ανήκει (αντιθέτως αυτό είναι το
ζητούµενο!), και συνεπώς δεν είναι γνωστό µε ποιας κλάσης πίνακα µετασχηµατισµού
πρέπει να πολλαπλασιαστεί, ώστε το σήµα να προβληθεί στις νέες διαστάσεις. Η ιδέα του
να αποδοθεί το σήµα στην κλάση
εφαρµοστούν διαδοχικά
στην οποία θα ταξινοµηθεί καλύτερα αφού
όλοι οι εναλλακτικοί µετασχηµατισµοί, δεν απέδωσε τα
αναµενόµενα. Υπενθυµίζεται ότι το βασικό πρόβληµα είναι η ταξινόµηση ενός νέου
σήµατος εισόδου µετά από κατάλληλη περίοδο εκπαίδευσης του ταξινοµητή και συνεπώς
αυτή η αδυναµία που εµφανίστηκε στην εφαρµογή του µετασχηµατισµού KL θεωρήθηκε
σηµαντική, παρά το ότι η µείωση των χαρακτηριστικών σε χώρους όπως ο ℜ3 διευκολύνει
την οπτική αναπαράσταση των σχηµατιζόµενων κλάσεων.
5.5.2 Εκτίµηση επίδοσης ταξινοµητή
Η απόδοση µιας µεθόδου ταξινόµησης θα πρέπει να εκτιµηθεί για να δικαιολογήσει
την πιθανή επιλογή του στο τελικό σχήµα της διάγνωσης. Η ποιότητα της επίδοσης ενός
ταξινοµητή µετριέται µέσω του σφάλµατος πρόβλεψης (prediction error), το οποίο
προσδιορίζει σε ποιο βαθµό γίνονται εσφαλµένες κατατάξεις. Στην βιβλιογραφία
αναφέρεται
συχνότερα
και
ως
βαθµός
ή
αναλογία
εσφαλµένης
ταξινόµησης
(misclassification rate). Η εκτίµηση της πιθανότητας µπορεί να γίνει µε παραµετρικό
τρόπο κάνοντας χρήση της γνώσης για τον µηχανισµό δηµιουργίας των κλάσεων και των
συναρτήσεων πυκνότητας πιθανότητας των δεδοµένων, αλλά τις περισσότερες φορές η
γνώση αυτή κρίνεται ανεπαρκής. Επίσης, η εκτίµηση της αναλογίας της εσφαλµένης
ταξινόµησης µε παραµετρικό τρόπο είναι συνήθως αισιόδοξη [Duda and Hart (1973)].
Έτσι, περιοριζόµαστε σε εµπειρικές µεθόδους εκτίµησης του βαθµού εσφαλµένης
ταξινόµησης, κάνοντας πειράµατα ταξινόµησης µε γνωστά παραδείγµατα. Έστω p ο
άγνωστος βαθµός εσφαλµένης ταξινόµησης και D* ένα σύνολο από Nm τυχαία επιλεγµένα
παραδείγµατα από το σύνολο D των N παραδειγµάτων. Στην περίπτωση που έχουν
90
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
ταξινοµηθεί εσφαλµένα τα Nm παραδείγµατα από τα N, η ποσότητα Nm ακολουθεί την
διωνυµική κατανοµή και συγκεκριµένα ισχύει,
⎛ N ⎞ Nm
⎟⎟ p (1 − p ) N − N m
P (N m ) = ⎜⎜
⎝ Nm ⎠
όπου ποσότητα
p=
(5.17)
Nm
, αποτελεί µια αµερόληπτη εκτιµήτρια µεγίστης
N
πιθανοφάνειας του p [Shimshoni (1995)].
Αν ισχύει D* = D τότε ο ταξινοµητής ελέγχεται στα ίδια παραδείγµατα από τα
οποία έχει "εκπαιδευθεί" και το σφάλµα που σ' αυτή την περίπτωση καλείται προφανές
σφάλµα, αποτελεί µια αισιόδοξη εκτίµηση του αντίστοιχου πραγµατικού. Για τον λόγο
αυτό, συνηθίζεται να χωρίζονται τα δεδοµένα σε δύο οµάδες µε σκοπό να χρησιµοποιηθεί
η µία οµάδα για την εκπαίδευση και η άλλη για την εκτίµηση του σφάλµατος. Οι µέθοδοι
που ακολουθούν αυτή την λογική, ονοµάζονται µέθοδοι διασταύρωσης εγκυρότητας (cross
validation methods). Γενικεύοντας, αν
θεωρηθούν K περίπου ίσες περιοχές των
δεδοµένων και εξετασθούν τα σφάλµατα για κάθε µια από αυτές τις περιοχές
εκπαιδεύοντας τον ταξινοµητή στις Κ-1, η διαδικασία καλείται µέθοδος Κ-fold [Efron and
Tibshirani (1993)].
Αν το δείγµα είναι σχετικά µικρό τότε συχνά το µέγεθος των Κ περιοχών µειώνεται
στο ελάχιστο (δηλαδή Κ=1) και η µέθοδος καταλήγει στο να εξετασθεί η επίδοση του
ταξινοµητή αφαιρώντας κάθε φορά ένα δείγµα (leave one out method) [Hand (1981)].
Στην περίπτωση αυτής της εργασίας η αδυναµία επανάληψης µεγάλου πλήθος µετρήσεων
όπως ήδη αναφέρθηκε στην ενότητα 0, είχε ως συνέπεια τα αποτελέσµατα που
περιγράφουν την επίδοση των ταξινοµητών να είναι υπολογισµένα αφαιρώντας κάθε
φορά ένα δείγµα. Με αυτό τον τρόπο έχουµε τη µέγιστη δυνατή πληροφόρηση κατά την
φάση της εκπαίδευσης.
Συνοψίζοντας, παρατίθενται τα βήµατα της διαδικασίας βάση της οποίας εκτιµάται
η επίδοση ενός ταξινοµητή:
91
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
1. Χρησιµοποιείται ένα αριθµός d χαρακτηριστικών βασισµένος σε µετρήσεις που
πάρθηκαν κάθε φορά από Ν διαφορετικά δείγµατα (µετρήσεις από ένα ή περισσότερα
σηµεία µέτρησης που αφορούν την ίδια µηχανή). Για κάθε δείγµα µέτρησης από την
µηχανή k
2. Εκπαιδεύεται ο ταξινοµητής χρησιµοποιώντας τα d χαρακτηριστικά από τις Ν-1
µηχανές, αφήνοντας εκτός την k
3. Ταξινοµείται η k µηχανή από τον ταξινοµητή µε βάση τα χαρακτηριστικά της
4. Επαναλαµβάνεται η διαδικασία για όλες τις µηχανές και υπολογίζεται ο αριθµός
των επιτυχών ταξινοµήσεων ως προς τον συνολικό.
5.5.3 Πιθανότητες εµφάνισης κλάσεων
Η ανεπάρκεια ικανού αριθµού δείγµατος για κάθε τύπο µηχανής και για κάθε σηµείο
µέτρησης οδήγησε στον περιορισµό του χώρου των δεδοµένων, τόσο στις κλάσεις των
µηχανών, όσο και στα σηµεία µέτρησης. Συγκεκριµένα, λαµβάνοντας υπόψη τα δεδοµένα
του πίνακα 7.3 στο παράρτηµα αλλά και την προτεραιότητα ανίχνευσης συγκεκριµένων
τύπων βλάβης από τον βιοµηχανικό κατασκευαστή, η σύγκριση των ταξινοµητών
περιορίστηκε στις κλάσεις:
w j = {z, b, h, m, p}
(5.18)
µε εστιασµένο το ενδιαφέρον κύρια στην αναγνώριση βλαβών τύπου b και h. Με
βάση το δείγµα του πίνακα 7.3 οι αντίστοιχες εκ των προτέρων γνωστές πιθανότητες
εµφάνισης είναι,
⎧ 65 65 60 40 40 ⎫
p(w j ) = ⎨
⎬ = {0.24 0.24 0.222 0.148 0.148}
⎩ 270 270 270 270 270 ⎭
(5.19)
Οι πιθανότητες αυτές είναι σίγουρα διάφορες από τις πιθανότητες εµφάνισης που
αντιστοιχούν στην πραγµατικότητα στην γραµµή παραγωγής, όπου για παράδειγµα το
p(w1) το οποίο αντιστοιχεί στις µηχανές χωρίς βλάβη αναµένεται σηµαντικά υψηλότερο
92
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
(>0.95). Το γεγονός ότι δεν υπήρχαν επαρκή στατιστικά στοιχεία για την πιθανότητα
εµφάνισης κάθε τύπου βλάβης αλλά και το µικρό διαθέσιµο δείγµα οδήγησαν στο να
εξετασθούν, τουλάχιστον στην παρούσα φάση του σχεδιασµού του συστήµατος
διάγνωσης, οι ταξινοµητές χρησιµοποιώντας όλο το διαθέσιµο δείγµα και τις αντίστοιχες
πιθανότητες εµφάνισης. Η αναπροσαρµογή του p (w j ) στις τρέχουσες τιµές, µπορεί να
γίνεται ανά τακτά χρονικά διαστήµατα, όταν υπάρχει υψηλό διαθέσιµο δείγµα στην φάση
της εφαρµογής του διαγνωστικού σχήµατος στην παραγωγή.
Για λόγους απλούστευσης µπορεί να εξετασθεί το διαγνωστικό σχήµα µε δύο
κλάσεις: για παράδειγµα z και x={b,h,m,p}. Σ' αυτήν την περίπτωση, ο κατασκευαστής
µπορεί να αποµακρύνει από την γραµµή παραγωγής την µηχανή που έχει υποδειχθεί ότι
ανήκει στην κατηγορία x και να εξακριβώσει στην συνέχεια την βλάβη. Oι αντίστοιχες
πιθανότητες εµφάνισης είναι,
⎧ 65 205 ⎫
p (w j ) = ⎨
⎬ = {0.24 0.76}
⎩ 270 270 ⎭
(5.20)
5.5.4 Επιδόσεις ταξινοµητών
Από τους ταξινοµητές που παρουσιάστηκαν στο κεφάλαιο 4 η σύγκριση έγινε
κυρίως µεταξύ των ταξινοµητών που χρησιµοποιούσαν αποστάσεις (ευκλείδεια
Mahalanobis και Bayes). Το προσαρµοζόµενο δίκτυο
ANFIS
απαιτούσε εξαιρετικά
υψηλό χρόνο εκπαίδευσης αφού ο αριθµός χαρακτηριστικών στην είσοδο ήταν σχετικά
µεγάλος. Για παράδειγµα, αν χρησιµοποιούνταν χαρακτηριστικά που άνηκαν στον ℜ8 και
για 5 συναρτήσεις συµµετοχής χρειάζονταν σύµφωνα µε την σχέση (4.28) 58=390625
κανόνες γεγονός που οδηγούσε σε "έκρηξη" του δικτύου και δεν επέτρεπε την σύγκριση
µε τους υπόλοιπους ταξινοµητές για όλα τα χαρακτηριστικά. Όπως αναφέρθηκε, δεν ήταν
δυνατή η επιτυχής χρήση του αλγορίθµου Karhunen-Loeve για την µείωση της διάστασης
του χώρου των χαρακτηριστικών, που θα µείωνε στην συνέχεια τον υπολογιστικό φόρτο
στο δίκτυο ANFIS. Πάντως και στις λίγες περιπτώσεις που ενδεικτικά εφαρµόστηκε το
δίκτυο ANFIS, τα αποτελέσµατα ήταν παρόµοια µε αυτά που πάρθηκαν από την
αντίστοιχη εφαρµογή του ταξινοµητή µε χρήση ευκλείδειας απόστασης, ανεξάρτητα από
93
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
το ποιο χαρακτηριστικό επιλέχθηκε ως είσοδος. Πιθανότατα µεγαλύτερο δείγµα
µετρήσεων και ταυτόχρονα επιτυχής µείωση του χώρου των χαρακτηριστικών, να
οδηγήσει σε καλύτερες επιδόσεις του δικτύου.
Κάνοντας
χρήση
χαρακτηριστικών
που
προκύπτουν
από
την
στατιστική
διαφοροποίηση του µέσου του Xes , j όπως ορίστηκε στην σχέση (5.10) και συγκεκριµένα
εξετάζοντας τις συχνότητες που εµφανίζουν τη µεγαλύτερη διαφορά µέσων d m της σχέσης
(5.14), προκύπτουν σχετικά ικανοποιητικά αποτελέσµατα ταξινόµησης χρησιµοποιώντας
τις αποστάσεις (ευκλείδεια, Mahalanobis και Bayes) σε κάποια συγκεκριµένα σηµεία
µέτρησης υπό την προϋπόθεση ότι εξετάζουµε µόνο δύο κλάσεις, z και x={b,h} όπως
φαίνεται στο γράφηµα 5.12.
Γράφηµα 5.12 Επίδοση ταξινοµητών αποστάσεων για τις κλάσεις z-bh, µε χρήση
χαρακτηριστικών που προκύπτουν από την διαφοροποίηση του µέσου, ανά σηµείο
µέτρησης
94
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Στο γράφηµα 5.12 αλλά και σε παρόµοιες µετρήσεις είναι φανερό ότι η απόσταση
Bayes και η απόσταση Mahalanobis υπερτερούν της ευκλείδειας απόστασης. Στο σηµείο 6
επιτυγχάνεται ποσοστό ορθής ταξινόµησης που προσεγγίζει ικανοποιητικά τα επιθυµητά
επίπεδα τόσο µε χρήση της απόστασης Mahalanobis (92%) όσο και µε χρήση απόστασης
κατά Bayes(91%), µε χαµηλότερες όµως επιδόσεις στην κατηγορία των µηχανών χωρίς
ελάττωµα που στις συνθήκες παραγωγής θα αντιπροσωπεύουν τη µεγαλύτερη κλάση.
∆υστυχώς όµως, στην περίπτωση που εµπλουτίσουµε την κλάση x
έτσι ώστε
x={b,h,m,p}, το ποσοστό επιτυχούς ταξινόµησης δεν υπερβαίνει το 75% σε κανένα σηµείο
µέτρησης και για κανένα ταξινοµητή. Αυτό σηµαίνει ότι η ύπαρξη και των υπολοίπων
κλάσεων των µηχανών µε βλάβη, σχηµατίζει στο χώρο των χαρακτηριστικών νέφη
σηµείων, τα οποία δεν µπορούν να διαχωρίσουν οι ταξινοµητές. Η χρήση άλλων
στατιστικών χαρακτηριστικών όπως για παράδειγµα η εξέταση των µεγίστων των l , rm και
rV , δεν βελτίωσε την απόδοση των ταξινοµητών.
Κάνοντας χρήση χαρακτηριστικών που προκύπτουν από τον αλγόριθµο ID
ελήφθησαν βελτιωµένα αποτελέσµατα όσον αφορά την ταξινόµηση σε δύο κατηγορίες z
και x={b,h,m,p}. Συγκεκριµένα, χρησιµοποιώντας πάλι την µορφή Xes , j της (5.10) και
επιλέγοντας τις συχνότητες που αντιστοιχούν στα οκτώ πιο πληροφοριακά σηµεία η
απόδοση για κάθε ένα από τα σηµεία 1,2,6,8 και 9 παριστάνεται στο γράφηµα 5.13.
95
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Γράφηµα 5.13 Επίδοση ταξινοµητών αποστάσεων για τις κλάσεις z-bhmp, µε χρήση
χαρακτηριστικών που προκύπτουν από την χρήση του αλγορίθµου ID, ανά σηµείο
µέτρησης
Στο γράφηµα αυτό µπορεί να διαπιστωθεί ότι η ταξινόµηση δειγµάτων µε την χρήση
της απόστασης Mahalanobis υπερτερεί των άλλων στην οµάδα µε το µεγαλύτερο δείγµα
(b,h,m,p), ενώ
αντιθέτως η ταξινόµηση δειγµάτων της µικρότερης οµάδας (z) είναι
µάλλον ανεπιτυχής. Χρησιµοποιώντας απόσταση Bayes για την ταξινόµηση δειγµάτων
παρατηρούνται πιο οµοιογενή ποσοστά επιτυχίας στις δύο κατηγορίες.
Χρησιµοποιώντας ως χαρακτηριστικά τα πλάτη που εµφανίζονται στις µεγαλύτερες
κορυφές του φάσµατος (για παράδειγµα στις συχνότητες που αντιστοιχούν στα δέκα
µεγαλύτερα πλάτη του φάσµατος), δεν επιτεύχθηκε ικανοποιητικός βαθµός ταξινόµησης
µε καµία µέθοδο και για κανένα σηµείο µέτρησης. Έτσι, το ενδιαφέρον επικεντρώθηκε
στα τοπικά µέγιστα που παρατηρούνται στις περιττές αρµονικές της βασικής συχνότητας
περιστροφής του κινητήρα. Το αντίστοιχο σχετικό γράφηµα 5.14, εµφανίζει πάλι υψηλό
ποσοστό
ορθής
ταξινόµησης
της
κατηγορίας
96
των µηχανών µε
ελαττωµατική
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
συναρµολόγηση (x) και χαµηλό στην κατηγορία των µη ελαττωµατικών (z) στην
περίπτωση που επιλεγεί η µέθοδος ταξινόµησης µέσω απόστασης Mahalanobis. Κάνοντας
χρήση της απόστασης Bayes για το σηµείο µέτρησης 9 επιτυγχάνεται ποσοστό συνολικής
επιτυχούς ταξινόµησης 86% αλλά πάλι το ποσοστό επιτυχούς ταξινόµησης στην
κατηγορία των µη ελαττωµατικών κρίνεται χαµηλό (71%).
Γράφηµα 5.14 Επίδοση ταξινοµητών αποστάσεων για τις κλάσεις z-bhmp, µε χρήση
µεγίστων στις περιττές αρµονικές, ανά σηµείο µέτρησης
Η σύγκριση των ταξινοµητών κάθε φορά έγινε κάνοντας χρήση χαρακτηριστικών
που προέρχονται από ένα σηµείο µέτρησης από τα {1,2,6,8,9}. Με αυτό τον τρόπο, είναι
δυνατόν να εκτιµηθεί η τυχόν ιδιαίτερη σηµασία κάποιου σηµείου µέτρησης για κάποιο
τύπο µηχανής, ή να αφαιρεθεί κάποιο σηµείο µέτρησης αν προκύπτει ότι οι πληροφορίες
που λαµβάνονται από αυτό είναι πλεονάζουσες. Εξάλλου το τελικό διαγνωστικό σύστηµα
δεν είναι δυνατόν να δέχεται πληροφορίες από όλα τα σηµεία µέτρησης λόγω
κατασκευαστικών περιορισµών και οικονοµίας. Πρέπει συνεπώς να προταθεί µια
97
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
περαιτέρω µείωση του αριθµού των σηµείων (τα σηµεία µέτρησης να είναι το πολύ
τέσσερα), µέσω των αποτελεσµάτων της επίδοσης των ταξινοµητών.
Πριν όµως µειωθεί ο αριθµός των σηµείων µέτρησης θα πρέπει να εξετασθεί και η
δυνατότητα συνδυασµού τους, στην δηµιουργία νέων χαρακτηριστικών. Αυτή η
προσέγγιση κάνει τα χαρακτηριστικά πιο περιεκτικά σε πληροφορία και στην περίπτωση
που επιλεγεί ο κατάλληλος συνδυασµός, τα νέα χαρακτηριστικά θα διευκολύνουν τους
ταξινοµητές στην διαδικασία του διαχωρισµού των κλάσεων. Το πρόβληµα που τίθεται,
είναι η εύρεση του κατάλληλου συνδυασµού αφού από τα αποτελέσµατα δεν ξεχώρισαν
ιδιαίτερα κάποια σηµεία µέτρησης ως έχοντα σηµασία στον διαχωρισµό των κλάσεων.
Οι δυνατοί συνδυασµοί των υποσυνόλων του συνόλου {1,2,6,8,9} εκτός των απλών
σηµείων και της πεντάδας, δίνονται από τον πίνακα 5.1.
Ανά
ζεύγη
Ανά τριάδες σηµείων
Ανά τετράδες σηµείων
{1,2,6},{1,2,8},{1,2,9},{1,
{1,2,6,8},{1,2,6,9},{1,2
σηµείων
{1,2},{1,6},{1,8},
{1,9},{2,6},{2,8},{2,9},
6,8},{1,6,9},{1,8,9},{2,6,8},{2,
{6,8},{6,9},{8,9}
6,9},{2,8,9},{6,8,9}
,8,9},{1,6,8,9},{2,6,8,9}
Πίνακας 5.1 Οι δυνατοί συνδυασµοί των σηµείων µέτρησης
Έτσι, αν f s (i ) είναι το διάνυσµα των χαρακτηριστικών στον ℜd που προκύπτει από
το φάσµα για την περιοχή στάσιµης κατάστασης για το σηµείο µέτρησης i, το νέο
διάνυσµα που θα συνδυάζει περισσότερα σηµεία ορίζεται,
f s = [f s (k ) f s (l ) ... f s (m )]
T
= [ f s (k ,1) ...
f s (k , d )
f s (l ,1) ...
f s (l , d ) ......
f s (m, d )]
T
(5.21)
όπου τα k, l, … ,m είναι σηµεία που αντιστοιχούν στα ζεύγη τις τριάδες ή τις
τετράδες του προηγούµενου πίνακα συνδυασµού των σηµείων.
Εξετάζοντας τους συνδυασµούς των σηµείων για τα δεδοµένα χαρακτηριστικά,
διαπιστώθηκε ικανοποιητικό ποσοστό ταξινόµησης στην περίπτωση που χρησιµοποιούνται
98
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
ως χαρακτηριστικά τα οκτώ σηµαντικότερα µέγιστα περιττών αρµονικών από τριάδες
σηµείων ενώ αρκετά καλά ποσοστά εµφανίστηκαν και στα ζεύγη και στις τετράδες.
Σύµφωνα µε την (5.21) και για d=8 υπολογίστηκαν διανύσµατα χαρακτηριστικών,
⎡ f s (k ,1) ⎤
⎢ L ⎥
⎥
⎢
⎢ f s (k ,8) ⎥ ⎡ f s (1) ⎤
⎥ ⎢
⎢
⎥
⎡ f s (k ) ⎤ ⎢ f s (l ,1) ⎥ ⎢ f s (2) ⎥
f s = ⎢⎢ f s (l ) ⎥⎥ = ⎢ L ⎥ = ⎢ . ⎥
⎥ ⎢
⎢
⎥
⎢⎣f s (m)⎥⎦ ⎢ f s (l ,8) ⎥ ⎢ . ⎥
⎢ f ( m,1) ⎥ ⎢ f (24)⎥
⎦
⎥ ⎣ s
⎢ s
⎢ L ⎥
⎢ f (m,8)⎥
⎦
⎣ s
(5.22)
όπου k , l , m ∈ {1,2,6,8,9} ∧ k ≠ l ≠ m .
Επειδή χρησιµοποιούνται Ν-1 δείγµατα από µηχανές τύπου j, κρατώντας κάθε φορά
µία εκτός για τον έλεγχο απόδοσης του ταξινοµητή, ο δειγµατικός µέσος υπολογίζεται ως
εξής,
⎡ N −1 i
⎤
⎢ ∑ f s (1) ⎥ ⎡ j
⎢ Ni =−11
⎥ ⎢ ms (1) ⎤⎥
j
i
1 ⎢ ∑ f s ( 2) ⎥ ⎢ m s ( 2) ⎥
=
m sj =
⎢
⎥ ⎢
N − 1 ⎢ i =1
⎥ ⎢ L ⎥⎥
L
⎢ N −1
⎥ ⎢m j (24)⎥⎦
⎢∑ f si (24)⎥ ⎣ s
⎣⎢ i =1
⎦⎥
(5.23)
S sj (i ) = f si (i) − msj (i)
(5.24)
Επιπλέον ορίζοντας,
ο αντίστοιχος πίνακας συνδιασποράς είναι,
99
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
⎡ N −1 j 2
⎢ ∑ Ss (1)
⎢ N −1 i=1
1 ⎢ ∑ Ssj (1) Ssj (2)
Csj =
⎢
N − 2 ⎢ i=1
L
⎢N −1
⎢∑ Ssj (1) Ssj (24)
⎣⎢ i=1
(
)
⎤
(24) ⎥
i =1
i =1
⎥
N −1
N −1
2
j
j
j
L ∑ Ss (2) Ss (24) ⎥
Ss (2)
∑
⎥ (5.25)
i =1
i =1
⎥
L
L
L
N −1
N −1
⎥
2
j
j
j
L
S
(
24
)
S
(
2
)
S
(
24
)
⎥
∑
∑
s
s
s
i =1
i =1
⎦⎥
j
s
∑(S (1))(S
j
s
(
)
N −1
(
)(
)
(
)(
)
(
)(
(2)
)
∑(S (1))(S
N −1
L
j
s
(
)
)
j
s
)(
(
)
)
Τα αποτελέσµατα των ταξινοµήσεων για µετρήσεις που προέκυψαν από τους
δυνατούς συνδυασµούς σηµείων, χρησιµοποιώντας ως χαρακτηριστικά τα οκτώ
σηµαντικότερα µέγιστα που εµφανίζονται στις περιττές αρµονικές, έδειξαν υπεροχή της
ταξινόµησης µέσω απόστασης Bayes. Συγκεκριµένα,
ταξινοµώντας µε χρήση της
απόστασης Bayes ταξινοµήθηκαν καλύτερα οι µηχανές που άνηκαν στην κατηγορία χωρίς
βλάβη, σε σύγκριση µε την περίπτωση που χρησιµοποιήθηκε η απόσταση Mahalanobis.
Στο γράφηµα 5.15 παρουσιάζεται συγκριτικό διάγραµµα των τριών ταξινοµητών
απόστασης για τριάδες σηµείων στο οποίο
φαίνεται καθαρά ότι µε τη χρήση της
απόστασης Bayes επιτυγχάνονται ικανοποιητικά αποτελέσµατα. Χρησιµοποιώντας την
τριάδα σηµείων µέτρησης {1,6,9}, το συνολικό ποσοστό ορθής ταξινόµησης για δύο
κατηγορίες (καλές-κακές) ανήλθε στο 96.7%.
Έτσι, εξετάσθηκαν όλοι οι δυνατοί συνδυασµοί για ζεύγη, τριάδες και τετράδες
σηµείων µέτρησης, µε χρήση της απόστασης Bayes τόσο για δύο κατηγορίες (z-x) όσο και
για πέντε κατηγορίες (z-b-h-m-p), όπου διαπιστώθηκαν σε όλες τις περιπτώσεις υψηλά
ποσοστά ορθής ταξινόµησης (>91.9%). Αυτό το γεγονός, επιβεβαιώνει ότι ο συνδυασµός
σηµείων εµπεριέχει µια πιο ολοκληρωµένη πληροφορία όσον αφορά την διαχωρισιµότητα
των κλάσεων. Η καλύτερη επίδοση σηµειώθηκε στην περίπτωση της τριάδας σηµείων
{2,8,9} όπου διαχωρίστηκαν και οι πέντε κλάσεις µε ποσοστό επιτυχίας 97%. Ο πίνακας
5.2 παρουσιάζει αναλυτικά τις επιδόσεις ταξινόµησης µέσω απόστασης Bayes για την
τριάδα {2,8,9} για κάθε τύπο µηχανή
100
ΑΝΑΠΤΥΞΗ ΕΝΌΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
101
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Χαρακτηριστικά: 3⋅8=24 σηµαντικότερα µέγιστα περιττών αρµονικών
στα σηµεία {2, 8, 9}
Τύπος
µηχανής
Αριθµός
δειγµάτων
Ταξινοµή
Ποσοστό
θηκαν
z
65
63
96.92%
b
65
62
95.38%
h
60
59
98.33%
m
40
39
97.50%
p
40
39
97.50%
Συνολι
270
262
97.04%
κά
Πίνακας 5.2 Αναλυτικός αριθµός και ποσοστό ορθών ταξινοµήσεων µε την χρήση
της απόστασης Bayes µέσω των µεγίστων στις περιττές αρµονικές για τις κλάσεις z-b-h-mp
102
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Γράφηµα 5.16 Αναλυτικός αριθµός και ποσοστό ορθών ταξινοµήσεων µε την χρήση
της απόστασης Bayes µέσω των µεγίστων στις περιττές αρµονικές για τις κλάσεις z-b-h-mp
Στον πίνακα 5.3 φαίνεται αναλυτικά σε ποια κατηγορία ταξινοµήθηκε λανθασµένα
το 3% των προϊόντων που ελέγχθηκαν από 270 συνολικά. Πέντε πλυντήρια θεωρήθηκαν
λανθασµένα ως µη έχοντα βλάβη, ενώ δύο που λειτουργούσαν κανονικά ταξινοµήθηκαν
ως έχοντα χαλαρή ή ελλιπή σύσφιγξη των κοχλιών του κινητήρα.
103
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Πίνακας συγχύσεως
Χαρακτηριστικά: 3⋅8=24 σηµαντικότερα µέγιστα περιττών αρµονικών στα σηµεία {2,
8, 9}
Ταξινοµήθηκαν ως…
Ενώ
z
b
z
63
2
b
3
62
h
1
m
1
H
m
p
ήταν…
p
59
39
1
39
Πίνακας 5.3 Παρουσίαση ανά κατηγορία βλάβης, των ορθών και των λανθασµένων
ταξινοµήσεων σε 270 δείγµατα, µε την χρήση της απόστασης Bayes στα µέγιστα των
περιττών αρµονικών για τα σηµεία {2,8,9}
5.6 Η τελική πρόταση για το σύστηµα ταξινόµησης στην παραγωγή
Τα αποτελέσµατα της ταξινόµησης µε χρήση της απόστασης Bayes και
χαρακτηριστικά τα µέγιστα πλάτη που παρατηρούνται στο φάσµα στις περιοχές των 8
πρώτων αρµονικών της τριάδας σηµείων µέτρησης {2,8,9}, θεωρείται ότι ικανοποιούν
τους στόχους του διαγνωστικού συστήµατος. Συγκεκριµένα µέσω αυτής της διαδικασίας
επιτυγχάνονται τα ακόλουθα:
Υψηλό επίπεδο ταξινόµησης (97%): Το επίπεδο ίσως βελτιωθεί περαιτέρω µε την
αύξηση του διαθέσιµου δείγµατος.
104
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Μικρός χρόνος διάγνωσης: Οι απαραίτητες πράξεις που απαιτούνται από το
σύστηµα διάγνωσης για να ταξινοµήσει ένα νέο προϊόν στην γραµµή παραγωγής αφού έχει
προηγηθεί η εκπαίδευση, µπορούν να εκτελεστούν από ένα συνηθισµένο υπολογιστικό
σύστηµα σχεδόν ακαριαία.
Μικρός χρόνος επανεκπαίδευσης του ταξινοµητή: Η εκπαίδευση ταξινοµητών µε
χρήση αποστάσεων δεν παρουσιάζει δυσκολία ή υψηλό υπολογιστικό φόρτο.
Μείωση των σηµείων µέτρησης: Όπως φαίνεται και στο γράφηµα 5.16 ακόµα και µε
χρήση µόνο δύο σηµείων µέτρησης, επιτυγχάνεται ταξινόµηση σε ποσοστό µέχρι και
96.3% για τα ζεύγη σηµείων µέτρησης {6,8} και {6,9}. Η µείωση των σηµείων µέτρησης
εκτός από ελάττωση του αρχικού κόστους και απλούστευση της διάταξης ελέγχου,
σηµαίνει και µείωση του υπολογιστικού χρόνου. Στην περίπτωση που διατηρηθούν τα τρία
σηµεία µέτρησης, δίνεται η δυνατότητα για έλεγχο των αισθητήρων (sensor validation)
µέσω της πλεονάζουσας πληροφορίας (redundancy).
Το τελικό διαγνωστικό σύστηµα (σχήµα 5.17) ικανοποιεί τις σχεδιαστικές
απαιτήσεις του βιοµηχανικού κατασκευαστή, όπως αυτές περιγράφονται στην ενότητα 0.
Μετά από 2 λεπτών λειτουργία του πλυντηρίου στο πρόγραµµα φυγοκέντρησης, το
διαγνωστικό σύστηµα µετά από κατάλληλη εκπαίδευση µπορεί να αναγνωρίσει σε
ικανοποιητικό ποσοστό τον συγκεκριµένο τύπο βλάβης.
105
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Σχήµα 5.17 Μετρήσεις από τα σηµεία 2,8 και 9, παρέχουν την απαραίτητη
πληροφορία στην γραµµή παραγωγής για ταξινόµηση σε επίπεδο 97%
Η επανεκπαίδευση του διαγνωστικού συστήµατος µπορεί να πραγµατοποιείται ανά
τακτά χρονικά διαστήµατα ή σε κάθε νέα µέτρηση, µε κάποια αύξηση όµως του χρόνου
διάγνωσης. Για την διαδικασία της επανεκπαίδευσης µπορεί να χρησιµοποιηθεί η τεχνική
του κινούµενου "παραθύρου", ώστε να επιτυγχάνεται η ανανέωση της πληροφορίας µε
ταυτόχρονη οικονοµία στους απαιτούµενους υπολογισµούς. Έτσι, µπορεί για τον
υπολογισµό των σχέσεων (5.23) και (5.25) να λαµβάνονται υπόψη τα Μ τελευταία
δείγµατα από τα συνολικά
Ν, αν είναι επιθυµητό ο µέσος και η συνδιασπορά να
ενσωµατώνουν την πλέον πρόσφατη πληροφορία. Συγκεκριµένα, ο µέσος στην σχέση
(5.23) γίνεται,
106
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
⎤
⎡ N i
⎢ ∑ fs (1) ⎥ ⎡ j
⎤
⎥ ⎢ ms ( 1 ) ⎥
⎢ i = N N− M +1
j
i
1 ⎢ ∑ f s ( 2 ) ⎥ ⎢ ms ( 2 ) ⎥
m sj =
⎥=⎢
⎢
⎥
M ⎢ i = N − M +1
⎥ ⎢ L ⎥
L
⎥ ⎣m sj ( 24 )⎦
⎢ N i
f
(
24
)
⎥
⎢ ∑ s
⎦
⎣i = N − M +1
(5.26)
και η συνδιασπορά,
N
⎡
(Ssj (1))2
∑
⎢
⎢ Ni =N −M +1
1 ⎢ ∑(Ssj ( 1))(Ssj ( 2 ))
Csj =
⎢
M − 1 ⎢ i =N −M +1
L
⎢ N j
j
⎢ ∑(Ss ( 1))(Ss ( 24 ))
⎣i =N −M +1
⎤
( 1))(Ssj ( 24 ))⎥
i = N −M +1
i = N −M +1
⎥
N −1
N
2
j
j
j
⎥
(
)
(
)(
)
L
S
(
2
)
S
(
2
)
S
(
24
)
∑
∑
s
s
s
⎥ (5.27)
i = N −M +1
i = N − M +1
⎥
L
L
L
N
N
⎥
2
(Ssj ( 24))(Ssj ( 2 )) L
(Ssj ( 24)) ⎥
∑
∑
i = N − M +1
i = N −M +1
⎦
∑(S
N
j
s
( 1))(Ssj ( 2 )) L
∑(S
N
j
s
Κρίνεται πάντως απαραίτητο να πραγµατοποιείται επανεκπαίδευση, όταν υφίσταται
οποιαδήποτε αλλαγή που µπορεί να επηρεάσει φυσικά χαρακτηριστικά του προϊόντος, τα
οποία συνδέονται µε τις µετρήσεις (όπως για παράδειγµα αλλαγή υλικών κατασκευής, ή
κατασκευαστικές τροποποιήσεις του παραγόµενου µοντέλου).
Η απόφαση ταξινόµησης υπό την παραδοχή της κανονικής κατανοµής λαµβάνεται
σύµφωνα από την σχέση (4.20) και αν η απόσταση Bayes d j ( x ) , κανονικοποιηθεί
σύµφωνα µε την σχέση (4.2), η ποσότητα d *j ( x ) δίνει ένα βαθµό συµµετοχής του x για
κάθε κατηγορία j. Αυτό σηµαίνει, ότι η ποσότητα
d *j ( x ) µπορεί να χρησιµεύσει ως
ένδειξη για πιθανή επανεξέταση του x, αν κρίνεται ότι το σηµείο αυτό δεν βρίσκεται
ξεκάθαρα κοντά στο κέντρο µιας κλάσης. Αν η d i* ( x ) είναι η ελάχιστη κανονικοποιηµένη
απόσταση Bayes του x από τα κέντρα των j κλάσεων, καθορίζοντας κατάλληλο όριο e, το
διαγνωστικό σύστηµα µπορεί να θεωρεί αταξινόµητα τα x αν,
d i* ( x ) − d *j ( x ) ≤ e , ∀j ≠ i
(5.28)
Στην περίπτωση που θεωρηθεί το x αταξινόµητο, το προϊόν αποµακρύνεται από την
γραµµή παραγωγής για περαιτέρω έλεγχο. Η επιλογή του e γίνεται αφού εκτιµηθεί η
107
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
σπουδαιότητα δύο κλασικών αλλά αντικρουόµενων απαιτήσεων του διαγνωστικού
συστήµατος:
• Η απαίτηση για υψηλό ποσοστό σωστής διάγνωσης (µεγάλο e).
• Η απαίτηση για χαµηλό ποσοστό εσφαλµένων συναγερµών (µικρό e).
5.7 Συµπεράσµατα και µελλοντική εργασία
Στις προηγούµενες ενότητες παρουσιάστηκε ένα αποδοτικό αυτοµατοποιηµένο
σύστηµα ταξινόµησης σε γραµµή παραγωγής πλυντηρίων, το οποίο εκµεταλλεύεται
διαφοροποιήσεις των κραδασµών που παρουσιάζονται στην επιφάνεια του πλυντηρίου
όταν αυτό τίθεται δοκιµαστικά σε λειτουργία. Το πρόβληµα που επιλύεται µε αυτήν τη
µεθοδολογία, συνήθως δεν αντιµετωπίζεται καθόλου στην παραγωγή µε αποτέλεσµα την
υποβάθµιση της ποιότητας των παραγοµένων προϊόντων. Η µη αυτοµατοποιηµένη
διαδικασία ελέγχου από εξειδικευµένο προσωπικό ελέγχου είναι χρονοβόρα και µε
αµφίβολα αποτελέσµατα. Το υπό εξέταση προϊόν είναι περίπλοκο για να εφαρµοστούν
αυτούσιες τεχνικές που εφαρµόζονται στην ανάλυση κραδασµών των κινητήρων, µια
περιοχή διαγνωστικής που έχει αναπτυχθεί τελευταία για απλούστερα περιστρεφόµενα
συστήµατα. Επίσης οι απαιτήσεις της γραµµής παραγωγής για µη χρονοβόρες διαδικασίες
ελέγχου καθιστούν την προσέγγιση αυτή ανέφικτη.
Ο συνδυασµός της αναγνώρισης προτύπου και της ανάλυσης κραδασµών µε την
ταυτόχρονη χρήση ειδικών αισθητήρων κραδασµών (laser ιντερφεροµέτρων) δίνει την
δυνατότητα να ξεπεραστούν οι προαναφερθείσες δυσκολίες. Το σήµα των κραδασµών που
συλλέγχθηκε από συγκεκριµένα σηµεία στην επιφάνεια του πλυντηρίου
µέσω των
ιντερφεροµετρικών αισθητήρων, µετατράπηκε από το πεδίο του χρόνου στο πεδίο της
συχνότητας και κανονικοποιήθηκε. Το βασικό πρόβληµα που έπρεπε να αντιµετωπιστεί σ'
αυτή την προσέγγιση, ήταν η εύρεση των κατάλληλων διαχωριστικών χαρακτηριστικών
στο σήµα των κραδασµών και του κατάλληλου ταξινοµητή, που θα επέτρεπε την επιτυχή
αντιστοίχηση του σήµατος µε την κατάσταση του υπό εξέταση πλυντηρίου.
108
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
Ο υψηλός αριθµός δυνατών επιλογών διαχωριστικών χαρακτηριστικών και
ταξινοµητών σε συνδυασµό µε τον όγκο των µετρήσεων δυσχέραναν την διαδικασία
εύρεσης ενός συνδυασµού που να ικανοποιεί τις απαιτήσεις του βιοµηχανικού
κατασκευαστή. Έτσι µετά από µια πρώτη επιλογή χαρακτηριστικών, που επιλέχθηκαν
λόγω των φυσικών ιδιοτήτων τους, η προσοχή επικεντρώθηκε σ' αυτά που επιτύγχαναν
υψηλά ποσοστά ταξινόµησης. Αντίστοιχα, µειώθηκαν οι ταξινοµητές σ' αυτούς που
πραγµατοποιούσαν ικανοποιητική ταξινόµηση σε µικρό σχετικά χρόνο, ενώ ταυτόχρονα
χρησιµοποιούσαν πληροφορία από λίγα σηµεία µέτρησης, γεγονός που µειώνει το κόστος
διάγνωσης.
Η τελική πρόταση ταξινοµεί σε µικρό χρόνο και σε ικανοποιητικό ποσοστό τις υπό
έλεγχο συσκευές,
κάνοντας χρήση της απόστασης Bayes για χαρακτηριστικά που
προκύπτουν από τα µέγιστα των οκτώ πρώτων περιττών αρµονικών της βασικής
συχνότητας περιστροφής του κάδου, για τα σηµεία µέτρησης 2, 8 και 9. Ο συγκεκριµένος
µηχανισµός διάγνωσης είναι άµεσα εξαρτηµένος από την ποιότητα και την ποσότητα των
διαθέσιµων δεδοµένων για την διαδικασία της εκµάθησης και συνεπώς τα αποτελέσµατα
που παρουσιάζονται, πρέπει να θεωρηθούν ότι αποτελούν ένδειξη και όχι απόδειξη της
καλής λειτουργίας του διαγνωστικού συστήµατος.
Οι δυνατές κατηγορίες που µπορεί να ταξινοµήσει το σύστηµα µπορούν να
αυξηθούν περαιτέρω, αλλά πρέπει να επισηµανθεί ότι είναι απαραίτητο ένα µεγάλο και
αντιπροσωπευτικό δείγµα για κάθε κατηγορία, κατά την φάση της εκµάθησης. Έτσι µόλις
κατασκευαστεί το πρωτότυπο από την ανάδοχο εταιρεία, θα είναι εφικτό να
πραγµατοποιηθούν αρκετές µετρήσεις για την κάθε κατηγορία και να είναι δυνατή η
ταξινόµηση και άλλων κατηγοριών όπως οι συσκευές τύπου g, µε παραµορφωµένο ή
µετατοπισµένο το γρανάζι µετάδοσης κίνησης.
Πάντως πριν αυξηθούν οι κατηγορίες ταξινόµησης για τον εντοπισµό και άλλων
κατηγοριών βλαβών, θα πρέπει να εξετασθεί τι είναι αυτό που ευθύνεται για την εµφάνιση
ελαττωµατικών προϊόντων και να ληφθούν όλα τα δυνατά µέτρα για την βελτίωση της
ποιότητας, αφού συνήθως απλές διορθωτικές παρεµβάσεις και επισηµάνσεις στην
διαδικασία συναρµολόγησης µειώνουν τις εµφανιζόµενες βλάβες. Πρέπει να προσεχθεί
ιδιαίτερα, ότι η ύπαρξη ενός αυτοµατοποιηµένου συστήµατος διάγνωσης µπορεί να
109
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
οδηγήσει σε εφησυχασµό και χαλάρωση στον έλεγχο της παραγωγικής διαδικασίας ενώ
όπως επισηµάνθηκε στην εισαγωγή ένα τέτοιο σύστηµα είναι συµπληρωµατικό και δεν
υποκαθιστά τον ανθρώπινο έλεγχο.
Αν και οι ταξινοµητές απόστασης αποτελούν µια κατηγορία απλών και διαφανών
ταξινοµητών που στην συγκεκριµένη εφαρµογή επέδειξαν αξιόλογα αποτελέσµατα, ίσως
υπάρχει δυνατότητα πειραµατισµού µε ταξινοµητές νευρωνικών δικτύων για ακόµη
καλύτερα αποτελέσµατα. Επίσης στην περίπτωση που κάποια νέα κατηγορία βλάβης δεν
ταξινοµείται ικανοποιητικά υπάρχει ακόµα προς πειραµατισµό η περιοχή µεταβατικής
κατάστασης (ανύψωσης και πτώσης στροφών του κινητήρα) µε χρήση των wavelets.
Με βάση τις παρατηρήσεις που έγιναν για την επιλογή των διακριτικών
χαρακτηριστικών στο κεφάλαιο 5.4, η επιλογή των µεγίστων στις περιττές αρµονικές έγινε
µετά από απλή παρατήρηση και κατόπιν ενδείξεων των αντιστοίχων KDE και των
σηµαντικών στατιστικών χαρακτηριστικών του φάσµατος. Είναι γεγονός ότι δεν ήταν και
οι οκτώ πρώτες περιττές αρµονικές εξίσου σηµαντικές µε βάση αυτές τις ενδείξεις. Αυτό
οδήγησε στην αφαίρεση των µεγίστων που παρατηρούνται στην 9η και στην 13η αρµονική
από το διάνυσµα των διακριτικών χαρακτηριστικών χωρίς κάποια ιδιαίτερη επίπτωση στα
αποτελέσµατα. Αυτή η µείωση των διακριτικών χαρακτηριστικών κατά 25% είναι πιθανή
και στο τελικό διαγνωστικό σχήµα, αλλά θα πρέπει να επαληθευθεί πρώτα µε µεγαλύτερο
όγκο δεδοµένων.
Ένα κρίσιµο σηµείο που χρήζει ιδιαίτερης προσοχής είναι η διαδικασία πρόσκτησης
των δεδοµένων και συγκεκριµένα το στάδιο που αφορά την λειτουργία των
ιντερφεροµετρικών αισθητήρων. Στο παράρτηµα αναφέρονται αναλυτικά οι αρχές
λειτουργίας και οι παράγοντες που επηρεάζουν την ακρίβεια µέτρησης των αισθητήρων.
Επειδή ακριβώς η ποιότητα των µετρήσεων είναι κρίσιµος παράγοντας για την περαιτέρω
επιτυχηµένη επίδοση του συστήµατος κρίθηκε σκόπιµο να προταθεί η αυτοµατοποιηµένη
διάγνωση βλαβών στο σύστηµα των αισθητήρων. Μια τέτοια προσθήκη στο σύστηµα
διάγνωσης θα βελτιώσει την απόδοσή του όσον αφορά λανθασµένες ταξινοµήσεις που θα
οφείλονται σε βλάβες των αισθητήρων. Η πρόταση αυτή έχει εγκριθεί για υλοποίηση από
την Ευρωπαϊκή Ένωση (Ref. number:ERB-4001-GT-96-5759) ως προσθήκη στο
110
ΑΝΑΠΤΥΞΗ ΕΝΟΣ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟΥ ΣΥΣΤΗΜΑΤΟΣ ΤΑΞΙΝΟΜΗΣΗΣ
πρόγραµµα MEDEA (1996) και αποτελεί ουσιαστικά την συνέχεια αυτής της εργασίας
στην περιοχή της διάγνωσης βλαβών των αισθητήρων (sensor fault detection).
Ανατρέχοντας στις προηγούµενες σχετικές εργασίες που αναφέρθηκαν στην ενότητα
2.5 αλλά και στην σχετική βιβλιογραφία, είναι φανερό ότι οι εφαρµογές τέτοιου τύπου δεν
ακολουθούν αυστηρά µια γενικά αποδεκτή θεωρία, αλλά υλοποιούνται µε βάση τις
ιδιαιτερότητες που παρουσιάζει κάθε φορά ο χώρος εφαρµογής. Η προσέγγιση αυτή
µπορεί να αντιµετωπιστεί αυστηρά αν εξετασθεί από θεωρητική οπτική γωνία, γιατί κάθε
βήµα της δεν τεκµηριώνεται ως το βέλτιστο µεταξύ άλλων, αλλά δικαιολογεί την επιλογή
της στην πράξη από τα αποτελέσµατα. Το κέρδος πέρα από την δυνατότητα υλοποίησης
της προτεινόµενης λύσης στον συγκεκριµένο χώρο εφαρµογής, είναι οι πιθανές
γενικεύσεις της προσέγγισης που θα επιτρέψουν την επέκτασής της σε παρόµοια
προβλήµατα. Έτσι η προσέγγιση αυτή µπορεί να αντιµετωπιστεί ως επέκταση της
κλασικής ανάλυσης κραδασµών, η οποία µπορεί να εφαρµοστεί σε συνθετότερα
ηλεκτροµηχανικά περιστρεφόµενα συστήµατα απ' ότι είναι οι απλοί ηλεκτροκινητήρες.
111
ΠΑΡΑΡΤΗΜΑ
6 Αναφορές
Ahlea (1996),"Pattern recognition toolbox", User's guide, Ahlea Systems Corporation,
Canada
Barkov A. V., (1996), "Optimization of Monitoring and Diagnostics Methods for the
Rotating Machines by Vibration and Noise Measurements", Proceedings of the
4th International Congress on Sound and Vibration, Vol. 3, Russia, June,
p.1573.
Barschdorff D., (1991), Comparison of Neural and Classical Decision Algorithms", IFAC
Fault Detection, Supervision and Safety for Technical Processes, Baden-Baden,
Germany, p.409.
Baxter R. L. and Bernhard D. L., (1968), "Vibration an indicating tool", Mechanical
Engineering, March.
Bellman R. E., (1961), "Adaptive Control Processes", Princeton University Press, New
Jersey.
Bezdek J., (1981),"Pattern Recognition with Fuzzy Objective Function Algorithms",
Plenum Press, New York.
Bowman A. and Foster P., (1993), "Density Based Exploration of Bivariate Data",
Statistics and Computing, Vol. 3, p.171.
Brüel & Kjær (1980), "Permanent Vibration-Monitoring", Brüel & Kjær technical manual,
series: Maintenance in modern industry.
Burth M., Filbert D., Guhmann C., Ropke K. and Schneider C., (1996), "Non-Linear
Approach to the Fault Diagnosis of Low Power Motors", Engineering
Simulation, Vol. 13, p. 1049.
Cannon R., Dave J. and Bezdek J., (1986), "Efficient implementation of the fuzzy c-mean
clustering algorithms", IEEE Transactions on Pattern Analysis and Machine
Intelligence, Vol.8, No. 2, p. 248.
Chatfield C. and Collins A. J., (1980), "Introduction to Multivariate Analysis", Chapman
& Hall, London.
- 127 -
ΠΑΡΑΡΤΗΜΑ
Dubois D. and Prade H., (1980), "Fuzzy sets and systems, theory and applications",
Academic Press, London.
Duda R. O. and Hart P. E., (1973), "Pattern classification and scene analysis", John Wiley,
New York.
Efron, B. and Tibshirani, R. J., (1993), "An Introduction to the Bootstrap", Chapman and
Hall, New York.
Fayyad U. M. and Irani K. B., (1992), "On the Handling of Continuous-valued Attributes
in Decision Tree Generation", Machine Learning, Vol. 8, p. 87.
Fogliardi R., (1997), " Fuzzy identification of noisy electric motors on the production
line", Proceedings Eufit'97, Vol. 3, Aachen, September, p. 1755.
Frank P. M., (1990), "Fault diagnosis in dynamic systems using analytical and knowledgebased redundancy: a survey and some new results", Automatica, Vol. 26, p.
459.
Fukunaga K., (1972), "Introduction to statistical Pattern recognition", Academic Press,
New York.
Gaga L., Moustakis V., Charisis G. and Orfanoudakis S., (1993), "IDDD: An Inductive
Domain Dependent Decision Algorithm", Proceedings of European Conference
on Machine Learning, Springer-Verlag.
Gath I. and Geva A. B., (1989), "Unsupervised Optimal Fuzzy Clustering", IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 11, p.773.
Goupillaud P., Grossmann A. and Morlet J., (1984), "Cycle-Octave and related transforms
in Seismic Signal Analysis", Geoexploration, Vol. 23,p. 85.
Gustafson D. E. and Kessel W. C., (1979),"Fuzzy Clustering with a Fuzzy Covariance
Matrix", Proceedings of IEEE CDC, San Diego, p.761.
Hamer P. S., (1988), "Acceptance testing of electric motors and generators", IEEE
transactions on Industry Applications, Vol. 24, No. 6, p. 1138.
Hand D., (1981),"Discrimination and Classification", Wiley and Sons, New York.
Hemminger T. L. and Pao Y., (1994), "Detection and Classification of Underwater
Transients Using Neural Networks, IEEE Transactions on Neural Networks,
Vol. 5, No. 5, September.
Huynh Q., Cooper L., Intrator N. and Shouval H., (1997), "Classification of Underwater
Mammals using Feature Extraction Based on Time-Frequency Analysis and
- 128 -
ΠΑΡΑΡΤΗΜΑ
BCM Theory", IEEE transactions On Signal Processing, Special issue on
Neural Networks, Vol. 7, No. 5, November.
ISO 10816-1, (1995), "Mechanical vibration -- Evaluation of machine vibration by
measurements on non-rotating parts -- Part 1: General guidelines ",
International Standard Organization, Geneva.
Jain A. K. and Dubes R. C., (1988), "Algorithms for clustering data", Prentice Hall , New
Jersey.
Jang S. R., (1993), "ANFIS: Adaptive-Network-Based Fuzzy Inference System", IEEE
Transactions on Systems, Man and Cybernetics, Vol.23, No. 3, May, p. 665.
Kruse R., Gebhardt J. and Klawonn F., (1994), "Foundations of Fuzzy Systems", Wiley,
Chichester, March.
Lyon R., (1987), "Machinery noise and diagnostics", Butteworth Publishers, London,
October.
Man Y. and Gath I., (1994), "Detection and Separation of Ring-Shaped Clusters Using
Fuzzy Clustering", IEEE Transactions on Pattern Analysis and Machine
Intelligence, Vol. 16, No. 8, August.
MEDEA, (1996), "Quality control for house-hold appliances by on-line evaluation for
mechanical defects", EC project in Standards Measurements and Testing,
January, reference number: SMT4952016.
Meir W., Weber R. and Zimmermann H. J., (1994), "Fuzzy data analysis - Methods and
industrial applications", Fuzzy Sets and Systems, Vol. 61, p. 19.
Morrison D. and Upton, D., (1994), "Fault diagnosis and computer integrated
manufacturing systems", IEEE Transactions on Engineering Management, Vol.
41, February, p. 69.
Newland D. E., (1993), " Random Vibrations, Spectral & Wavelet Analysis", Longman
Scientific & Technical, UK, Essex.
Nunez M., (1990), "Decision Tree Induction using Domain Knowledge", in "Current
Trends in Knowledge Acquisition", Wielinga B. et al. (Eds.), Netherlands: IOS
Press, p.276.
Obaitat M. S., (1993), "On the Characterization of Ultrasonic Transducers Using Pattern
Recognition", IEEE Transactions on Systems Man and Cybernetics, Vol. 23,
No. 5, p. 1443.
- 129 -
ΠΑΡΑΡΤΗΜΑ
Paone N. and Scalise L., (1997), " Non invasive laser measurement techniques in on-line
diagnostics of house-hold appliances", Proceedings of Eufit'97, Vol. 3, Aachen,
September, p. 1738.
Poling L. R., (1966), "Vibration Analysis-Maintenance Moneysaver", Safety Maintenance.
Pouliezos A. and Stavrakakis G., (1994), "Real time fault monitoring of industrial
processes", Kluwer Academic Publishers.
Quinlan J. R., (1986), "Induction of decision trees", Machine learning, Vol. 1, p. 81.
Quinlan J. R., (1993), "C4.5 Programs for Machine Learning", Morgan Kaufman
Publishers, London.
Rodriguez G. and Rivera P., (1986), "A practical Approach to Expert Systems for Safety
and Diagnostics", InTech, July.
Röpke K. and Filbert D. (1994), "Unsupervised classification of Universal Motors using
modern Clustering Algorithms", IFAC Fault Detection, Supervision and Safety
for Technical Processes, p. 695.
Shimshoni Y., (1995), "Introduction to Classification Methods", Lecture notes, School of
Mathematical Sciences, Tel Aviv University, Israel.
Shirley R. S. and Fortin, D. A., (1986), "Developing an Expert System for Process Fault
Detection and Analysis", InTech, April.
Shumway R. H., (1982), "Discriminant analysis for time series", in Handbook of statistics,
Editors: Krishnaiah P. R. and Kanal L.N, North Holland, p.1.
Silverman B., (1986), Density Estimation for Statistics and Data Analysis", Chapman and
Hall, London.
Smith W. W. and Smith J. M., (1995), "Handbook of Real-time Fast Fourier Transforms",
IEEE Press, NJ USA.
Spangler S., Fayyad U. M. and Uthurusamy R., (1988), "Induction of Decision Trees from
Inconclusive Data", Proceedings of the 5th International Workshop in Machine
Learning '92, Editor: Arbor A., San Mateo, Morgan Kaufmann, p. 146.
Stone C. J., (1977), "Non parametric regression and its applications", The Annals of
Statistics, p. 595.
Strackeljan J., D. Behr, T. Kocher (1997), "Fuzzy-pattern recognition for automatic
detection of different teeth substances", Fuzzy Sets and Systems, No. 85, p.
275.
- 130 -
ΠΑΡΑΡΤΗΜΑ
Strejc V., (1981), "Trends in Identification" Automatica, Vol. 17, Νo.1.
Takagi H. and Sugeno M., (1983), "Derivation of fuzzy control rules from human
operator's control actions", Proceedings of IFAC Symposium on Fuzzy
Information, Knowledge Representation and Decision Analysis, July, p. 55.
Tate A., (1996), "Pattern Recognition Analysis of In Vivo Magnetic Resonance Spectra",
Ph.D. thesis, University of Sussex, Brighton, September.
Tumer I. Y., Kristin W. L. and Busch-Vishniac I. J., (1996), "Extraction of fault patterns
on SLS Part Surfaces Using the Karhunen-Loeve Transform", Proceedings of
the 1996 Solid Freedom Fabrication Symposium, Austin, Texas, USA, p. 575.
Turing Institute, (1993), "CN2" and "NewID", Software Documentation, SCO, Glasgow.
Utgoff P. E., (1989), "Incremental induction of decision trees", Machine Learning, Vol. 4,
No. 2, p. 161.
Van De Merkt, (1992), "NFDT: A System that Learns Flexible Concepts Based on
Decision Trees for Numerical Attributes", Proceedings of the 9th International
Workshop in Machine Learning '92, Editors: Sleeman D. & Edwards P., San
Mateo, Morgan Kaufmann, p. 322.
Vance L. C., (1983), "A Bibliography of Statistical Quality Control Chart Techniques,
1970-1980", Journal of Quality Technology, No. 15, p. 59.
Wand M. P. and Jones M. C., (1995), "Kernel Smoothing", Chapman and Hall, London.
Willsky A. S., (1976), " A survey of design methods for failure detection in dynamic
systems", Automatica, Vol. 12, No. 12.
Zadeh L. A., (1977), "Classification and Clustering", Academic Press, New York.
Zieba S., Sidahmed M. and Dubuisson B. (1994), "Tool Wear Monitoring and Diagnosis in
Milling using Vibration Signal", IFAC Fault Detection, Supervision and Safety
for Technical Processes, p. 451.
Αδαµόπουλος Σ.,(1988),"Μέτρηση Ταλαντώσεων", τεχνικό εγχειρίδιο, ∆.Ε.Η., Α.Η.Σ.
Αλιβερίου.
∆ούνιας Γ.,(1995),"Παρακολούθηση λειτουργίας συστηµάτων ηλεκτροπαραγωγής µε
µεθοδολογίες τεχνητής νοηµοσύνης", διδακτορική διατριβή, Πολυτεχνείο
Κρήτης, Ιούνιος.
Λουκής Ε., (1993), "Συµβολή στην διάγνωση βλαβών αεροστροβίλων µε χρήση µεθόδων
ταχείας απόκρισης", διδακτορική διατριβή, Ε.Μ.Π., Φεβρουάριος.
- 131 -
ΠΑΡΑΡΤΗΜΑ
- 132 -
ΠΑΡΑΡΤΗΜΑ
7 ΠΑΡΑΡΤΗΜΑ
7.1 ΤΟ ΣYΣΤΗΜΑ ΤΩΝ ΙΝΤΕΡΦΕΡΟΜΕΤΡΙΚΩΝ ΑΙΣΘΗΤΗΡΩΝ
7.1.1 Μέτρηση κραδασµών µε οπτικούς αισθητήρες
Οι τεχνικές που χρησιµοποιούν οπτικούς αισθητήρες υπερτερούν σε σχέση µ'αυτές
που χρησιµοποιούν αισθητήρες επαφής στα ακόλουθα σηµεία:
Η επαφή του αισθητήρα µπορεί να αλλάξει τα χαρακτηριστικά του κραδασµού και
µάλιστα πάνω στην περιοχή µέτρησης
Εν γένει σε εφαρµογές όπου είναι σηµαντική η διατήρηση της δοµής του
εξεταζοµένου
αντικειµένου
και
πραγµατοποιείται
σε
ελεγχόµενες
συνθήκες
(αεροσύραγγες, θάλαµοι ελέγχου) οι οπτικοί αισθητήρες επιδρούν ελάχιστα ως καθόλου
στην µέτρηση.
Τα επιταχυνσιόµετρα αφής έχουν πιο περιορισµένη λειτουργική κλίµακα εφαρµογών
και έχουν δυσκολίες µέτρησης σε περιπτώσεις όπου έχουµε απότοµους κραδασµούς,
υψηλές θερµοκρασίες και περιστροφική κίνηση.
Η ταχύτητα ελέγχου και η µη ιδιαίτερη προετοιµασία παίζουν σηµαντικό ρόλο στην
εφαρµογή αφού ο στόχος είναι για διάγνωση κατ'ευθείαν στην γραµµή παραγωγής όπου
κάθε χρόνος πολλαπλασιάζεται µε τον αριθµό των παραγοµένων κοµµατιών. Η πηγή δε
- 133 -
ΠΑΡΑΡΤΗΜΑ
του laser είναι χαµηλής ισχύος (<1 mw) και δεν αποτελεί πρόβληµα από πλευράς
οικονοµίας ή ασφάλειας.
Ένας τέτοιος αισθητήρας µπορεί να λειτουργήσει σε µία ευρεία περιοχή κραδασµών
και συχνότητας (τυπικά και πάνω από 300 kHz.). Η µέτρηση αφορά την ταχύτητα της
επιφάνειας αλλά µε ολοκλήρωση και διαφόριση των µετρήσεων µπορούν να ληφθούν η
θέση και η επιτάχυνση αντίστοιχα.
Το γεγονός ότι χρησιµοποιείται οπτική τεχνική και µάλιστα µε εξαρτήµατα µεγάλης
ακρίβειας δεν προϋποθέτει και ανάλογες εργαστηριακές συνθήκες. Τουναντίον οι οπτικοί
αισθητήρες λειτουργούν µε ευχέρεια σε εργοστασιακό περιβάλλον. Ενδεικτικά µπορούν
να λειτουργήσουν µέχρι και σε 15m απόσταση σε µη ειδικές επιφάνειες (ανακλαστήρες).
Η εστίαση γίνεται µέσω ειδικών φακών αλλά οι αισθητήρες µε laser προσφέρουν
εξαιρετικές δυνατότητες εστίασης αφού το λειτουργικό βάθος πεδίου µπορεί να είναι για
παράδειγµα σε µια θάµπη λευκή επιφάνεια 3m σε µια απόσταση 5m. Στην περίπτωση
ειδικών ανακλαστήρων αυτό το βάθος πεδίου µπορεί κατά περίπτωση και να αυξηθεί.
Ένα από τα προβλήµατα των οπτικών αισθητήρων είναι αυτό της διαστιγµάτωσης
(speckle). Ιδιαίτερα στην περίπτωση που έχουµε µη ειδική ανακλαστική επιφάνεια η
ακτίνα του laser ανακλάται προς διάφορες διευθύνσεις εξαιτίας της υφής της επιφανείας.
Εκτός από την απώλεια ισχύος σήµατος που µπορεί να φτάσει σε µεγάλο ποσοστό έχουµε
και την περίπτωση κίνησης ως προς την κάθετη επιφάνεια πρόσπτωσης που σε συνδυασµό
µε την ανωµαλία της ανακλούµενης επιφάνειας µπορεί να δώσει παραπλανητικές
µετρήσεις. Η αύξηση της ισχύος και της ποιότητας του σήµατος είναι δύο από τα µέτρα
που εφαρµόζονται για την αντιµετώπιση αυτών των προβληµάτων.
- 134 -
ΠΑΡΑΡΤΗΜΑ
7. 1. 2 Αρχές λειτουργίας
Τα περισσότερα ιντερφερόµετρα που κυκλοφορούν στην αγορά βασίζονται στον
αρχικό τύπο κατασκευής του Michelson όπου µία ακτίνα laser διακλαδίζεται σε δύο:
α. µία ακτίνα σήµατος και
β. µία αναφοράς
Η ακτίνα σήµατος κατευθύνεται µέσω κατάλληλης διάταξης πάνω στην προς έλεγχο
επιφάνεια. Στην συγκεκριµένη περίπτωση έχουµε έλεγχο δονήσεων αλλά η αρχή
λειτουργίας εφαρµόζεται εξίσου και για άλλες περιπτώσεις όπως έλεγχος απόστασης,
µελέτη παραµόρφωσης, µέτρηση πάχους κ.α. Η ακτίνα σήµατος ανακλάται είτε από την
επιφάνεια είτε από κατάλληλα τοποθετηµένους ανακλαστήρες και στην συνέχεια
επιστρέφει και ενώνεται µε την ακτίνα αναφοράς.
Στην περίπτωση που η υπό έλεγχο επιφάνεια δονείται η διαφορά αυτή µεταξύ των
δύο σηµάτων είναι αισθητή και µετρήσιµη εξαιτίας της διαφοράς της έντασης της
διαµόρφωσης του σήµατος που προκύπτει από την ανάµειξη των σηµάτων. Το µεικτό αυτό
σήµα διαχωρίζεται σε δύο ξεχωριστά κανάλια µε τέτοιο τρόπο ώστε τα δύο σήµατα να
έχουν µεταξύ τους µια διαφορά φάσης +/- 90 µοίρες ανάλογα µε την φορά της κίνησης της
επιφάνειας. Με ηλεκτρονικό τρόπο τα σήµατα αναµιγνύονται πάλι µε το σήµα αναφοράς
και µετατρέπονται σε ηλεκτρικό ρεύµα για να προκύψει ένα αναλογικό σήµα τάσης που
είναι ευθέως ανάλογο στην στιγµιαία ταχύτητα της κινούµενης επιφάνειας.
- 135 -
ΠΑΡΑΡΤΗΜΑ
Σχήµα 7.1 Ενδεικτικό σχέδιο λειτουργίας ενός ιντερφερόµετρου τύπου Michelson µε
δυνατότητα αναγνώρισης κατεύθυνσης κίνησης λόγω πόλωσης του σήµατος
7.1.2.1 Ακρίβεια µέτρησης
Η ακρίβεια µέτρησης εξαρτάται άµεσα από το θεµελιώδες σήµα και το σήµα
αναφοράς. Συγκεκριµένα η περίοδος του θεµελιώδους σήµατος έχει µήκος λ0/2n µε λ0 το
µήκος κύµατος στο κενό και n τον δείκτη διάθλασης στον αέρα. Έτσι θα πρέπει να
εξεταστούν οι παράµετροι που επηρεάζουν αυτούς τους δύο όρους. Αν απαιτείται µέγιστη
ακρίβεια θα πρέπει να ελαχιστοποιηθούν οι µικροµετακινήσεις το σφάλµα συνηµιτόνου
και το σφάλµα Abbé.
Συνεπώς στα ιντερφερόµετρα τύπου Michelson η ακρίβεια µέτρησης εξαρτάται από
τους ακόλουθους παράγοντες:
- 136 -
ΠΑΡΑΡΤΗΜΑ
την απόκλιση (δ) λόγω διαφορετικών συνθηκών θερµοκρασίας και πίεσης από αυτές
της αναφοράς
την ακρίβεια του οργάνου µέτρησης (Σi)
το σφάλµα συνηµιτόνου και
το σφάλµα Abbé.
7.1.2.2 Η απόκλιση (δ)
Η απόκλιση λαµβάνει χώρα όταν οι συνθήκες λειτουργίας δεν είναι κοντά στις
κανονικές όσον αφορά την θερµοκρασία και την πίεση (συνήθως συνθήκες αναφοράς είναι
20 οC και 1013 hPa). Η απόκλιση είναι η διαφορά της µετρούµενης τιµής απ' αυτήν που θα
προέκυπτε υπό κανονικές συνθήκες. Η τιµή της απόκλισης είναι γνωστή αν είναι γνωστές
και οι συνθήκες περιβάλλοντος και συνεπώς η διόρθωση είναι απλή. Αν Mc είναι η
διορθωµένη τιµή που αντιστοιχεί στις κανονικές συνθήκες 20 οC και 1013 hPa και Μ η
µετρούµενη :
Mc = k
λc
(7.1)
2nc
και
M=k
λc
2n
(7.2)
όπου k σταθερά, λc το µήκος κύµατος στους 20 οC και 1013 hPa, nc ο δείκτης
διάθλασης στις συνθήκες λειτουργίας.
Ο δείκτης διάθλασης n στις συνθήκες λειτουργίας υπολογίζεται µε βάση την
ακόλουθη εξίσωση:
- 137 -
ΠΑΡΑΡΤΗΜΑ
⎛ P ( n s − 1) ⎞⎛ 1 + 10 −6 P (060 − 0,00972T ) ⎞
⎟⎟ − 1
n=⎜
⎟⎜⎜
1 + 0,0036610T
⎝ 960,9543 ⎠⎝
⎠
(7.3)
και γνωστό ns για συνθήκες 20 οC και 1013 hPa
Η απόκλιση δ δίνεται από τον ακόλουθο τύπο:
δr =
Mc − M
n
= 1− c
Mc
n
(7.4)
και έτσι µπορεί να υπολογιστεί µε κατάλληλη διορθωτική συσκευή που θα έχει
αισθητήρια πίεσης και θερµοκρασίας.
7.1.2.3 Tο σφαλµα συνηµιτονου (Ecos)
Κακή ευθυγράµµιση της ακτίνας του laser σε σχέση µε τον άξονα της κίνησης της
επιφανείας οδηγεί στο λεγόµενο σφάλµα συνηµίτονου που καλείται έτσι επειδή το εύρος
του σφάλµατος είναι ανάλογο του συνηµίτονου της γωνίας που σχηµατίζει η ακτίνα µε τον
άξονα κίνησης. Το σφάλµα συνηµίτονου οδηγεί πάντα σε υποεκτίµηση του πλάτους της
κίνησης.
Ecos = D-D'=D(1-cosα)
(7.5)
όπου D το πλάτος της πραγµατικής κίνησης, D' το πλάτος της φαινόµενης κίνησης
από τον αισθητήρα και α την γωνία που σχηµατίζει η ακτίνα µε τον άξονα κίνησης. Η
αποφυγή τέτοιου σφάλµατος επιτυγχάνεται µε την προσεκτική ευθυγράµµιση της ακτίνας
του ώστε να είναι κάθετη στην επιφάνεια κίνησης
- 138 -
ΠΑΡΑΡΤΗΜΑ
Σχήµα 7.2 Κακή ευθυγράµµιση της ακτίνας της ακτίνας laser µε την διεύθυνση
κίνησης
7.1.2.4 Το σφαλµα Abbé (Ea)
Σε µερικές περιπτώσεις παρατηρείται παράλληλη µετατόπιση του άξονα της ακτίνας
του laser και δηµιουργείται µια διαφορά (offset) µεταξύ της προσπίπτουσας και της
ανακλώµενης ακτίνας (σχήµα 7.3). Αν αυτή η µετατόπιση συνδυαστεί µε κλίση της
τελικής επιφάνειας σε σχέση µε την αρχική της θέση τότε προκύπτει το σφάλµα Abbé. Το
σφάλµα Abbé έχει σαν αποτέλεσµα την επιµήκυνση ή την σµίκρυνση του πλάτους της
κίνησης ανάλογα µε την γωνία θ της κλίσης της επιφανείας.
- 139 -
ΠΑΡΑΡΤΗΜΑ
Σχήµα 7.3 Παράλληλη µετατόπιση του άξονα της ακτίνας της ακτίνας laser µε την
διεύθυνση κίνησης
Το σφάλµα Abbé Ea υπολογίζεται ως ακολούθως :
Ea=A0 tanθ
όπου A0 το πλάτος της παράλληλης µετατόπισης και θ την γωνία που σχηµατίζει η
αρχική θέση της επιφάνειας µε την τελική. Συνεπώς το σφάλµα Abbé µπορεί να µειωθεί µε
την µείωση των A0 και θ.
7.1.3 Το συστηµα των αισθητηρων στην συγκεκριµενη εφαρµογη
Για να προσδιοριστεί η περιοχή λειτουργίας των αισθητήρων έγιναν οι ακόλουθες
παραδοχές:
Το πλάτος της συχνότητας στα 6.8Ηz θεωρείται ότι αντιστοιχεί περίπου σε 1mm
µετατόπισης (ή αντίστοιχα σε ταχύτητα 40mm/s)
Η µετατόπιση στα 200Hz µπορεί να φτάνει τα 3 µm (ή αντίστοιχα σε ταχύτητα
4mm/s)
Εκτιµήθηκε ότι για να έχουµε καλή ανάλυση στο προσλαµβανόµενο φάσµα θα
πρέπει να είναι δυνατή η εκτίµηση του 1% της µέγιστης ταχύτητας σε συχνότητα 250Hz
- 140 -
ΠΑΡΑΡΤΗΜΑ
Σχήµα 7.4 Περιοχή λειτουργίας ιντερφερόµετρου
Στην συγκεκριµένη εφαρµογή η απαίτηση για γρήγορη µέτρηση πάνω στην γραµµή
παραγωγής και σε εργοστασιακό περιβάλλον υπαγόρευσε να µην χρησιµοποιηθούν
ανακλαστήρες στο σήµα του ιντερφερόµετρου. Συνεπώς θα πρέπει να ελεγχθεί η
καταλληλότητα της επιφανείας του πλυντηρίου ως προς το αν προσφέρεται για τέτοιες
µετρήσεις. Τα αναµενόµενα προβλήµατα µιας τέτοιας επιλογής έχουν σχέση µε δύο
παράγοντες:
τι ποσοστό απορρόφησης της ακτίνας laser προκαλείται λόγω πρόσπτωσης στην µη
ιδανική επιφάνεια του πλυντηρίου και
τι ποσοστό διάχυσης του σήµατος αυτού προκαλείται από την µη λεία επιφάνεια.
Και οι δύο παράγοντες πάντως έχουν ως αποτέλεσµα να µειώνεται το ποσοστό του
επιστρεφόµενου
σήµατος ως προς το εκπεµπόµενο. Για την µέτρηση αυτών των
- 141 -
ΠΑΡΑΡΤΗΜΑ
επιδράσεων δηµιουργήθηκε µια πειραµατική διάταξη που περιγράφεται στο ακόλουθο
σχήµα. 7.5.
Σχήµα 7.5 Πειραµατική διάταξη της ακτίνας laser για την µέτρηση του σήµατος
Η εκπεµπόµενη ακτίνα laser ανακλάται πάνω σε µια επιφάνεια πλυντηρίου και
µετριέται µε ακρίβεια από µία µονάδα CCD (Charge Coupled Device) αφού σχηµατίσει
γωνία θ σε απόσταση περίπου 80mm.
Ο πίνακας 7.1 δείχνει τις τιµές ανακλούµενης ενέργειας σε ιδανική επιφάνεια
(ανακλαστήρας) και στην επιφάνεια του πλυντηρίου για διαφορετικές γωνίες πρόσπτωσης.
Επιφάνεια
Επιφάνεια
ανακλαστήρα
πλυντηρίου
20ο
370µw
13.4µw
45ο
350µw
10.6µw
90ο
350µw
8µw
Γωνία θ
Πίνακας 7.1 Ανακλούµενη ενέργεια του σήµατος για διαφορετικές γωνίες
πρόσπτωσης.
Από τα δεδοµένα αυτά προκύπτει πως η επιφάνεια του πλυντηρίου ανακλά µόνο το
3.6-2.3% της ενέργειας που θα ανακλούνταν από µία ιδανική επιφάνεια. Η περίπτωση που
- 142 -
ΠΑΡΑΡΤΗΜΑ
η γωνία είναι 0ο κάθετη είναι πολύ κοντά στα αποτελέσµατα που παίρνουµε για τις 20ο και
είναι περίπου 3.7% της ενέργειας που θα ανακλούνταν από τον ανακλαστήρα.
Επειδή θέλουµε τα δύο σήµατα προς σύγκριση να είναι περίπου ίδιας έντασης µε
βάση τα πειραµατικά δεδοµένα µπορούµε να ξεπεράσουµε αυτό το πρόβληµα αν η
αναλογία έντασης σήµατος µέτρησης/αναφοράς γίνει µέσω κατάλληλων ενισχυτικών
διατάξεων 30:1.
- 143 -
ΠΑΡΑΡΤΗΜΑ
- 144 -
ΠΑΡΑΡΤΗΜΑ
- 145 -
ΠΑΡΑΡΤΗΜΑ
- 146 -
147
ΠΑΡΑΡΤΗΜΑ
147