Εκτίμηση όγκου φλοιού δέντρων πεύκης (Pinus brutia) με χρήση τεχνητών νευρωνικών δικτύων Διαμαντοπούλου Μαρία και Μάτης Κων/νος Εργαστήριο Δ. Βιομετρίας, Τμήμα Δασολογίας και Φυσικού Περιβάλλοντος, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Τηλ.: 2310 998957 e-mail: [email protected] Εκτίμηση όγκου φλοιού δέντρων πεύκης (Pinus brutia) με χρήση τεχνητών νευρωνικών δικτύων Διαμαντοπούλου Μαρία και Μάτης Κων/νος Εργαστήριο Δ. Βιομετρίας, Τμήμα Δασολογίας και Φυσικού Περιβάλλοντος, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης ΠΕΡΙΛΗΨΗ Τα τεχνητά νευρωνικά δίκτυα αποτελούν σήμερα ένα πολύ δημοφιλές εργαλείο ανάλυσης δεδομένων και εκτίμησης παραμέτρων, με ένα ιδιαίτερα μεγάλο πεδίο εφαρμογής. Στη δασολογική επιστήμη σε παγκόσμιο επίπεδο, άρχισε τα τελευταία χρόνια η χρήση των τεχνητών νευρωνικών δικτύων ως μεθοδολογία εκτίμησης των τιμών μιας μεταβλητής «εξόδου» από μία ή ένα σύνολο μεταβλητών «εισόδου» σε διάφορα δασικά προβλήματα όπου η σχέση μεταξύ των μεταβλητών «εισόδου-εξόδου» είναι άγνωστη ή δύσκολα προβλέψιμη. Στην εργασία αυτή, γίνεται εκτίμηση του όγκου του φλοιού τραχείας πεύκης πριν την κοπή των αντίστοιχων δέντρων, με χρήση τεχνητών νευρωνικών δικτύων. Για το σκοπό αυτό χρησιμοποιήθηκαν δεδομένα δέντρων πεύκης από τη δασική θέση «Μπαρμπαγιώργης» η οποία βρίσκεται στη βορειοδυτική πλευρά του περιαστικού δάσους (Σέιχ-Σου) Θεσσαλονίκης. To νευρωνικό δίκτυο που χρησιμοποιήθηκε, διαρθρώθηκε με πορεία μίας κατεύθυνσης (feedforward), χρησιμοποιώντας την αρχιτεκτονική διαδοχικής συσχέτισης (Cascade-Correlation architecture). H στάθμιση των βαρών (weights), έγινε χρησιμοποιώντας τον αλγόριθμο «εκπαίδευσης» του Kalman (Kalman’s learning rule), με υπερβολική εξίσωση μεταφοράς (hyperbolic transfer function). Από τα αποτελέσματα προκύπτει ότι οι εκτιμήσεις του όγκου του φλοιού από το τεχνητό νευρωνικό δίκτυο που διερευνήθηκε εκτιμούν τις μετρημένες τιμές του όγκου του φλοιού με μεγάλη ακρίβεια. ΕΙΣΑΓΩΓΗ Το πρόβλημα εύρεσης της κατάλληλης σχέσης εκτίμησης δύσκολα μετρούμενων βιολογικών μεταβλητών των οποίων οι τιμές διαμορφώνονται από πολλούς και ανεξέλεγκτους παράγοντες όπως κλιματεδαφικό περιβάλλον, βιολογία του ίδιου του οργανισμού κλπ., αποτελεί πεδίο εντατικής έρευνας στη δασολογική επιστήμη. Η περισσότερο διαδεδομένη αντιμετώπιση του προβλήματος είναι μέσω της εφαρμογής της διαδικασίας της παλινδρόμησης (Draper και Smith, 1998) μέσω της οποίας πράγματι καταρτίζονται πολύ καλά μοντέλα εκτίμησης με μικρά σχετικά σφάλματα, όταν όμως οι προϋποθέσεις εφαρμογής της θεωρίας της παλινδρόμησης ικανοποιούνται. Το γεγονός αυτό σε συνδυασμό με την ιδιαιτερότητα της μεταβλητής που εξετάζεται, πόσο δηλαδή η εκτίμησή της εξαρτάται από απροσδιόριστους παράγοντες, αποτελούν τροχοπέδη στην εύρεση ενός στατιστικά «καλού» μοντέλου εκτίμησης. Σε τέτοια προβλήματα τα τεχνητά νευρωνικά δίκτυα (Fausett 1994, Dowla and Rogers 1995, Gurney 1999) δίνουν πολλές φορές λύση και αποτελούν εναλλακτική διαδικασία που μπορεί να αντικαταστήσει τις κλασικές μεθόδους. Γενικά, τα τεχνητά νευρωνικά δίκτυα είναι κατάλληλα για εύρεση μοντέλου εκτίμησης όταν (Bailey and Thompson 1990, Leduc et al. 2001): α. η εφαρμογή γίνεται σε δεδομένα που εξαρτώνται από πολλαπλές και αλληλοεξαρτώμενες παραμέτρους, β. υπάρχει επαρκής αριθμός δεδομένων ή παραδειγμάτων, γ. τα διαθέσιμα δεδομένα δεν είναι πλήρη, περιέχουν σφάλματα και περιγράφουν συγκεκριμένα παραδείγματα και δ. η σχέση που αποτελεί τη λύση στο πρόβλημα είναι ή άγνωστη ή ο προσδιορισμός της είναι επίπονος (απαιτεί χρόνο, έμπειρο προσωπικό, καταστροφή του πρωτογενούς υλικού που είναι η πηγή πληροφόρησης κλπ.). 1 Τα τεχνητά νευρωνικά δίκτυα έχουν χρησιμοποιηθεί για την επίλυση αρκετών δασολογικών προβλημάτων (Corne et al. 2004, Diamantopoulou 2005, Özcelik et al. 2008, Diamantopoulou et al. 2009, Özcelik et al. 2009). Στην εργασία αυτή εκτιμάται ο όγκος του φλοιού δέντρων τραχείας πεύκης (Pinus brutia) πριν την κοπή των αντίστοιχων δέντρων με χρήση τεχνητών νευρωνικών δικτύων. Τα δεδομένα που χρησιμοποιούνται, σε κάποιο βαθμό ανήκουν στις περιπτώσεις που προαναφέρθηκαν και συγκεκριμένα στην πρώτη και στην τέταρτη περίπτωση, οπότε τα τεχνητά νευρωνικά δίκτυα θεωρήθηκαν ως η κατάλληλη μεθοδολογία για την υλοποίηση ενός μοντέλου εκτίμησης του όγκου του φλοιού. Ο φλοιός της τραχείας πεύκης κατεργάζεται και χρησιμοποιείται κύρια στην αρχιτεκτονική τοπίου ως εδαφοκαλυπτικό. Πρόκειται για ένα ακριβό υλικό, με αυξανόμενη ζήτηση τα τελευταία χρόνια. Γι’ αυτό, ο διαχειριστής ενός δάσους είναι απαραίτητο να γνωρίζει την ποσότητα του φλοιού που μπορεί το δασικό οικοσύστημα να παράγει, πριν τη λήψη της απόφασης της κοπής δέντρων, προκειμένου να επιτυγχάνεται η οικονομική αποτίμηση του προϊόντος και η αειφορία στη διαχείριση των φυσικών πόρων. Στην εργασία αυτή, για την κατάρτιση του κατάλληλου τεχνητού νευρωνικού δικτύου εκτίμησης του όγκου του φλοιού δέντρων τραχείας πεύκης, χρησιμοποιήθηκε απλό τυχαίο δείγμα 188 δέντρων πεύκης στη δασική θέσης «Μπαρμπαγιώργης», έκτασης 150 στρεμμάτων η οποία βρίσκεται στη βορειοδυτική πλευρά του περιαστικού δάσους (Σέιχ-Σου) Θεσσαλονίκης, σε ύψος που κυμαίνεται από 228 μέχρι 264 μέτρα. Προκειμένου να αξιολογηθεί το μοντέλο τεχνητού νευρωνικού δικτύου το οποίο καταρτίστηκε, χρησιμοποιήθηκε ένα νέο απλό τυχαίο δείγμα 31 δέντρων πεύκης (verification data set) από την ίδια περιοχή. ΥΛΙΚΑ ΚΑΙ ΜΕΘΟΔΟΙ Η συλλογή του δείγματος έγινε με εφαρμογή απλής τυχαίας δειγματοληψίας. Το μέγεθος του δείγματος για την κατάρτιση του μοντέλου ανέρχεται σε 188 ιστάμενα δέντρα, στα οποία μετρήθηκαν η έμφλοια πρεμνική διάμετρος (d0,3ε) σε ύψος 0,3 μέτρα από το έδαφος και η έμφλοια στηθιαία διάμετρος (d1,3ε) σε ύψος 1,3 μέτρα από το έδαφος, με παχύμετρο, σε εκατοστά, καθώς επίσης και όλες οι έμφλοιες διάμετροι ανά 2 μέτρα από το στηθιαίο ύψος, με ρελασκόπιο, σε εκατοστά. Μετρήθηκε το διπλάσιο πάχος φλοιού (bth1,3) με μετρητή φλοιού, σε ύψος 1,3 μέτρα από το έδαφος, σε χιλιοστά. Υπολογίστηκαν η άφλοια στηθιαία διάμετρος (d1,3α) (Μάτης, 2004): d1,3 d1,3 b th1,3 (1) ο συντελεστής φλοιού (k1,3) στο στηθιαίο ύψος: k 1,3 d1,3 d1,3 (2) και ο έμφλοιος όγκος του κορμού (vε) κάνοντας χρήση της τμηματικής ογκομέτρησης κατά Smalian (Philip 1994, Μάτης 2004): d 02,3 d12,3 n d2 1 d2 (3) v vi v ... 2 d2 l 4 2 4 2 12 i 1 όπου vi :ο όγκος του I-οστού τμήματος από τα n τμήματα στα οποία χωρίζεται ο κορμός, vκ: ο όγκος του κορυφοτεμαχίου, d1,…, dκ , οι διάμετροι του κορμού ανά δύο μέτρα αρχής γενομένης της στηθιαίας διαμέτρου και lκ : το μήκος του κορυφοτεμαχίου. Επίσης υπολογίστηκε και ο άφλοιος όγκος του κορμού (vα) (Μάτης, 2004): 2 (4) v v k1,3 και τέλος υπολογίστηκε ο όγκος φλοιού (vφλ): v v v (5) 2 Παρόμοιες μετρήσεις και υπολογισμοί με τους παραπάνω έγιναν και για το νέο δείγμα των 31 δέντρων τραχείας πεύκης το οποίο χρησιμοποιήθηκε για την αξιολόγηση του μοντέλου νευρωνικού δικτύου το οποίο καταρτίστηκε στα πλαίσια αυτής της ερευνητικής εργασίας. Στοιχεία θεωρίας τεχνητών νευρωνικών δικτύων Η ανάγκη για συστήματα τεχνητής νοημοσύνης ικανά για πολύπλοκους και ταυτόχρονα έξυπνους υπολογισμούς, τα οποία προσπαθούν να μιμηθούν τις τεχνικές σκέψης του ανθρώπινου εγκεφάλου, δημιούργησε τα τεχνητά νευρωνικά δίκτυα. Ένα τεχνητό νευρωνικό δίκτυο στη γενική του μορφή αποτελείται από έναν αριθμό διαφορετικών επιπέδων , δηλ. ένα επίπεδο εισόδου (input layer) που αποτελείται από μονάδες εισόδου (input nodes), από ένα επίπεδο εξόδου (output layer) που αποτελείται από μονάδες εξόδου (output nodes) και μεταξύ αυτών ένα ή περισσότερα εσωτερικά (κρυμμένα) επίπεδα (hidden layer-s) που αποτελούνται από εσωτερικές (κρυμμένες) μονάδες (hidden nodes) οι οποίες δεν είναι ορατές αλλά αποτελούν εσωτερικό τμήμα του τεχνητού νευρωνικού δικτύου. Το σύνολο των απλών μονάδων (τεχνητοί νευρώνες) από τις οποίες αποτελείται το νευρωνικό δίκτυο έχουν μικρό μέγεθος τοπικής μνήμης και συγκεκριμένη επεξεργαστική ισχύ. Οι μονάδες αυτές συνδέονται μεταξύ τους με κανάλια επικοινωνίας που μεταφέρουν κωδικοποιημένα τα αριθμητικά δεδομένα που δίνονται στην είσοδο (input layer) του συστήματος. Κάθε τεχνητός νευρώνας δέχεται εισόδους από νευρώνες με τους οποίους συνδέεται και υπολογίζει μια τιμή εξόδου σαν συνάρτηση των εισόδων του την οποία διοχετεύει σε επόμενους νευρώνες με τους οποίους και επικοινωνεί. Οι μονάδες (ni) αλληλεπιδρούν και υφίστανται κατά τη χρονική στιγμή (t) ενεργοποίηση ei(t). Στις μονάδες αντιστοιχεί μία συνάρτηση μεταφοράς fi, η οποία παράγει μία έξοδο outi(t) = fi(ei(t)). Το όλο σύστημα είναι δομημένο να λειτουργεί παράλληλα έτσι ώστε πολλές μονάδες να έχουν τη δυνατότητα να πραγματοποιούν ταυτόχρονα τους υπολογισμούς τους οι οποίοι όμως υπολογισμοί είναι μη γραμμικοί. Το νευρωνικό δίκτυο απαιτεί κάποιου είδους «εκπαίδευση» (training), ακολουθώντας συγκεκριμένο κανόνα μάθησης (learning rule), που μπορεί να δομείται είτε με επίβλεψη (supervised learning), όπου το δίκτυο καθοδηγείται σχετικά με την ορθή πορεία του, είτε χωρίς επίβλεψη (unsupervised learning), όπου το δίκτυο είναι εντελώς αυτόνομο. H εκπαίδευση αυτή αναφέρεται στην προσπάθεια του νευρωνικού δικτύου, αφενός μεν να αποκτήσει γνώση από τα δεδομένα με κάποια διαδικασία μάθησης, αφετέρου δε να αποθηκεύσει τη γνώση αυτή, η οποία μεταφέρεται μέσω των βαρών (weights) στους νευρώνες του συστήματος. Όταν η εκπαίδευση γίνει με επιτυχία, τότε το νευρωνικό σύστημα μπορεί να γενικεύσει τη γνώση του και πέρα από τα δεδομένα της εκπαίδευσης με επιτυχία. Η πορεία την οποία ακολουθεί το νευρωνικό δίκτυο κατά την εκπαίδευσή του προαποφασίζεται και μπορεί να είναι κατά μία κατεύθυνση (feedforward) όπου η σύνδεση και αλληλεπίδραση των μονάδων των επιπέδων γίνεται με ροή μόνο από το προηγούμενο προς το επόμενο μέχρι την έξοδο ή και κατά δύο κατευθύνσεις (feedback), όπου υπάρχει επανατροφοδότηση του συστήματος από την έξοδο προς την είσοδο. Αρχιτεκτονική διαδοχικής συσχέτισης (Cascade-Correlation architecture) Η αρχιτεκτονική διαδοχικής συσχέτισης (Cascade-Correlation architecture) προτάθηκε από τους Fahlman και Lebiere (1990) (Σχήμα 1). Η διαδικασία του χτισίματος του νευρωνικού δικτύου διαρθρώνεται χρησιμοποιώντας διαδικασία όπου τα βάρη (wi) σταθμίζονται (supervised training), χρησιμοποιώντας έναν αλγόριθμο ΄΄εκπαίδευσης΄΄ (learning algorithm). Στο κρυμμένο επίπεδο οι μονάδες (nodes) προστίθενται μία κάθε φορά και πάντα λαμβάνοντας υπ’ όψη για το σχηματισμό της επόμενης μονάδας, όλες τις δεδομένες πληροφορίες των προηγούμενων πεδίων, έτσι ώστε η εκπαίδευση (training) του νευρωνικού δικτύου να προσπαθεί να πετύχει το στόχο της μέγιστης συσχέτισης μεταξύ της εξόδου από το κάθε πεδίο του κρυμμένου επιπέδου και το επιθυμητό αποτέλεσμα. 3 Επίπεδο εξόδου Εκπαιδευμένες συνδέσεις (Trained connections) Σταθερές συνδέσεις (Frozen connections) Μονάδα εξόδου Κρυμμένο επίπεδο Επίπεδο εισόδου Μονάδες εισόδου Πορεία εκπαίδευσης w1 Επίπεδο w2 εισόδου … s n si wi xi f(s) Επίπεδο εξόδου tanh(s): i 1 wn Σχήμα 1. Διάρθρωση νευρωνικού δικτύου αρχιτεκτονικής διαδοχικής συσχέτισης, με απεικόνιση μεταφοράς πληροφορίας από το επίπεδο εισόδου στο επίπεδο εξόδου. Αυτό συμβαίνει όταν σε κάθε βήμα εκπαίδευσης, μία νέα εσωτερική μονάδα προστίθεται στο κρυμμένο επίπεδο και τα βάρη σταθμίζονται κατά τέτοιο τρόπο ώστε να επιτευχθεί η μέγιστη συσχέτιση μεταξύ της εξόδου της καινούριας εσωτερικής μονάδας και του αντίστοιχου σφάλματος που αντικατοπτρίζεται στην έξοδο του νευρωνικού δικτύου. Με τη διαδικασία αυτή γίνεται προσπάθεια μεγιστοποίησης της τιμής της παραμέτρου συσχέτισης R: R O p o 1p 1 Vp V E po Eo (6) όπου Ο : ο αριθμός εξόδων του νευρωνικού δικτύου, Ρ : ο αριθμός των εκπαιδευόμενων δειγμάτων, Vp: η έξοδος της καινούριας κρυμμένης μονάδας και Εpo : το σφάλμα της εξόδου του νευρωνικού δικτύου. Η στάθμιση του βάρους για τη νέα κρυμμένη μονάδα βρίσκεται από τη σχέση: 4 Δw i O P o 1p 1 σ o E po E o f p ' x ip (7) όπου σο : η ένδειξη της συσχέτισης μεταξύ της εξόδου της καινούριας κρυμμένης μονάδας και του αντίστοιχου σφάλματος που αντικατοπτρίζεται στην έξοδο του νευρωνικού δικτύου, fp΄ : η παράγωγος της συνάρτησης f και xip : η αντίστοιχη τιμή της εισόδου. Κάθε κρυμμένη μονάδα εκπαιδεύεται μόνο μια φορά και στην υπόλοιπη διαδικασία το βάρος της διατηρείται σταθερό. Στην εργασία αυτή ο κανόνας κατάρτισης των βαρών που χρησιμοποιήθηκε είναι αυτός του Kalman (Kalman learning rule) (Kalman 1960, Brown and Hwang 1997, Grewal and Andrews 2001, Demuth and Beale 2001, Welch and Bishop 2003), ο οποίος βρίσκει πολύ καλή εφαρμογή σε δεδομένα τύπου «παλινδρόμησης». Η διαδικασία ολοκληρώνεται όταν τελικά το άθροισμα των τετραγώνων των διαφορών των εκτιμώμενων τιμών από το νευρωνικό δίκτυο και των προσδοκώμενων τιμών είναι το ελάχιστο. Δηλαδή, ο σκοπός του αλγόριθμου εκπαίδευσης είναι να ελαχιστοποιήσει το ολικό σφάλμα: e 1 P Pp 1 ep (8) όπου P είναι το σύνολο των εκπαιδευόμενων στοιχείων και ep είναι το σφάλμα για το εκπαιδευόμενο στοιχείο p το οποίο προσδιορίζεται με τη σχέση: ep 1n 2 i (Oi di ) 2 (9) όπου: n ο συνολικός αριθμός των μονάδων (nodes), Oi είναι το αποτέλεσμα του νευρωνικού δικτύου από τη i-οστή μονάδα εξόδου και di είναι το επιθυμητό αποτέλεσμα στη i-οστή μονάδα εξόδου. Για να καθοριστεί η έξοδος για κάθε πεδίο εισόδου πρέπει να χρησιμοποιηθεί μια εξίσωση μεταφοράς (transfer function). Η εξίσωση μεταφοράς που χρησιμοποιήθηκε είναι η υπερβολική μη γραμμική (hyperbolic transfer function) της μορφής (Fausett, 1994): f (s) όπου: s tanh(s) i1 e (s) e (s) e ( s) e ( s) 1 e ( 2s) 1 e ( 2s) (10) w i x i . Πρόκειται για την αποτελεσματική πληροφορία που εισέρχεται στη μονάδα i του κρυμμένου επιπέδου και μεταφέρεται με την εξίσωση μεταφοράς f (s) (Σχήμα 1). Εφαρμογή σε μετρημένα δεδομένα Για την κατάρτιση του μοντέλου νευρωνικού δικτύου είναι απαραίτητο να διαιρεθούν τα δεδομένα σε δύο μέρη (δεδομένα εκπαίδευσης και δεδομένα δοκιμής), έτσι ώστε να εξασφαλίζεται η αποφυγή υπερπαραμετροποίησης του μοντέλου (Leahy, 1994). Γι΄αυτό το λόγο, τα δεδομένα των 188 δέντρων χωρίστηκαν κάνοντας χρήση τυχαίων αριθμών σε 2 μέρη. Το πρώτο μέρος που αποτελεί το 70% (training set) χρησιμοποιήθηκε για το «χτίσιμο» του κατάλληλου νευρωνικού δικτύου, ενώ το υπόλοιπο 30% (test set) χρησιμοποιήθηκε για την δοκιμή του μοντέλου. Επιπλέον, για την αξιολόγηση του μοντέλου χρησιμοποιήθηκε νέο απλό τυχαίο δείγμα 31 δέντρων πεύκης από την περιοχή μελέτης. Χρησιμοποιήθηκε νευρωνικό δίκτυο τριών επιπέδων. Το πρώτο επίπεδο, το επίπεδο εισόδου (input layer) απαρτίζεται από τέσσερις μεταβλητές εισόδου (nodes), δηλ. τα δεδομένα που χρησιμοποιήθηκαν προς άντληση πληροφορίας (d1,3εi, vεi, d1,3αi, k1,3i) για την εκτίμηση του όγκου του φλοιού. Το τελευταίο επίπεδο (output layer) αποτελείται από μία μεταβλητή εξόδου (vφλ i) και ενδιάμεσα βρίσκεται το κρυμμένο επίπεδο (hidden layer) που απαρτίζεται από έναν αριθμό στοιχειωδών μονάδων (units). Ο βέλτιστος 5 αριθμός των στοιχειωδών μονάδων του κρυμμένου επιπέδου διερευνάται, με το κριτήριο της μέγιστης συσχέτισης (εξ. 6), ενώ η στάθμιση των βαρών για κάθε νέα κρυμμένη μονάδα υπολογίστηκε από την εξίσωση (7), χρησιμοποιώντας τον κανόνα κατάρτισης βαρών του Kalman. Γενικά προτείνεται η χρησιμοποίηση ενός μόνο κρυμμένου επιπέδου (Masters, 1993) και η πρόταση αυτή υιοθετήθηκε στην παρούσα εργασία. Το τελικό διαμορφωμένο μοντέλο νευρωνικού δικτύου που προέκυψε ικανοποιεί τη συνθήκη της μεγιστοποίησης της παραμέτρου συσχέτισης της εξίσωσης (6) και ταυτόχρονα ελαχιστοποιεί το ολικό σφάλμα της εξίσωσης (8). Επιπλέον, η διαδικασία εφαρμογής του εκπαιδευμένου νευρωνικού δικτύου σε διαφορετικά ζεύγη συνόλων εκπαίδευσης (training data sets) και ελέγχου (test data sets), πάντα στην ίδια αναλογία 70% προς 30%, έγινε επαναληπτικά σε 1000 τυχαίους συνδυασμούς δεδομένων εκπαίδευσης (bootstrap technique), προκειμένου να ελεγχθεί αν το διαμορφούμενο νευρωνικό δίκτυο είναι γενικής ισχύος ή αντλεί πληροφορίες από τοπικές συνθήκες των δεδομένων. Η μεταβλητότητα στην εκτίμηση του συντελεστή συσχέτισης, ήταν μικρή και δεν υπερέβη το 0,33%. Για το συνολικό αριθμό δεδομένων εκπαίδευσης και για τα δεδομένα αξιολόγησης υπολογίστηκαν: 1. Ο γραμμικός συντελεστής συσχέτισης (R), ο οποίος δίνει τη γραμμική συσχέτιση μεταξύ των πραγματικών τιμών του όγκου του φλοιού και των αντίστοιχων τιμών που προέκυψαν από το μοντέλο νευρωνικού δικτύου που επιλέχθηκε, 2. Το μέσο απόλυτο σφάλμα (ΜAE) μεταξύ των πραγματικών τιμών και των αντίστοιχων τιμών του μοντέλου και 3. Το τυπικό μέσο τετραγωνικό σφάλμα (RMSE) μεταξύ των πραγματικών τιμών και των αντίστοιχων του μοντέλου. ΑΠΟΤΕΛΕΣΜΑΤΑ Τα περιγραφικά στατιστικά στοιχεία για τα δεδομένα κατάρτισης και αξιολόγησης των πεδίων εισόδου και εξόδου δίνονται στον Πίνακα 1. Πίνακας 1. Περιγραφικά στατιστικά στοιχεία για τις μεταβλητές d1,3ε, d1,3α, k1,3, vε, και vφλ, για όλα τα δεδομένα κατάρτισης και αξιολόγησης. Μεταβλητές d1,3ε , (cm) d1,3α , (cm) k1,3 vε , (m3) vφλ , (m3) Δεδομένα κατάρτισης Αριθμητικός Διασπορά μέσος 24,43 28,478 20,21 23,073 1,20 0,008 0,21 0,021 0,06 0,002 Σφάλμα μέσου 0,3892 0,3503 0,0067 0,0105 0,0035 Δεδομένα αξιολόγησης Αριθμητικός Διασπορά Σφάλμα μέσος μέσου 17,44 6,999 0,4750 14,83 6,936 0,4730 1,18 0,007 0,0148 0,12 0,019 0,0248 0,03 0,002 0,0074 Η αρχιτεκτονική διάρθρωση του νευρωνικού δικτύου που έδωσε τη μεγαλύτερη συσχέτιση μεταξύ πραγματικών και εκτιμώμενων τιμών όγκου φλοιού είναι η : 4-6-1 με R = 0,9965. Πρόκειται δηλαδή για νευρωνικό δίκτυο τριών επιπέδων: 1ο: επίπεδο εισόδου με τέσσερα πεδία, 2ο: κρυμμένο επίπεδο με έξι πεδία και 3ο: επίπεδο εξόδου με ένα πεδίο. O αριθμός των πεδίων του κρυμμένου επιπέδου διερευνήθηκε και τα αποτελέσματα δίνονται στον Πίνακα 2. Επιλέχθηκε ο αριθμός πεδίων ίσος με 6 γιατί είναι η μεγαλύτερη συσχέτιση που μπορεί να επιτευχθεί από το νευρωνικό δίκτυο, δεδομένου ότι με αύξηση των πεδίων στα 8 δεν υπήρξε καμιά βελτίωση στην τιμή του συντελεστή συσχέτισης. 6 Πίνακας 2. Αριθμός κρυμμένων μονάδων και συντελεστής συσχέτισης στη διερεύνηση του βέλτιστου αριθμού πεδίων του κρυμμένου επιπέδου. Αριθμός κρυμμένων μονάδων Συντελεστής συσχέτισης 0 0,9803 2 0,9912 4 0,9939 6 0,9965 8 0,9965 Η διαδικασία εφαρμογής του εκπαιδευμένου νευρωνικού δικτύου σε διαφορετικά ζεύγη συνόλων εκπαίδευσης (training data sets) και ελέγχου (test data sets), έγινε επαναληπτικά σε 1000 τυχαίους συνδυασμούς δεδομένων εκπαίδευσης. Ο μέσος όρος των τιμών των συντελεστών συσχέτισης που προέκυψαν είναι ίσος με 0,9965 με ελάχιστη τιμή ίση με 0,9901 και μέγιστη 0,9999. Η τυπική απόκλιση των τιμών των συντελεστών είναι μικρή και ισούται με 0,003, ενώ η μεταβλητότητα που εμφανίζουν οι τιμές είναι όπως αναμενόταν μικρή με τιμή συντελεστή κύμανσης ίσο με 0,33%. Όπως φαίνεται στον Πίνακα 3, η τιμή του μέσου τετραγωνικού σφάλματος είναι παρόμοια και στα δύο διαφορετικά σετ δεδομένων γεγονός που ενισχύει την άποψη ότι δεν υπάρχει υπερπαραμετροποίηση (overfitting) στο νευρωνικό δίκτυο που εκπαιδεύτηκε. Επιπλέον, τα σφάλματα που προέκυψαν από την εκτίμηση των πραγματικών τιμών από το μοντέλο είναι μικρά. Η τιμή του μέσου απόλυτου σφάλματος είναι 0,002 κ.μ. και για τα δεδομένα κατάρτισης αλλά και για τα δεδομένα αξιολόγησης. Παρόμοια συμπεράσματα εξάγονται και για το συντελεστή συσχέτισης του οποίου η τιμή είναι πολύ κοντά για τα δύο σετ δεδομένων. Πίνακας 3. Γραμμικός συντελεστής συσχέτισης (R), μέσο απόλυτο σφάλμα (MAE) και τυπικό μέσο τετραγωνικό σφάλμα (RMSE) για τα δεδομένα κατάρτισης και αξιολόγησης. Δεδομένα Κατάρτισης Αξιολόγησης R 0,9965 0,9986 MAE 0,002 0,002 RMSE 0,0040 0,0043 Στο Σχήμα 2, δίνονται τα στικτά διαγράμματα των πραγματικών και εκτιμώμενων τιμών όγκου φλοιού, όπου φαίνεται η πολύ καλή σύμπτωση των τιμών τους (Σχήμα 2α), γεγονός το οποίο ενισχύεται από την τιμή του τυπικού μέσου τετραγωνικού σφάλματος το οποίο υπολογίστηκε ίσο με 0,004, δηλαδή 6,42% του μέσου όγκου φλοιού για τα δεδομένα κατάρτισης του δικτύου. Επίσης, στο ίδιο σχήμα (Σχήμα 2β) δίνονται τα σφάλματα που προέκυψαν από την εκτίμηση των τιμών του όγκου του φλοιού των 188 δέντρων από το μοντέλο του νευρωνικού δικτύου, ως προς τις αντίστοιχες πραγματικές τιμές του όγκου φλοιού των δέντρων αυτών. Οι τιμές των σφαλμάτων του όγκου φλοιού ανά δέντρο είναι ιδιαίτερα μικρές και κατανέμονται πολύ κοντά και γύρω από τον άξονα του μηδενικού σφάλματος. Παρόλα αυτά παρατηρείται μια αύξηση των τιμών των σφαλμάτων σε κάποια δέντρα. Για τα συγκεκριμένα δέντρα η προσαρμογή του νευρωνικού δεν ήταν τόσο ακριβής όσα για τα υπόλοιπα δέντρα. Αυτό μπορεί να οφείλεται στο μικρό αριθμό δέντρων στη συγκεκριμένη βαθμίδα όγκου φλοιού, με αποτέλεσμα η εκπαίδευση του δικτύου να μην είναι τόσο επαρκής όσο η προσαρμογή του για τις υπόλοιπες βαθμίδες. 7 (α) 0,300 vφλ vφλ εκτίμηση vφλ εκτίμηση, σε κ.μ. 0,250 0,200 0,150 0,100 0,050 0,000 0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 vφλ, σε κ.μ. (β) Σφάλματα εκτίμησης vφλ 0,030 0,020 Σφάλματα 0,010 0,000 0 50 100 150 200 -0,010 -0,020 -0,030 Αύξοντας αριθμός παρατήρησης μετρούμενου δέντρου Σχήμα 2. (α) Στικτά διαγράμματα πραγματικών και εκτιμώμενων από το μοντέλο τιμών όγκου φλοιού και (β) Κατανομή σφαλμάτων όγκου φλοιού ανά μετρημένο δέντρο (σε κυβικά μέτρα). 8 Για να διερευνηθεί η προσαρμογή του δικτύου το οποίο καταρτίστηκε, τα δέντρα ταξινομήθηκαν σε 6 βαθμίδες όγκου φλοιού εύρους 0,048 κ.μ. Υπολογίστηκε το μέσο εκατοστιαίο σφάλμα για την κάθε βαθμίδα και δίνεται στο Σχήμα 3. 8.15% 9.0% Μέσο εκατοστιαίο σφάλμα βαθμίδας 8.0% 7.0% 6.0% 4.40% 5.0% 4.0% 3.0% 2.0% 1.0% -1.44% -1.24% 0.20% -1.65% 0.0% -1.0% -2.0% [0.001-0.049) [0.049-0.097) [0.097-0.145) [0.145-0.193) [0.193-0.241) [0.241-0.289) Βαθμίδα όγκου φλοιού Σχήμα 3. Ραβδόγραμμα μέσου εκατοστιαίου σφάλματος όγκου φλοιού. Στο Σχήμα 3 φαίνεται ότι για όλες τις βαθμίδες όγκου φλοιού τα σφάλματα είναι μικρά και κυμαίνονται σε απόλυτες τιμές από 0,2% για την τέταρτη βαθμίδα έως 8,15% για την πέμπτη. ΣΥΜΠΕΡΑΣΜΑΤΑ Στην εργασία αυτή γίνεται εκτίμηση του όγκου του φλοιού δέντρων τραχείας πεύκης μέσω της εφαρμογής της θεωρίας των τεχνητών νευρωνικών δικτύων. Το μοντέλο που εκπαιδεύτηκε είναι το: 4-61/0,9965. Πρόκειται για δίκτυο που διαρθρώθηκε χρησιμοποιώντας διαδικασία κατά την οποία η στάθμιση των βαρών έγινε χρησιμοποιώντας τον αλγόριθμο «εκπαίδευσης» του Kalman και τη διαδοχική μέθοδο εκπαίδευσης, κάνοντας χρήση την υπερβολικής εφαπτομένης, μη γραμμική εξίσωση μεταφοράς. Οι εκτιμήσεις του όγκου του φλοιού από το μοντέλο νευρωνικού δικτύου που επιλέχθηκε προσεγγίζουν άριστα τις μετρημένες τιμές του όγκου του φλοιού με μέσo τυπικό τετραγωνικό σφάλμα ίσo με 7,7% του μέσου όγκου φλοιού, για τα δεδομένα κατάρτισης Το μοντέλο δίνει άριστη προσαρμογή και στα δεδομένα που χρησιμοποιήθηκαν για αξιολόγηση (verification data set) γεγονός που εγγυάται την απουσία της υπερπαραμετροποίησης του τεχνητού νευρωνικού δικτύου που εκπαιδεύτηκε. Η μεθοδολογία που χρησιμοποιήθηκε είναι γενική και μπορεί να έχει εφαρμογή στην επίλυση πολλών δασικών προβλημάτων εκτίμησης δύσκολα μετρούμενων μεταβλητών από άλλες ευκολότερα μετρούμενες. 9 Pine trees (Pinus brutia) bark volume estimation using Artificial Neural Networks M.J. Diamantopoulou and KG. Matis Lab. of Forest Biometry, School of Forestry and Natural Environment, Aristotle University of Thessaloniki Abstract A well-known procedure for finding relationships between predicted variables and predictors is regression analysis. Artificial neural networks are becoming a popular estimation tool, because of the absence of assumptions that free the modeler from reliance on parametric approximating functions that may fit the observed data. In this paper, an attempt was made to identify a neural network procedure that will enable the accurate estimation of pine trees bark volume from easy measured tree characteristics. Μeasurements of pine (Pinus brutia) trees from “Mparmpagiorgis” location in Seix – Sou urban forest of Thessaloniki, Greece, were used. Neural networks were trained by supervised training. Cascade method of training with Kalman learning rule and the hyperbolic transfer function was used. The results demonstrate the ability of the selected Artificial Neural Network (ANN) model for estimating pine bark volume. The ANN technique introduced in this paper is general and is promising to be applicable to other regression/prediction problems of data related with forest applications. ΒΙΒΛΙΟΓΡΑΦΙΑ Bailey, D. and D. Thompson, 1990. How to develop neural-networks applications. AI Expert. S(6): 38-47. Brown, R.G. and P.Y.C. Hwang, 1997. Introduction to Random Signals and Applied Kalman Filtering. Third Edition. Wiley & Sons, Inc. Ν.Υork. 484pp. Corne, S.A., S.J., Carver, W.E., Kunin, J.J., Lennon, and W.W.S. Van Hees, 2004. Predicting forest attributes in southeast Alaska using artificial neural networks. For. Sci. 50(2): 259-276. Demuth, H. and M. Beale, 2001. Neural Network Toolbox. For Use with Matlab®. User’s Guide. Version 4. The MathWorks Inc. 846pp. Diamantopoulou, M.J., 2005. Artificial Neural Networks as an alternative tool in pine bark volume estimation. Comput. Electron. Agric. 48: 235 – 244. Diamantopoulou, M.J., E., Milios, D., Doganos, and I. Bistinas, 2009. Artificial neural network modeling for reforestation design through the dominant trees bole-volume estimation. Nat. Resour. Model. 22(4): 511-543. Dowla, U.F., and L. Rogers, 1995. Solving Problems in Environmental Engineering and Geosciences with Artificial Neural Networks. Massachusetts Institute of Technology. USA. 239pp. Draper, N.R, and H. Smith, 1998. Applied Regression Analysis. Third Edition. Wiley and Sons, Inc. USA. 706pp. Fahlman, S.E., and C. Lebiere, 1990. The Cascade Correlation learning architecture. Advances in Neural Information Processing Systems 2. San Mateo, C.A., Morgan Kaufmann, 524-532. Fausett, L., 1994. Fundamentals of Neural Networks Architectures. Algorithms and Applications. Prentice Hall, USA. 461pp. Grewal, M.S., and A.P. Andrews, 2001. Kalman Filtering. Theory and Practice using Matlab. Second Edition. Wiley & Sons, Inc. USA. 401pp. Gurney, K., 1999. An Introduction to neural networks. UCL Press. UK. 234 pp. Kalman, R.E., 1960. A New Approach to Linear Filtering and Prediction Problems. Transaction of the ASME-Journal of Basic Engineering. 35-45. Leahy, K., 1994. The overfitting problem in perspective. Al Expert 9(IO): 35-36. 10 Leduc, D.J., T.G., Matney, K.L., Belli, and V.C. Baldwin, 2001. Predicting Diameter Distributions of Longleaf Pine Plantations: A Comparison between Artificial Neural Networks and other accepted methodologies. Southern Research Station: RS-25. Masters, T., 1993. Practical neural networks recipes in C++. Academic press, Inc., USA. 473pp. Μάτης, Κ.Γ., 2004. Δασική Βιομετρία ΙΙ. Δενδρομετρία. Εκδ. Πήγασος 2000. Θεσσαλονίκη. 674 σελ. Özcelik, R., M.J., Diamantopoulou, H.V. Wiant, and J.R. Brooks, 2008. Comparative study of standard and modern methods for estimating tree bole volume of three different species in Turkey. For. Prod. J. 58(6): 73-81. Özcelik, R., M.J., Diamantopoulou, H.V., Wiant, and J.R. Brooks, 2009. Estimating tree bole volume using artificial neural network models for four species in Turkey. J. Environ. Manage. 91(3): 742-753. Philip, M., 1994. Measuring Trees and Forests. Second edition. CAB International, Wallingford, UK. 310pp. Welch, G., and G. Bishop, 2003. An Introduction to the Kalman Filter. Kalman filter web page. 11