Γνωριμία με το λογισμικό στατιστικών αναλύσεων R Τι ακριβώς είναι

Μεταπτυχιακό Πρόγραμμα “ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ”
Ακαδ. Έτος 2014-15
Γνωριμία με το λογισμικό
στατιστικών αναλύσεων R
Δημήτρης Δεληκαράογλου
[email protected]
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Τι ακριβώς είναι το R;
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Η αφετηρία ανάπτυξης του R
• Η ανάπτυξη του έχει
βάση στη δημιουργία
της γλώσσας
προγραμματισμού S
που αναπτύχθηκε,
περί το 1976, στα
Εργαστήρια της
εταιρίας
τηλεπικοινωνιών Bell
για την ανάλυση
δεδομένων
• Το εμπορικό προϊόν,
εμφανίστηκε με την
ονομασία: S-plus.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Η προέλευση του R
• Το διαδραστικό
περιβάλλον S, και
• Η αλγοριθμική γλώσσα
Scheme, που αναπτύχθηκε στο MIT,
και είναι μια από τις δύο βασικές
διαλέκτους της Lisp Æ κοινοποιήθηκε
μέσα από τα περιώνυμα “Lambda Papers”
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Murray Hill, New Jersey
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Η προέλευση του R
• Αρχικά δημιουργήθηκε και διανεμήθηκε ως
ελεύθερο λογισμικό από τους Robert Gentleman
και Ross Ihaka στο Πανεπιστήμιο του Auckland,
Νέα Ζηλανδία, στη δεκαετία του 90. Στόχος τους
ήταν η δημιουργία ενός φιλικού προγραμματιστικού
περιβάλλοντος για τη διδασκαλία της Στατιστικής
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
1
Η ονομασία R
• “ We have named our language R –in part to
acknowledge the influence of S and in part to
celebrate our own efforts.”
R. Gentleman και R. Ihaka
… και η εξέλιξη του R
• Από το 1997: Διεθνές
R-core team & χιλιάδες
προγραμματιστές,
στατιστικολόγοι, κ.ά.
που μοιράζονται τις
βιβλιοθήκες και τα
εργαλεία τους !!
• Παρέχουν πλήρη
– πρόσβαση σε αλγόριθμους, ανοιχτά και
προσβάσιμα εργαλεία και τις εφαρμογές τους
που εν πολλοίς δεν είναι ακόμη διαθέσιμα σε άλλα
εμπορικά λογισμικά.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Τι ακριβώς είναι το R;
• Είναι ελεύθερα προσβάσιμο από ένα ευρύ
δίκτυο διανομής στο Διαδίκτυο
(Comprehensive R Archive Network)
– cran.r-project.org → 92 sites
– cran.cc.uoc.gr
– www.r-project.org
• Mια απαράμιλλη πλατφόρμα για τον
προγραμματισμό νέων στατιστικών μεθόδων
με έναν εύκολο και απλό τρόπο.
• State-of-the-art δυνατότητες γραφικών που
συναγωνίζεται μόνο η Matlab
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Το R ή r (το λογισμικό)
Open Source – δωρεάν … και όχι μόνο:
• Παρέχει πλήρη πρόσβαση σε αλγόριθμους και την
εφαρμογή τους
– Είναι το προϊόν συνεισφοράς κορυφαίων ειδικών
και χρηστών στους τομείς που γνωρίζουν
καλύτερα ÆΕίναι CUTTING EDGE.
• Δίνει τη δυνατότητα διόρθωσης ή/και επέκτασης
των πακέτων και εργαλείων που παρέχονται
• Πλείστα φόρουμ προάγουν τη συνεργασία
ερευνητών και χρηστών με στόχο να εξερευνήσουν
και να επεκτείνουν τις μεθόδους που
χρησιμοποιούνται για την ανάλυση των δεδομένων
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Η R ή r (η γλώσσα)
Η R ή r (η γλώσσα)
• Είναι μια διερμηνευόμενη γλώσσα
προγραμματισμού (interpreted
computer language)
• Είναι μια διερμηνευόμενη γλώσσα
προγραμματισμού (interpreted
computer language)
– Οι περισσότερες (στατιστικές και άλλες)
συναρτήσεις που ‘βλέπουν’ οι χρήστες
είναι γραμμένες στην ίδια τη γλώσσα του
R, καλώντας ένα μικρότερο σύνολο
εσωτερικών αρχέτυπων (internal
primitives)
•Αυτό καθιστά πολύ εύκολο στο χρήστη
να κατανοήσει πως πραγματικά
λειτουργούν
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
– Κάνει δυνατή τη διασύνδεση με διαδικασίες
γραμμένες σε C, C++, ή FORTRAN για
μεγαλύτερη αποτελεσματικότητα, και δημιουργία
επιπλέον υψηλού επιπέδου αρχέτυπων
– System commands can be called from within R
– Μπορεί να χρησιμοποιηθεί είτε µε κατευθείαν
εντολές, είτε µε προγράμματα τα οποία μπορούν
να αναπτυχθούν και να δοθούν για εκτέλεση
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
2
Η δύναμη του R
Η γλώσσα & το λογισμικό
• Σήμερα η R θεωρείται ως η ταχύτερα
αναπτυσσόμενη γλώσσα στατιστικών
υπολογισμών και η de facto γλώσσα έρευνας στα
πανεπιστήμια γύρω από εφαρμογές της
Στατιστικής, όπως
– Οικονομετρία, Χρονοσειρές, Χρηματιστηριακά
δεδομένα, Χωρικά δεδομένα, ...
• Το λογισμικό R αυξάνει συνεχώς τις GIS
δυνατότητες του, και είναι πλέον αξιόπιστο για τις
περισσότερες (αν όχι όλες) τις χωρικές αναλύσεις
που συνήθως κάνουμε με τα παραδοσιακά
λογισμικά GIS
– εξαγωγή και εισαγωγή δεδομένων (raster και vector), τη
σχεδίαση, ανάλυση και κατασκευή χαρτών, ...
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
• Χρησιμοποιεί μια δική του καλά ανεπτυγμένη, αλλά
απλή γλώσσα προγραμματισμού -ίδια με εκείνη του
S Plus (το άλλο γνώριμο λογισμικό στατιστικής
ανάλυσης) Æ άμεση συμβατότητα με κώδικα της S
Πλούσιες πηγές υλικού για την αυτό-εκμάθηση του:
• Ανοικτά μαθήματα, με παραδείγματα, ασκήσεις …
• http://faculty.washington.edu/tlumley/Rcourse/
• http://www.ats.ucla.edu/stat/r/
• Το άρθρο από όπου ξεκίνησε η διαδρομή του R…
• Ihaka R. & Gentleman R. 1996. R: a language for data analysis and
graphics. Journal of Computational and Graphical Statistics 5: 299–
314
• Εξαιρετικά βιβλία, προσβάσιμα στο Διαδίκτυο και από την
ψηφιακή βιβλιοθήκη του μαθήματος
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Η δύναμη του R
Η δύναμη του R
• Χαρακτηρίζεται από εύκολη επεκτασιμότητα
καθώς
– ο κάθε ένας χρήστης μπορεί να
δημιουργήσει τις δικές του συναρτήσεις και
να τις μορφοποιήσει σε μία βιβλιοθήκη, η
οποία με τη σειρά της
– μπορεί να δημοσιοποιηθεί και να
χρησιμοποιηθεί αργότερα από κάποιον
άλλο χρήστη με τις ίδιες ανάγκες
• Διασυνδέσεις με λογισμικά αποθήκευσης
δεδομένων (SQL)
• Επιτρέπει την ταχεία ανάπτυξη νέων
εργαλείων και προγραμμάτων σύμφωνα με
τις ανάγκες των χρηστών
• Εξαιρετικό για την προσομοίωση,
προγραμματισμό, και αναλύσεις
δεδομένων που απαιτούν υψηλό
υπολογιστικό φόρτο
– Εξαναγκάζει το χρήστη του να σκεφθεί για
τη ροή της ανάλυση που πρόκειται να
εφαρμόσει.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Η δύναμη του R
• Το υβριδικό περιβάλλον του (προγραμματισμός +
ανάλυση + γραφικά) προσφέρει απεριόριστες
δυνατότητες διαχείρισης και στατιστικής
ανάλυσης δεδομένων καθώς και δυνατότητες
κατασκευής γραφημάτων Æ εξαιρετικές
δυνατότητες στον ερευνητή
– Η χρησιμοποίησή του για την ανάλυση
βελτιώνει γρήγορα την ουσιαστική ικανότητα
του ερευνητή αλλά και την βαθύτερη αντίληψη
της θεωρίας καθώς ο χρήστης αντιλαμβάνεται
τον ακριβή τρόπο με τον οποίο επεξεργάζεται
τα δεδομένα
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
• ΔΕΝ ΕΙΝΑΙ Ένα ακόμα λογισμικό Στατιστικής
Ανάλυσης
– Κάθε άλλο παρά ένα συνονθύλευμα πολύ
συγκεκριμένων και άκαμπτων εργαλεία, όπως
συμβαίνει συχνά σε άλλα λογισμικά ανάλυσης
δεδομένων
• ΔΕΝ ΕΙΝΑΙ Εύκολο για το χρήστη να εξοικειωθεί
γρήγορα με όλες τις δυνατότητες του
– απαιτεί σημαντική ενασχόληση για να γίνει οικείο
σε κάποιον
• ΔΕΝ ΕΙΝΑΙ Menu-driven
– Υπολείπεται ενός φιλικού παραθυρικού
περιβάλλοντος χρήσης
• ΔΕΝ ΕΙΝΑΙ Ένα λογισμικό με πολύπλοκη γραφική
διεπαφή
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
3
Πως είναι διαθέσιμο;
R Project for Statistical Computing
www.r-project.org
• Διατίθεται ελεύθερα
– Η βασική σουίτα του λογισμικού και τα
περισσότερα εξειδικευμένα πακέτα του είναι
διαθέσιμα από το δίκτυο διανομής CRAN cran.r-project.org
… κυρίως για
εργαλεία, εγχειρίδια
χρήσης κ.ά.
• Mirror sites are available for many countries
• Νέες κυκλοφορίες του βασικού λογισμικού R
παρέχονται σε συχνά διαστήματα (τυπικά περίπου
κάθε 3 μήνες !!!), ανάλογα και με το λειτουργικό
σύστημα (Windows, MacOS, Linux)
– Πλείστα user blogs, tutorials, user guides …
• Η κοινότητα των χρηστών του είναι πολύ ενεργή
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Comprehensive R Archive Network
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Downloading R
Κέντρο διανομής του λογισμικού
και ειδικών πακέτων
cran.r-project.org
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Downloading R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Ιστότοπος διανομής του R και πακέτων
του
cran.r-project.org
ή cran.cc.uoc.gr
• www.r-project.org/
• download from CRAN
• select a download site
• download the base package at a
minimum
• download contributed packages
as needed
Επιλέξτε το ελληνικό site: cran.cc.uoc.gr
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
4
Downloading R
Downloading R
•
•
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
To καλύτερο χαρακτηριστικό του R!!!
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Execute, e.g. the current version R-3.1.1-win32.exe with
administrator privileges
Once the program is installed, run the R program by
clicking on its icon
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Διαθέσιμα ~4000 πακέτα !!!
install.packages(" ")
και μεταξύ τους πολλά
γεωεπιστημονικού
ενδιαφέροντος:
• Ecological and
Environmental Data
4000
δυνατότητες
!!!
http://cran.r‐project.org/web/views/
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Ο πυρήνας του R + πακέτα;
Ο πυρήνας του R + πακέτα;
• Η βασική διανομή του R περιλαμβάνει τον πυρήνα
(core) και πλήθος πακέτων (packages) και
βιβλιοθηκών (libraries)
• Ο κεντρικός πυρήνας του R περιέχει ότι απαιτείται
για ένα μεγάλο αριθμό στατιστικών διαδικασιών.
– linear and generalized linear models
– nonlinear regression models
– time series analysis
– classical parametric and nonparametric tests
– clustering, smoothing, …
• Τα πακέτα και οι βιβλιοθήκες περιέχουν επιπλέον
συναρτήσεις που δεν είναι διαθέσιμες στον πυρήνα
του R
• Για να γίνει χρήση μιας συνάρτησης από ένα
πακέτο, αυτό πρέπει να φορτωθεί στο R.
• Η σχετική εντολή για αυτό είναι library( ), π.χ.
library(glsme)
(Γενικευμένη Μέθοδος Ελαχίστων Τετραγώνων )
library(lmtest)
(διαγνωστικά τεστ γραμμικής παλινδρόμησης)
• Στα διάφορά πακέτα του R περιλαμβάνονται επίσης
και μια μεγάλη σειρά από αρθρώματα (modules) τα
οποία επεκτείνουν το υπάρχον περιβάλλον R με
γραφικές δυνατότητες που παρέχουν ένα ευέλικτο
γραφικό περιβάλλον για τη δημιουργία διαφόρων
ειδών παρουσιάσεις εκτεταμένων και πολύμορφων
δεδομένων και καθοδηγούν στην διαδικασία της
μοντελοποίησης και αξιολόγησης της ανάλυσης
τους
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
5
Μερικά ενδιαφέροντα πακέτα του R
• foreign: Read Data Stored by Minitab, S, SAS,
SPSS, Stata, Systat, Weka, dBase, ..
• ggplot2: An implementation of the Grammar of
Graphics
• GGally: Extension to ggplot2, … templates for
different plots
• gdistance: distances and routes on geographical
grids
• marqLevAlg: An algorithm for least-squares curve
fitting
• gplots: Various R programming tools for plotting
data
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Το πακέτο ggplot2
• The fundamental building block
of a plot is based on aesthetics
and facets
• Aesthetics are graphical
attributes that effect how the
data are displayed. Color, Size,
Shape
• Facets are subdivisions of
graphical data.
• The graph is realized by adding
layers, geoms (“point”,
“smooth”, …), and statistics.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Το πακέτο ggplot2
Το πακέτο ctest
• The fundamental building block
of a plot is based on aesthetics
and facets
• Aesthetics are graphical
attributes that effect how the
data are displayed. Color, Size,
Shape
• Facets are subdivisions of
graphical data.
• The graph is realized by adding
layers, geoms (“point”,
“smooth”, …), and statistics.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Έλεγχος διωνυμικής κατανομής
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εγκατάσταση πακέτων του R;
• Από τον ιστοχώρο του R Æ “Documentation”
– “Manual” - listing of official R documentation
• An Introduction to R
• R Language Definition
• Writing R Extensions
• R Data Import/Export
• R Installation and Administration
• “Contributed” documentation, tutorials and
manuals created by R users
– Simple R, R for Beginners, …
– Practical Regression and ANOVA Using R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
• Για Windows και Mac, υπάρχουν binary αρχεία για
εύκολη εγκατάσταση στο R .
• Οι προκαθορισμένες (default) τιμές είναι οι
συνηθέστερες και αν δεν έχετε κάποιο άλλο
λόγο, είναι γενικά μια καλή ιδέα να τις
αποδεχθείτε.
• Για εγκατάσταση σε Linux … ψάξτε το
– Για τα Windows, Mac και Linux, αν έχετε τα
κατάλληλα εργαλεία, μπορείτε να δημιουργήσετε
το R από τον πηγαίο κώδικα. Οι σχετικές
οδηγίες Æ http://cran.rproject.org/doc/manuals/R-admin.html
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
6
Εγκατάσταση πακέτων του R;
• install.packages("packagename")
• Μπορείτε να προσδιορίσετε mirror CRAN sites
install.packages("packagename", repos =
"http://cran.stat.ucla.edu/")
• update.packages("packagename")
• Code to load or install then load
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εγκατάσταση πακέτων του R;
• Αν θα χρειαστείτε ένα συγκεκριμένο πακέτο για την
τρέχουσα χρήση του R, πρέπει να το φορτώσετε
χρησιμοποιώντας τη συνάρτηση require
> require(foreign)
## Loading required package: foreign
• Σε μερικές περιπτώσεις, η καλή λειτουργία μιας
βιβλιοθήκης εξαρτάται από τα ήδη εγκατεστημένα
πακέτα. Για το λόγο αυτό, καλύτερα να
χρησιμοποιείτε την επιλογή dep=TRUE, έτσι ώστε
να γίνεται πλήρη εγκατάσταση όλων των πιθανών
εξαρτήσεων.
> install.packages(“foreign", dep=TRUE)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εγκατάσταση πακέτων του R;
Εγκατάσταση πακέτων του R;
• Για να χρησιμοποιήσετε επιμέρους πακέτα του R ,
πρέπει πρώτα να τα εγκαταστήσετε
χρησιμοποιώντας τη συνάρτηση install.packages,
η οποία
– κατεβάζει το ζητούμενο πακέτο από τον
ιστότοπο CRAN και
– το εγκαθιστά για χρήση στον Η/Υ σας
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εγκατάσταση πακέτων του R;
• Αν απαιτούνται επιπλέον πακέτα για τη χρήση ενός
πακέτου, αυτά φορτώνονται ή προσαρτώνται
αυτόματα …
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εγκατάσταση πακέτων του R;
> install.packages("maps")
> library("maps")
> map("world")
> map("world2")
• Χρήσιμο R script για την
εγκατάσταση πακέτων μετά από
κάποιο στοιχειώδη έλεγχο μη
προηγούμενης εγκατάστασής
τους (πηγή:
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=221)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
7
Εγκατάσταση πακέτων του R;
Το περιβάλλον εργασίας του R
• Τι
χρησιμοποιεί
στην τρέχουσα
εργασία
(session) το R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Το περιβάλλον εργασίας του R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Το περιβάλλον εργασίας του R
• Εναλλακτικά, μπορούμε
να ανοίξουμε ένα
παράθυρο script (Reditor Æ menu: file/open
script) όπου
• γράφουμε όσες εντολές
επιθυμούμε και μετά
μαρκάρουμε αυτές που
θέλουμε να εκτελεστούν
και πατάμε control+R.
• (αν δεν μαρκάρουμε
τίποτε, με control+R θα
εκτελεστούν μόνο οι
εντολές της γραμμής
που βρίσκεται ο cursor).
> This is the “R prompt.”
… το R είναι έτοιμο να δεχθεί
μια εντολή
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
Τα μενού
• File
• Edit
• View
• Misc
• Packages
• Windows
• Help
• Η εκκίνηση του
προγράμματος οδηγεί
στη βασική οθόνη του
προγράμματος στην
οποία υπάρχει το
παράθυρο εντολών
(R-Console).
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
8
Αλληλεπίδραση του χρήστη με το R
Με την επιλογή μενού File μπορούμε:
• Να εισάγουμε κώδικα και εντολές από προηγούμενες
εφαρμογές μας με το source R code.
• Να ανοίξουμε έναν νέο ή παλαιό συντάκτη (new ή old script)
• Να δούμε τα διαθέσιμα R αρχεία του φακέλου που είμαστε
(display files).
• Να εισάγουμε ή να αποθηκεύσουμε επιφάνειες εργασίας
(workspace) με αντικείμενα και συναρτήσεις που έχουν
δημιουργηθεί (load/save workspace)
• Να εισάγουμε ή να αποθηκεύσουμε εντολές που ήδη έχουμε
χρησιμοποιήσει (load/save history).
• Να αλλάξουμε τον φάκελο εργασίας μας (change dir).
• Να εκτυπώσουμε (print), να αποθηκεύσουμε τη συνεδρία μας
σε ένα αρχείο κειμένου (save to file) και να τερματίσουμε το
πρόγραμμα (exit).
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
Με την επιλογή μενού Misc
μπορούμε:
• να σταματήσουμε το τρέχον ή όλα τα προγράμματα που
εκτελούνται (stop current/all computations),
• να σταματήσουμε την εκτύπωση αποτελεσμάτων στην
οθόνη (buffered output),
• να δούμε ή να διαγράψουμε όλα τα αντικείμενα που έχουμε
δημιουργήσει έως τώρα (list objects ή remove all objects)
- ισοδύναμα με την εντολή ls() ή rm(list=ls(all=TRUE)), και
τέλος
• να δούμε ποιες βιβλιοθήκες (libraries) και πλαίσια
δεδομένων (data frames) επισυνάπτονται στο τρέχον
περιβάλλον εργασίας.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
• Console:
Με την επιλογή μενού
πληροφορίες για
Help δίνονται στον
το χειρισμό της
χρήστη βοηθητικές
βασικής οθόνης
πληροφορίες , π.χ.:
του R
• FAQ on R και FAQ on ιR for Windows: πληροφορίες
(ερωτήσεις και απαντήσεις σε συνήθεις ερωτηματικά) για τη
γλώσσα R και για την R για Windows
• Manuals (in pdf): Βασικό εγχειρίδιο χρήσης της R
• R functions (text): Πληροφορίες για τις συναρτήσεις που
είναι ήδη φορτωμένες (από το βασικό πυρήνα ή τις
βιβλιοθήκες των πακέτων)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
Με την επιλογή μενού Edit μπορούμε:
• Να έχουμε τις γνωστές δυνατότητες copy, paste, select
all, clear console
• Να ανοίξουμε τον συντάκτη δεδομένων (data editor)
που είναι σε μορφή πλαισίου (data frames) – και να
επεξεργαστούμε αυτά τα δεδομένα
• Να αλλάξουμε τον τρόπο εμφάνισης του περιβάλλοντος
εργασίας (με τις προτιμήσεις GUI preferences)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Αλληλεπίδραση του χρήστη με το R
Με την επιλογή μενού Packages μπορούμε:
• να φορτώσουμε βιβλιοθήκες/πακέτα που ήδη έχουμε
κατεβάσει (load package),
• να εγκαταστήσουμε βιβλιοθήκες από διάφορα sites του
CRAN (install package(s)) ή από συμπιεσμένα αρχεία του
σκληρού δίσκου (install package(s) from local zip files),
• να ενημερώσουμε τις βιβλιοθήκες προσθέτοντας νέες
(update packages),
• να διαλέξει από ποιο διανομέα (πέραν του CRAN) θέλουμε
να κατεβάσουμε τις βιβλιοθήκες (set repositories).
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Επικοινωνία με το R;
• Είτε με κατευθείαν εντολές
από το χρήστη
• Είτε από σειρά εντολών (scripts) που συνιστούν
βήματα διεργασιών που ο χρήστης μπορεί να
προγραμματίσει για επίλυση πιο πολύπλοκων
στατιστικών προβλημάτων.
• Επίσης ο χρήστης μπορεί να χρησιμοποιήσει και
έτοιμα προγράμματα τα οποία είναι ενσωματωμένα
μέσα στα ελεύθερα διαθέσιμα πακέτα
– Οι ποικιλία τέτοιων προγραμμάτων είναι
τεράστια !!!
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
9
Αλληλεπίδραση του χρήστη με το R
Εντολές του χρήστη προς το R
• Οι εντολές Διαβάζονται και εκτελούνται αμέσως Æ
R: διερμηνέας εντολών προγραμματισμού
• Η αλληλεπίδραση του χρήστη με το λογισμικό
επιτυγχάνεται από την κονσόλα του R
πληκτρολογώντας προγραμματιστικές
αλφαριθμητικές εκφράσεις, συμβολισμούς
εκχώρησης τιμών σε συναρτήσεις, πίνακες, …
Εντολή εργασίας
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
διεύθυνση όπου
βρίσκεται το
αρχείο κειμένου
με τα δεδομένα
χαρακτηρίζει την
πρώτη γραμμή
των δεδομένων
ως τίτλο
Σε μια εντολή απαιτούνται
τρία επιμέρους μέρη:
• η ίδια η εντολή
• ζεύγος παρενθέσεων, ()
• μια ή περισσότερες
παράμετροι (arguments)
εντός του ζεύγους των
παρενθέσεων (αν τέτοιες
παράμετροι είναι
απαραίτητοι, κάτι που
μπορεί να μην συμβαίνει
πάντα)
δηλώνει ότι η
δεκαδική
υποδιαστολή είναι
το κόμμα
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εντολές του χρήστη προς το R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
Ομοιότητες στη σύνταξη εντολών
R
• Αριθμητικές (1, 2, 3…) ή
λογικές (T/F) τιμές και
ονόματα αντικειμένων
δίνονται στις παραμέτρους
χωρίς εισαγωγικά “ ”, αλλά
σύνολα χαρακτήρων
(string values), όπως
ονόματα αρχείων, δίνονται
πάντα εντός διπλών
εισαγωγικών, π.χ.:
– mas5(dat3,
normalize=T,
analysis=“absolute”)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εντολές του χρήστη προς το R
Για να περατωθεί μια
συνεδρία με το R, είτε
• πληκτρολογήστε q() ,
• κλείστε την οθόνη του
προγράμματος (όχι το
παράθυρο εντολών)
πάνω δεξιά,
• από το μενού File Æ Exit
Συνιστάται να αποθηκεύεται
ότι έχετε δημιουργήσει
μέχρι τότε
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Matlab
Python
x <- seq(1,10)
# or x <- 1:10
# or x = 1:10
x = 1:10
%a less flexible
%version of linspace
x = range(1,11)
# indices start at 0
for (i in x)
{print("hello")}
for (i = x)
disp("hello")
end
for i in x:
print("hello")
foo.bar <- 10
foo.bar = 10
foo.bar = 10
> foo.bar
[1] 10
> foo.bar
foo =
bar: 10
NameError: name
'foo' is not defined
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Λειτουργία & εντολές στο R …
• Μπορείτε πάντα να αναγνωρίσετε το πλήθος των
απλών εντολών σε μια σύνθετη εντολή, μετρώντας
τον αριθμό των ζευγών των παρενθέσεων
–pData(dat)<-pd
• Αντικείμενα όπως διανύσματα και πίνακες (tablelike objects) διακρίνονται χρησιμοποιώντας αγκύλες
“[ ]” Æ ποτέ παρενθέσεις.
–dat[,1], c[1,4], …
• Εκχώρηση (assignment) σε ένα αντικείμενο γίνεται
χρησιμοποιώντας “<-”, ή “->” ή “=”. Ο συμβολισμός
“==”, δηλώνει σύγκριση
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
10
Λειτουργία & εντολές στο R …
Το περιβάλλον εργασίας του R
• Στην κονσόλα του R
(RGui), μέσω της γραμμής
εντολών παρέχεται
εξαίρετη ευελιξία και
έλεγχος.
Æ Αυξημένο χρόνο που
χρειάζεται κάποιος ώστε να
καλύψει το (τουλάχιστον
αρχικό) επίπεδο χρήσης σε
σύγκριση με ανάλογα
πακέτα με γραφικό
περιβάλλον διεπαφής (GUI)
Æ φιλικότερες λύσεις ;
• R is case sensitive, προσοχή στην πληκτρολόγηση!
¾ library(affy) Æ σωστή πληκτρολόγηση,
¾ αλλά Library(affy) Æ λάθος πληκτρολόγηση.
• Πολλαπλές εντολές επιτρέπονται στην ίδια γραμμή.
π.χ., πρώτα απαλείφουμε κενές τιμές από τα
δεδομένα της μεταβλητής year, και κατόπιν
υπολογίζουμε τη μέση τιμή.
– Οι εντολές:
¾ na.omit(year)
¾ mean(year)
– Δίνουν το ίδιο αποτέλεσμα με την απλή εντολή
¾ mean(na.omit(year))
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Άλλα περιβάλλοντα διεπαφής για το R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Εναλλακτικό περιβάλλον εργασίας του R
• Διάφορα GUI που υλοποιούν ένα βολικό(τερο)
περιβάλλον διεπαφής με το R
– Παράθυρα που περιέχουν διάφορα μενού,
κουμπιά και πεδία πληροφοριών, ...
– Επιτρέπουν τη δημιουργία σεναρίων, δεδομένων
εξόδου, επαναφορά παραθύρου διαλόγων, …
– Με μενού που είναι εύκολο να ρυθμιστούν,
συνήθως, μέσω ενός αρχείου κειμένου ή, κατά
προτίμηση, μέσα από τα plug-in πακέτα ...
http://www.rstudio.com/
• απλοί διάλογοι, το γενικό περιεχόμενο των οποίων
είναι περισσότερο ή λιγότερο προφανές από τα
ονόματα των στοιχείων των μενού.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
RStudio screenshot
Τι είναι το RStudio;
Παρέχει ένα
ένα
Παρέχει
ολοκληρωμένο
ολοκληρωμένο
(φιλικότερο)
(φιλικότερο)
περιβάλλον ανάπτυξης
ανάπτυξης
περιβάλλον
RStudio - Integrated development environment for R
http://www.rstudio.com/products/rstudio/download/
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
11
Εναλλακτικό περιβάλλον εργασίας του R
Το περιβάλλον εργασίας του R
Τρέχουσα έκδοση 2.1
2.1-3
Η διεπαφή RCommander δεν
είναι καινοτόμος,
αλλά είναι
απλή και οικεία
για τους χρήστες
http://socserv.socsci.mcmaster.ca/jfox/Misc/Rcmdr/
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
http://CRAN.R-project.org/package=Deducer
install.packages("Deducer")
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Java based R console JGR
3 επιπλέον μενού
http://www.deducer.org
http://www.deducer.org
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Deducer & JGR
http://www.deducer.org
http://www.deducer.org
http://rforge.net/JGR/index.html
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Για άμεση βοήθεια - Start help
> help("foo")
> ?foo
• Εξαιρετικές δυνατότητες
αναζήτησης βοήθειας για
την γλώσσα και το
λογισμικό R ...
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
12
Για άμεση βοήθεια - Start help
Help - Search engine
> help(“mean”)
> help(mean)
> ?mean
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Help - packages
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Τι περιέχει τυπικά ένα αρχείο help
Function
{package}
Γενική
περιγραφή
Εντολή και οι
παράμετροι της
Λεπτομερής
περιγραφή των
αναγκαίων
παραμέτρων
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Τι περιέχει τυπικά ένα αρχείο help
Περιγραφή:
πως δουλεύει η
εντολή
Τι επιστρέφει
η εντολή
Συναφείς
συναρτήσεις
Παραδείγματα
χρήσης στο R:
example(mas5)
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
• Γρήγορο και ελεύθερο.
• State of the art: Το
διεθνές δίκτυο
ερευνητών συνεχώς
ανανεώνουν και
υλοποιούν προηγμένες
μεθοδολογίες και τις
διαθέτουν ελεύθερα ως
πακέτα του R.
– SPSS και SAS είναι • Εξαιρετικές δυνατότητες
για προσομοιώσεις,
πολύ πιο πίσω από
προγραμματισμό,
το R!
εντατικές χώρο-χρονικές
– Συναγωνίζεται το
αναλύσεις και
υπολογισμούς, κλπ.
MATLAB στα
γραφικά
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
13
• Στην αρχική περίοδο
εκμάθησης του Æ Not
user friendly @ start
– Γρήγορα
ανερχόμενη
καμπύλη εκμάθησης
– Minimal GUI.
• Καμία εμπορική
υποστήριξη
• Easy to make mistakes
– figuring out
and not know.
appropriate (correct)
methods or how to
– Μαθαίνει κάποιος από
τα λάθη του και από τις
use a function on
εμπειρίες άλλων
your own can be
χρηστών
frustrating.
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Από την επόμενη φορά ...
• Θα μπούμε στα
ενδότερα της
λειτουργίας και της
χρήσης του R
– Σύνταξη εντολών
– Μεταβλητές και
συναρτήσεις
– Εισαγωγή
δεδομένων
– Βασικές στατιστικές και
– Χρήση
αλγοριθμικές δυνατότητες
εξωτερικών
αρχείων
– Διαχείριση συνεδριών του R
– Γραφήματα στο R – ...
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
Μέχρι το επόμενο
μάθημα ...
• Συμβουλευτείτε, στις
ιστοσελίδες του
μαθήματος, τις σχετικές
οδηγίες για την
εργασία/θέμα που θα
πρέπει να ξεκινήσετε
άμεσα
• Σχηματίστε τις Ομάδες
Εργασίας σας και αρχίστε
την εξοικείωσής σας με το
R
Δ. ΔΕΛΗΚΑΡΑΟΓΛΟΥ, ΣΑΤΜ/ΕΜΠ
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ‘ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ’
14