ΣΕΜΙΝΑΡΙΟ MATLAB

HANDS-ON TRAINING (ADVANCED STATISTICS):

Μηχανική Μάθηση και Αναγνώριση Προτύπων με το MATLAB

Πέμπτη 05/06/2014 - 10:00

 

Εκπαιδευτείτε στην επίλυση εξειδικευμένων προβλημάτων στατιστικής ανάλυσης χρησιμοποιώντας το MATLAB.

Θα επεξεργαστούμε μαζί παραδείγματα μηχανικής μάθησης (machine learning) και αναγνώρισης προτύπων (pattern matching) χρησιμοποιώντας γενικευμένα μοντέλα παλινδρόμησης, αλγορίθμους συσταδοποίησης (clustering) και αλγόριθμους ταξινόμησης (classification).


Η τοποθεσία διεξαγωγής της εκπαίδευσης θα ανακοινωθεί (ΑΘΗΝΑ).


ΚΟΣΤΟΣ ΣΥΜΜΕΤΟΧΗΣ:

Για άνεργους και φοιτητές:

100 € για κατάθεση μέχρι τις 30/5/2014 

120 € για κατάθεση μετά τις 30/5/2014

Για επαγγελματίες:

130 € για κατάθεση μέχρι τις 30/5/2014 

150 € για κατάθεση μετά τις 30/5/2014

Tο κόστος εκπαίδευσης ΔΕΝ επιβαρύνεται με Φ.Π.Α. Το πρόγραμμα μπορεί να επιδοτηθεί μέσω του ΟΑΕΔ-ΛΑΕΚ. 

( Η ηλεκτρονική υποβολή πρότασης υλοποίησης προγραµµάτων µπορεί να γίνεται τουλάχιστον πέντε (5) εργάσιµες ηµέρες πριν την ηµεροµηνία έναρξης του προγράµµατος. Πληροφορίες στη διεύθυνσηhttp://laek.oaed.gr )

 


ΟΜΙΛΗΤΗΣ:

Κώστας Πετσούνης,
MENTOR HELLAS Senior Application Engineer

Περιγραφή

Τα θέματα που θα παρουσιαστούν στο εκπαιδευτικό αυτό σεμινάριο, αναπτύσσονται βήμα-βήμα μέσω παραδειγμάτων τα οποία θα εκτελούνται συγχρόνως από τον εισηγητή και τους εκπαιδευόμενους μέσα στο MATLAB.

Οι εκπαιδευόμενοι θα έχουν μαζί τους δικό τους φορητό Η/Υ στον οποίον θα έχει εγκατασταθεί το MATLAB και τα απαραίτητα toolboxes. Σε όσους δεν διαθέτουν φορητό Η/Υ θα τους παρασχεθεί από την εταιρία μας (περιορισμένος αριθμός διαθέσιμος). Η εγκατάσταση του MATLAB θα παραμείνει ενεργή για διάστημα δύο εβδομάδων μετά το πέρας της εκπαίδευσης.

Συγκεκριμένα θα ασχοληθούμε με:

  • Την εισαγωγή δεδομένων από αρχεία
  • Την χρήση έτοιμων αλληλεπιδραστικών εργαλείων (GUI) και κώδικα για την υλοποίηση εξειδικευμένων στατιστικών υπολογισμών όπως:
    • Ανάλυση παραγόντων (Factor Analysis) και Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis)
    • Γενικευμένα γραμμικά μοντέλα παλινδρόμησης
    • Αλγόριθμοι ταξινόμησης
    • Αλγόριθμοι συσταδοποίησης
    • Στατιστική απεικόνιση δεδομένων
  • Την αυτοματοποίηση και επαναχρησιμοποίηση των αναλύσεων με την χρήση script αρχείων και function.
  • Την δημιουργία τεχνικών αναφορών και την εξαγωγή των αποτελεσμάτων σε άλλες εφαρμογές

Προαπαιτούμενα

Οι συμμετέχοντες πρέπει να είναι εξοικειωμένοι με βασικές έννοιες και όρους στατιστικής ανάλυσης και να γνωρίζουν τις βασικές λειτουργίες του MATLAB.

Ανάλυση παραγόντων. Παράγοντες και αρχικές μεταβλητές                          Διάγραμμα pareto σε Ανάλυση κυρίων συνιστωσών


 

ΠΡΟΓΡΑΜΜΑ ΠΑΡΟΥΣΙΑΣΗΣ

10:00 – 10:45   

Εισαγωγή και επεξεργασία δεδομένων

 

Εισαγωγή δεδομένων από text αρχεία και φύλλα εργασίας. Διαχείριση των δεδομένων σε μεταβλητές του MATLAB (matrix, tables, dataset arrays). Κατηγορικές μεταβλητές στο MATLAB. Εξαγωγή αποτελεσμάτων σε text αρχεία και φύλλα εργασίας.

10:45 – 11:30   

Πολυμεταβλητή Ανάλυση

  Ανάλυση παραγόντων (Factor Analysis) και Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis)

11:30 – 11:50 

Διάλειμμα

11:50 – 13:20        

Γενικευμένα Γραμμικά Μοντέλα Παλινδρόμησης

 

Καθορισμός και προσαρμογή γενικευμένων μοντέλων παλινδρόμησης (linear regression, logistic regression, poisson regression). Απεικόνιση αποτελεσμάτων σε γραφήματα προσαρμογής, γραφήματα καταλοίπων (residuals) και γραφήματα επίδρασης των ανεξάρτητων μεταβλητών (regressors). Επιλογή των ανεξάρτητων μεταβλητών μέσω επαναληπτικής διαδικασίας εκτίμησης του μοντέλου (stepwise fit). Regularization.

13:20 – 13:40

Διάλειμμα

13:40 – 15:10        

Αλγόριθμοι Κατηγοριοποίησης

 

Discriminant Analysis, Naive Bayes Classification, Δέντρα απόφασης (Classification Trees), k πλησιέστεροι γείτονες (k - Nearest Neighbors), Ensemble Methods (Δειγματικές μέθοδοι), Νευρωνικά Δίκτυα (Neural Networks).

15:10 – 15:30

Διάλειμμα

15:30 – 17:00

Αλγόριθμοι Συσταδοποίησης 

 

Μέτρα αποστάσεων. Ιεραρχική ομαδοποίηση (Hierarchical Clustering), K-Means Clustering, K-Means Clustering (Fuzzy), Gaussian Mixture Models, Self-Organized Maps.      

17:00 – ...

Ερωτήσεις – Συζήτηση


Δενδρόγραμμα ιεραρχικής συσταδοποίησης (Δεδομένα Δείκτες           Αποτελέσματα συσταδοποίησης με τον αλγόριθμο k-means
εγκληματικότητας. Πηγή :
http://en.wikipedia.org/wiki/United_States_cities_by_crime_rate)
 

    Καμπύλες ROC για τον έλεγχο αλγορίθμου ταξινόμησης                                       Ταξινόμηση με Δένδρα Αποφάσεων 

 

Για να εξασφαλίσετε τη συμμετοχή σας, παρακαλούμε συμπληρώστε τα στοιχεία σας στην φόρμα εγγραφής ή επικοινωνήστε μαζί μας τηλεφωνικά στο 210 60.31.121.