Ωι View in english

Στατιστική Ανάλυση Δικτύων - Ενότητα για Δίκτυα Χρονοσειρών 2020-2021

Η Ενότητα "Δίκτυα Χρονοσειρών" αποτελεί μέρος του μαθήματος "Στατιστική Ανάλυση Δικτύων" του μεταπτυχιακού προγράμματος "Επιστήμη του Διαδικτύου" του Μαθηματικού Τμήματος, Α.Π.Θ.

Διδάσκων:
Καθηγητής Δημήτρης Κουγιουμτζής

Για να δείς ή να εκτυπώσεις τα παρακάτω αρχεία (σημειώσεις και διαφάνειες), χρειάζεσαι το πρόγραμμα acrobat reader, το οποίο δεν είναι εμπορικό. Για να το εγκαταστήσεις, αν δεν το έχεις, πάνε στο http://www.adobe.com/products/acrobat/readstep.html

Ενότητες:

Περιεχόμενα, προτεινόμενα βιβλία

Περιεχόμενα:

Η ενότητα "Δίκτυα Χρονοσειρών" πραγματεύεται τη δημιουργία δικτύων από πολυ-μεταβλητές χρονοσειρές, όπου η κάθε χρονοσειρά παριστάνεται ως κόμβος και η σχέση μεταξύ δύο χρονοσειρών είναι η σύνδεση (ακμή) μεταξύ των δύο κόμβων.

 

Το κύριο αντικείμενο της ενότητας αυτής είναι η μελέτη των διαφόρων τύπων "σχέσης" (σύνδεσης) μεταξύ δύο χρονοσειρών και η μελέτη δικτύων που παράγονται από τέτοιες συνδέσεις.

 

Αυτή η ενότητα του μαθήματος πραγματεύεται τη δημιουργία δικτύων από πολυ-μεταβλητές χρονοσειρές, όπου η κάθε χρονοσειρά παριστάνεται ως κόμβος και η σχέση μεταξύ δύο χρονοσειρών είναι η σύνδεση (ακμή) μεταξύ των δύο κόμβων. Το κύριο αντικείμενο της ενότητας αυτής είναι η μελέτη των διαφόρων τύπων "σχέσης" (σύνδεσης) μεταξύ δύο χρονοσειρών και η μελέτη δικτύων που παράγονται από τέτοιες συνδέσεις, και ειδικότερα η δομή του δικτύου καθώς και η χρονική (δυναμική) εξέλιξη του. Στο μάθημα γίνεται έμφαση στις εφαρμογές σε πραγματικά προβλήματα, κυρίως από οικονομικά, βιολογία και νευρο-επιστήμες.  

 

Η ενότητα χωρίζεται σε τρία μέρη και θα διδαχθεί το κάθε μέρος σε 4 ώρες (που αποτελούν ένα μάθημα):  

 

1. Γενική εισαγωγή στα δίκτυα. Δίκτυα σχέσης (association networks). Συντελεστής συσχέτισης και δίκτυα συσχέτισης. Συντελεστής μερικής συσχέτισης (partial correlation) και δίκτυα μερικής συσχέτισης. Σημαντικότητα και στατιστική σημαντικότητα (από έλεγχο υπόθεσης) συσχέτισης και μερικής συσχέτισης. Παραδείγματα σε δίκτυα συσχέτισης γονιδίων από πειράματα microarrays.  

 

2. Εισαγωγή στις μονομεταβλητές και πολυ-μεταβλητές χρονοσειρές. Χαρακτηριστικά χρονοσειρών, στασιμότητα, αυτοσυσχέτιση, αμοιβαία πληροφορία. Έλεγχος ανεξαρτησίας. Γραμμικά στοχαστικά συστήματα και χαοτικά συστήματα. Παραδείγματα για το δείκτη τιμών καταναλωτή (general index of consumer prices), χρηματο-οικονομικούς δείκτες, αφίξεις πακέτων πληροφορίας (packet arrivals).  

 

3. Διμεταβλητές χρονοσειρές, δια-συνδιασπορά (cross-covariance) και διασυσχέτιση (cross-correlation), δια-αμοιβαία πληροφορία (cross-delayed mutual information). Ψευδείς διασυσχετίσεις. Παραδείγματα σε χρονοσειρές δύο χρηματο-οικονομικών δεικτών.  

 

4. Πολυμεταβλητές χρονοσειρές. Γραμμικά στοχαστικά συστήματα και συζευγμένα μη-γραμμικά συστήματα. Δίκτυα συσχέτισης από πολυμεταβλητές χρονοσειρές. Παραδείγματα σε δείκτες παγκόσμιων αγορών.  

 

5. Αιτιότητα κατά Granger και δείκτης αιτιότητας Granger από διμεταβλητά και πολυμεταβλητά γραμμικά μοντέλα (Granger causality index, GCI, and conditional GCI, CGCI). Μη-γραμμικοί δείκτες αιτιότητας: εντροπία μεταφοράς (transfer entropy, TE) και μερική εντροπία μεταφοράς (partial TE, PTE), μερική αμοιβαία πληροφορία από μεικτή εμβύθιση (partial mutual information from mixed embedding, PMIME). Δίκτυα από μέτρα αιτιότητας. Εφαρμογές σε ηλεκτροεγκεφαλογραφήματα (electroencephalograms, EEG) και χρηματο-οικονομικές αγορές.  

 

6. Εφαρμογή ανάλυσης πολυμεταβλητών χρονοσειρών και δίκτυα συσχέτισης και αιτιότητας στο υπολογιστικό περιβάλλον Matlab.

Προτεινόμενα βιβλία:

Οι ενδιαφερόμενοι φοιτητές μπορούν να συμβουλευτούν για βασικά στοιχεία τα βιβλία

  1. Horvath S (2011). Weighted Network Analysis, Applications in Genomics and Systems Biology, Springer  

  2. Kirchgassner G, Wolters J and Hassler U (2013). Introduction to Modern Time Series Analysis, Springer  

  3. Fornito A, Zalesky A and Bullmore E (2016). Fundamentals of Brain Network Analysis, Academic Press  

  4. Kolaczyk ED (2009). Statistical Analysis of Network Data : Methods and Models (Springer Series in Statistics), Springer  

  5. Pearl J (1998). Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference,  Morgan Kaufmann.

 

Επίσης μπορούν να ανατρέξουν στις παρακάτω συλλογές εργασιών  

  1. Wiedermann W and Von Eye A (2016). Statistics and Causality, Methods for Applied Empirical Research, Wiley  

  2. Chiuso A, Fortuna L, Frasca M, Rizzo A, Schenato L and Zampieri S (2009). Modelling, Estimation and Control of Networked Complex Systems, Springer  

  3. Reggiani A and Nijkamp P (2006). Spatial Dynamics, Networks And Modelling (New Horizons in Regional Science Series), Edward Elgar Publishing.  

  4. Gross T and Sayama H (2009). Adaptive Networks: Theory, Models and Applications (Understanding Complex Systems), Springer.  

και στα παρακάτω άρθρα σε διεθνή περιοδικά  

Kramer MA, Eden UT, Cash SS and Kolaczyk ED (2009) Network inference with confidence from multivariate time series, Physical Review E 79: 061916   Siggiridou E, Koutlis C, Tsimpiris A and Kugiumtzis D (2019) Evaluation of causality measures for constructing networks from multivariate time series, Entropy 21(11): 1080

 

Για το σχηματισμό των δικτύων θα χρησιμοποιηθεί το λογισμικό pajek (δες http://pajek.imfm.si).

Διαφάνειες

Διαφάνειες διδασκαλίας

  1. Εισαγωγή στα Δίκτυα, Συσχέτιση και Χρονοσειρές (σε PDF) [τελευταία ενημέρωση 8/11/2018]
    - Εισαγωγή στα δίκτυα, δίκτυα σχέσεων και δίκτυα συσχετίσεων. Παράδειγμα από μετρική επιστημών (scientometrics).
    - Συντελεστής συσχέτισης, στατιστική σημαντικότητα συσχέτισης, παραμετρικός και μη-παραμετρικός έλεγχος σημαντικότητας. Παράδειγμα δικτύου συσχέτισης σε συντονισμό γονιδίων από πείραμα μικροσυστοιχίας (microarray).
    - Συντελεστής μερικής συσχέτισης και έλεγχος σημαντικότητας. Συνέχεια προηγουμένου παραδείγματος.
    - Δίκτυα συσχέτισης από χρονοσειρές. Παράδειγμα δικτύου συσχέτισης από δείκτες παγκόσμιας χρηματιστηριακής αγοράς.

    Αρχεία δεδομένων για
    αυτήν την ενότητα:
    1. Ecoliv4Build6ex1.xls (
    μορφή excel), Ecoliv4Build6ex1.txt (απλή μορφή κειμένου): δεδομένα από πείραμα μικροσυστοιχίας (microarray).
       
    Πηγή: http://m3d.bu.edu/cgi-bin/web/array/index.pl (βάση δεδομένων Palsson03).
    2. WorldMarkets.dat (
    απλή μορφή κειμένου). Τα δεδομένα είναι σε μορφή πίνακα μεγέθους 101 x 8 και περιέχουν τους δείκτες για 101 ημέρες από 8 χρηματιστηριακές αγορές (ΗΠΑ, Αυστραλία, Μεγάλη Βρετανία, Γερμανία, Ελλάδα, Μαλαισία, Νότια Αφρική, Κροατία).
        Πηγή: Morgan Stanley Capital International’s market capitalization weighted index data
    3. WorldIndicesCorrCoeff.net (
    σε μορφή κατάλληλη για το λογισμικό pajek). Το αρχείο περιέχει την πληροφορία για τους κόμβους και τις συνδέσεις του δικτύου δια-συσχέτισης των 8 χρηματιστηριακών αγορών.
    4. WorldIndicesPartCorr.net
    Το ίδιο με το αρχείο "WorldIndicesCorrCoeff.net" αλλά για δίκτυο μερικής δια-συσχέτισης.
     
  2. Μέτρα συσχέτισης, πολυπλοκότητας και σύζευξης σε χρονοσειρές (σε PDF) [τελευταία ενημέρωση 04/11/2020]
    - Χρονοσειρές, στασιμότητα, διαχωρισμός χρονοσειράς, απαλοιφή στοχαστικής τάσης, παραδείγματα.
    - Αυτοσυσχέτιση, στατιστικός έλεγχος ανεξαρτησίας, γραμμικά αυτοπαλινδρομούμενα μοντέλα, παραδείγματα.
    - Αμοιβαία πληροφορία και στατιστικός έλεγχος ανεξαρτησίας, παραδείγματα.
    - Διμεταβλητές χρονοσειρές, ετεροσυσχέτιση και ετερο-αμοιβαία πληροφορία, παραδείγματα.

    Αρχεία δεδομένων για αυτήν την ενότητα:
    1. GPIC2001_2005residuals.dat (απλή μορφή κειμένου):
    Μηνιαίες τιμές του Γενικού Δείκτη Τιμών Καταναλωτή για την περίοδο Ιαν 2001 - Αυγ 2005.
    2. PacketArrival.dat (απλή μορφή κειμένου).
    Χρόνοι μεταξύ αφίξεων πακέτων πληροφορίας, όπως καταγράφηκαν στο Ethernet του Bellcore Morristown Research and Engineering facility στις 11:25, 29 Αυγούστου 1989.
    2. USAreturns.dat (απλή μορφή κειμένου).
    Ημερήσιες αποδόσεις του δείκτη αγοράς ΗΠΑ για κάποια μη-καθορισμένη περίοδο 300 ημερών.
       
    Πηγή: Morgan Stanley Capital International’s market capitalization weighted index data 
    3. Matlab
    προγράμματα και συναρτήσεις: Exercise2.m, ARm.m, mutual.m, portmanteauLB.m.

  3. Ανάλυση πολυμεταβλητών χρονοσειρών με δίκτυα (σε PDF)
    - Ψευδείς ετεροσυσχέτιση, διανυσματικά αυτοπαλινδορμούμενα μοντέλα και μοντέλα δυναμικής παλινδρόμησης, παραδείγματα.
    - Μη-γραμμικά δυναμικά συστήματα, συζευγμένα δυναμικά συστήματα, παραδείγματα.
    - Μέτρα ομοιότητας (συσχέτισης) και δημιουργία δικτύων χρονοσειρών, παραδείγματα.
     

  4. Connectivity Networks and applications (σε PDF) [τελευταία ενημέρωση 13/11/2019] 
    - Ανασκόπηση μέτρων αιτιότητας και συσχέτισης.
    - Δείκτης αιτιότητας
    Granger και δεσμευμένης αιτιότητας Granger
    - Μέτρα αιτιότητας
    Granger βασισμένα στη θεωρία πληροφορίας.
    - Αξιολόγηση των μέτρων αιτιότητας κατά
    Granger σε γνωστά συστήματα (στοχαστικά γραμμικά και μη-γραμμικά, συζευγμένες Henon απεικονίσεις)
    - Εφαρμογή των μέτρων αιτιότητας κατά
    Granger σε δεδομένα από ηλεκτροεγκεφαλογραφήματα (EEG) καθώς και σε χρηματο-οικονομικά δεδομένα. 

  5. Εξάσκηση στο Matlab (δες παρακάτω).

Ασκήσεις και προγράμματα

Για να δεις πολλές χρονοσειρές σε γραφικό περιβάλλον του Matlab, μπορείς να χρησιμοποιήσεις το πακέτο Measures of Time Series Analysis (MATS) από την ιστοσελίδα http://eeganalysis.web.auth.gr (Software).

Όλα τα προγράμματα Matlab για το μάθημα σε ένα συμπιεσμένο αρχείο: matlab.zip.

Τα αρχεία δεδομένων σε ένα συμπιεσμένο αρχείο: Data.zip

Εργασία, εξέταση και βαθμολογία μαθήματος

Για την ενότητα "Δίκτυα Χρονοσειρών" του μαθήματος, ο βαθμός θα καθοριστεί από την εργασία που καλούνται οι φοιτητές/τριες να κάνουν κατά ομάδες των δύο ατόμων, καθώς και την παρουσία και συζήτηση που θα γίνει την ημέρα των εξετάσεων.

Η εργασία θα δίνεται εδώ. Οι ομάδες το πολύ δύο ατόμων θα πρέπει να στείλουν τις παρουσιάσεις (π.χ. PowerPoint, LaTeX) με e-mail στο διδάσκοντα (dkugiu@auth.gr), ως την ημέρα/νύχτα πριν την ημέρα "εξέτασης". Η εξέταση στο μάθημα θα γίνει στις 20/2/2021, ώρα 17:00, στο εργαστήριο υπολογιστών του Μαθηματικού Τμήματος, και θα περιλαμβάνει παρουσιάσεις 8 λεπτών τως εργασιών με ερωτήσεις και συζήτηση.

Οι ομάδες φοιτητών θα πρέπει να δηλωθούν με e-mail στον διδάσκοντα.

 


Ενημερώθηκε στις 4/11/2020 από τον Κουγιουμτζή Δημήτρη E-MAIL dkugiu@auth.gr