Προβλέποντας πολέμους μέσω βάσης γεωπολιτικών δεδομένων

Τη δυνατότητα να δίνει «χρησμούς» για μελλοντικούς πολέμους και άλλα γεγονότα εκτιμάται πως θα έχει κάποια στιγμή η μεγαλύτερη βάση γεωπολιτικών δεδομένων του κόσμου: το GDELT (Global Data on Events, Location and Tone) περιέχει περίπου 250.000.000 γεγονότα γεωπολιτικού ενδιαφέροντος από το 1979 μέχρι σήμερα, και εξετάζει 100.000 νέα γεγονότα κάθε ημέρα.

Το λογισμικό του ανιχνεύει πηγές ειδησεογραφίας, όπως το Associated Press, το AFP, το Xinhua και άλλα ειδησεογραφικά πρακτορεία, συνθέτοντας ένα «ψηφιδωτό» το οποίο καλύπτει κάθε γωνιά του κόσμου. Χρησιμοποιώντας μεθόδους επεξεργασίας «φυσικής γλώσσας», δημιουργεί data points, τα οποία εμπλουτίζει με δεδομένα περί διάρκειας και θέσης, καταχωρώντας το τι ακριβώς συνέβη, από ποιον και πού. Οι συντελεστές του, όπως ο Κάλεβ Λιτάρου του πανεπιστημίου του Ιλινόι (Urbana- Champaign), κάνουν λόγο για μία βάση δεδομένων άνευ προηγουμένου, με τον Πολ Σροντ, του πανεπιστημίου της Πενσιλβάνια, να σχεδιάζει επέκτασή της μέχρι το 1800.


Ο Τζέι Γιοναμίν, αναλυτής δεδομένων του GDELT, στο πλαίσιο του διδακτορικού του είχε χρησιμοποιήσει έναν αλγόριθμο machine learning που είχε αναπτυχθεί για οικονομικά θέματα για να κάνει προβλέψεις σχετικά με τον πόλεμο στο Αφγανιστάν, που ξεκίνησε το 2001. Ο αλγόριθμος λειτουργεί χρησιμοποιώντας ένα στατιστικό μοντέλο σε μία σειρά από data points εντός ενός χρονικού πλαισίου και διακρίνοντας μοτίβα. Το σύστημά του Γιοναμίν έκανε επιτυχείς προβλέψεις για την περίοδο μεταξύ 2008-2012, έχοντας δεδομένα της περιόδου 2001-2008. Όπως εκτιμά ο ίδιος, καλύτερα στατιστικά δεδομένα απλά θα έχουν καλύτερα αποτελέσματα.


Τα πάνω από 3,3 εκατομμύρια γεγονότα που αφορούν τη Ρωσία/ΕΣΣΔ από το 1979, όπως τα κατέγραψε η βάση γεωπολιτικών δεδομένων GDELT.

Όπως επισημαίνει ο Νιλς Βάιντμαν, του πανεπιστημίου της Κονστάντς στη Γερμανία, σε δημοσίευμα του New Scientist, η ισχυρότερη ένδειξη βίας είναι η προηγούμενη βία. Κατά την άποψή του, πραγματικά αξιόπιστες προβλέψεις θα γίνουν εφικτές όταν αρχίσει να είναι δυνατή η αλίευση δεδομένων και από κοινωνικά δίκτυα και άλλες ανεπίσημες πηγές, δίνοντας τη δυνατότητα εξέτασης ακόμα μεγαλύτερου όγκου δεδομένων (big data). Επιπλέον «πηγές» από τις οποίες θα μπορούσε να αντλήσει το GDELT είναι οι μηχανές αναζήτησης: τι αναζητήσεις κάνει ο κόσμος, και πώς αυτές αλλάζουν κατά την πάροδο του χρόνου.

Ωστόσο, όπως επισημαίνει ο Γιοναμίν, που πλέον εργάζεται ως data scientist στην Alistate Insurance στο Σικάγο, αφ’ενός οι δυνατότητες που παρέχονται από την κοινωνική δυναμική είναι τεράστιες, αφ’ετέρου οι «χείμαρροι» δημοσιεύσεων στα social media μπορούν να είναι επίσης ανακριβείς ή παραπλανητικοί, με άσχημες επιπτώσεις στον πραγματικό κόσμο- όπως στην περίπτωση του πρόσφατου tweet- φάρσας περί εκρήξεων στο Λευκό Οίκο από το «χακαρισμένο» λογαριασμό του Associated Press στο Twitter. Πηγή: naftemporiki.gr