Δείτε αυτό το βίντεο. Είναι το μέλλον των fake news!
Σε μια νέα μελέτη από το Πανεπιστήμιο της Ουάσινγκτον, οι ερευνητές επιδεικνύουν τη χρήση νευρωνικών δικτύων για τη δημιουργία ενός παραποιημένου βίντεο του Ομπάμα που δείχνει απόλυτα ρεαλιστικό. Έχουμε λοιπόν μπροστά μας τα fake news του μέλλοντος;
Η διάδοση των ψεύτικων ειδήσεων κατά τη διάρκεια των εκλογών του 2016 – και η πιθανή επίπτωσή τους στα αποτελέσματα – ώθησε τις εταιρείες social media να αναζητήσουν τρόπους να σταματήσουν την ταχεία εξάπλωση της παραπληροφόρησης στις πλατφόρμες τους. Αλλά αυτές οι πολιτικές επικεντρώνονται σε ψεύτικα νέα με τη μορφή που έλαβαν κατά τη διάρκεια των εκλογών-άρθρα, αναρτήσεις και Tweets. Αλλά τι θα συμβεί αν οι ψεύτικες ειδήσεις αρχίσουν να παίρνουν μια άλλη μορφή, με τη βοήθεια της τεχνητής νοημοσύνης; Τι θα συμβεί αν οι ψεύτικες ειδήσεις μπορούν να μεταδοθούν από υπερρεαλιστικό βίντεο, κατευθείαν από το στόμα μιας δημόσιας προσωπικότητας που εμπιστεύεστε;
Μια ομάδα ερευνητών από το Πανεπιστήμιο της Ουάσιγκτον βρήκε έναν τρόπο να χρησιμοποιήσει νευρωνικά δίκτυα για να δημιουργήσει ψεύτικο βίντεο του Μπαράκ Ομπάμα. Με τη χρήση ηχητικών κλιπ και αλγορίθμων που δημιουργήθηκαν για την παραποίηση των κινήσεων στο στόμα, αυτοί οι ερευνητές έχουν δημιουργήσει βίντεο του Ομπάμα τόσο ρεαλιστικό, που είναι δύσκολο να γίνει διάκριση ανάμεσα στο παραποιημένο βίντεο και το πρωτότυπο. Καταλαβαίνει κανείς πόσο χρήσιμη μπορεί να είναι αυτή η τεχνολογία σε όσους διασπείρουν fake news.
Το παρακάτω βίντεο απεικονίζει μερικά παραδείγματα αυτής της τεχνολογίας στην πράξη. Οι ερευνητές επέλεξαν να απεικονίσουν το έργο τους με μια επιλογή των εβδομαδιαίων μηνυμάτων του Ομπάμα στο αμερικανικό έθνος. Εκπαίδευσαν ένα νευρωνικό δίκτυο με τα πλάνα αυτών των μηνυμάτων – συνολικά 17 ώρες ή σχεδόν 2 εκατομμύρια frames, από τα οκτώ χρόνια της θητείας του πρώην προέδρου – τα οποία είναι εύκολα προσβάσιμα στο διαδίκτυο. Σε ένα παράδειγμα, ένας παραποιημένος Ομπάμα χωρίζει την οθόνη με τον πραγματικό Ομπάμα. Και οι δύο απευθύνονται στους Αμερικανούς για τους πυροβολισμούς του νυχτερινού κέντρου Pulse χρησιμοποιώντας τα ίδια λόγια, αν και ο παραποιημένος Ομπάμα έχει ένα διαφορετικό δωμάτιο στο Λευκό Οίκο ως φόντο του. Σε ένα άλλο παράδειγμα, ο παραποιημένος Ομπάμα μιμείται τα λόγια του πολύ νεότερου εαυτού του από το 1990.
Αυτά τα βίντεο είναι εξαιρετικά ενδιαφέροντα για δύο λόγους, ο πρώτος από τους οποίους είναι η τεχνολογία που έχουν καταφέρει οι ερευνητές. Η χειραγώγηση του κινήματος των χειλιών ενός ατόμου για να ταιριάξουν με ένα νέο ηχητικό κομμάτι δεν είναι κάτι νέο: ένα άλλο πρόσφατο παράδειγμα είναι το Face2Face, το οποίο αναπτύχθηκε από τους ερευνητές στο Stanford και «δίνει ζωή» σε ένα πρόσωπο σε βίντεο σύμφωνα με τις κινήσεις ενός άλλου ατόμου που έχει καταγραφεί σε μια κάμερα. Η διαφορά με αυτή την τεχνολογία είναι ότι ενώ βασίζεται σε ώρες και ώρες υλικού του Obama που εκπαιδεύει το νευρωνικό δίκτυο, δεν περιορίζεται απλώς στο να ζωντανέψει το στόμα του Obama για να ταιριάζει με το νέο ήχο.
Αντ `αυτού, τα μοντέλα έμαθαν ποια σχήματα στόματος συνδέονταν με τους διάφορους ήχους από τα βίντεο που υπάρχουν ήδη online. Οι ερευνητές πήραν στη συνέχεια νέο ήχο και τον προσάρμοσαν πάνω από το υπάρχον βίντεο, έπειτα πήραν τα σχήματα του στόματος που ευθυγραμμίστηκαν με το νέο ήχο και τα εισήγαγαν στο υπάρχον βίντεο. Το αποτέλεσμα ήταν ένας ρεαλιστικός Ομπάμα, που κάνει όλες τις σωστές παύσεις, τις κινήσεις του κεφαλιού και τις εκφράσεις που όλοι αναγνωρίζουν.
Το άλλο εξαιρετικό γεγονός σχετικά με αυτή την τεχνολογία είναι οι πιθανές χρήσεις της. Οι ερευνητές λένε ότι ο αλγόριθμος μπορεί να εφαρμοστεί σε βιντεοκλήσεις για τη δημιουργία βίντεο από τον ήχο χρησιμοποιώντας σημαντικά μικρότερο εύρος ζώνης από το πραγματικό βίντεο. Θα μπορούσε επίσης να χρησιμοποιηθεί για τη δημιουργία συνοπτικών βίντεο από μεγάλες ομιλίες, με την αποκοπή τμημάτων της ομιλίας και το μοντάρισμα όλων των τμημάτων σαν να πρόκειται για μια νέα συνοπτική ομιλία (ένα παράδειγμα αυτού είναι στο παραπάνω βίντεο).
Αλλά, όπως δείχνει το παράδειγμα, η τεχνολογία μπορεί επίσης να χρησιμοποιηθεί για να παραποιήσει κάποιος τις ομιλίες. Για παράδειγμα, κάποιος θα μπορούσε να εισάγει μια νέα δήλωση από τον παραποιημένο Obama, χρησιμοποιώντας λέξεις που είπε σε ένα ηχητικό κλιπ, αν και όχι απαραίτητα με αυτή τη σειρά. Θα ήταν απλό να υπονοείται ένα διαφορετικό νόημα, ακόμη και χρησιμοποιώντας τα δικά του λόγια. Είναι επίσης δυνατό να φανεί ότι ο Ομπάμα λέει κάτι που είπε σε πολύ πιο νεαρή ηλικία ή αντίστροφα. Είναι ακόμη δυνατό να ταιριάξει με το βίντεο του Ομπάμα ένα ηχητικό κλιπ κάποιου που μιμείται τη φωνή του πρώην προέδρου, έτσι ώστε να φαίνεται ότι είπε κάτι που δεν είχε πει ποτέ πριν.
Οι ερευνητές χρησιμοποίησαν τον Ομπάμα επειδή υπήρχε αφθονία υλικού στο διαδίκτυο. Με άλλα λόγια, αυτή η μέθοδος λειτουργεί μόνο αν υπάρχουν αρκετά βίντεο για την εκπαίδευση του αλγορίθμου. Αυτό περιορίζει κάπως το πεδίο εφαρμογής, αλλά, και πάλι, δημιουργεί τον κίνδυνο παραποίησης δηλώσεων σημαντικών δημοσίων προσώπων. Σύντομα, όλοι οι πάροχοι περιεχομένου μπορεί να χρειαστεί να καθορίσουν πολιτικές για την καταπολέμηση των ψεύτικων ειδήσεων, αν χρησιμοποιούν δημοσιεύσεις κοινωνικών μέσων σε βίντεο.