Το Speech2Face είναι ένα προηγμένο neural network που αναπτύχθηκε από επιστήμονες του MIT και έχει εκπαιδευτεί να αναγνωρίζει ορισμένα χαρακτηριστικά του προσώπου και να αναδομεί τα πρόσωπα των ανθρώπων απλώς ακούγοντας τον ήχο της φωνής τους.
Πιθανότατα έχετε ήδη ακούσει για κάμερες με τεχνητή νοημοσύνη που μπορούν να αναγνωρίσουν τους ανθρώπους μόνο αναλύοντας τα χαρακτηριστικά του προσώπου τους, αλλά τι θα γινόταν αν υπήρχε τρόπος για την τεχνητή νοημοσύνη να καταλάβει πώς μοιάζετε μόνο από τον ήχο της φωνής σας και χωρίς να συγκρίνετε φωνή σε μια βάση δεδομένων;
Σε αυτό ακριβώς πάνω εργάστηκε μια ομάδα επιστημόνων στο MIT και τα αποτελέσματα της δουλειάς τους είναι εντυπωσιακά, ε και αδιανόητα τρομακτικά, αν ζητάτε τη γνώμη μας. Ενώ αυτό το σύστημα που ονομάζεται Speech2Face, δεν μπορεί ακόμη να καταλάβει τα ακριβή χαρακτηριστικά του προσώπου ενός ανθρώπου μόνο από τη φωνή του, σίγουρα έχει πιάσει πολλές λεπτομέρειες σωστά.
«Το μοντέλο μας έχει σχεδιαστεί για να αποκαλύπτει στατιστικές συσχετίσεις που υπάρχουν μεταξύ των χαρακτηριστικών του προσώπου και των φωνών των ομιλητών στα δεδομένα εκπαίδευσης», είπαν οι δημιουργοί του Speech2Face. «Τα δεδομένα εκπαίδευσης που χρησιμοποιούμε είναι μια συλλογή εκπαιδευτικών βίντεο από το YouTube και δεν αντιπροσωπεύουν εξίσου ολόκληρο τον παγκόσμιο πληθυσμό. Επομένως, το μοντέλο, όπως συμβαίνει με οποιοδήποτε μοντέλο μηχανικής μάθησης, επηρεάζεται από αυτήν την άνιση κατανομή δεδομένων».
Μπορείς να πεις πολλά για έναν άνθρωπο από τον τρόπο που μιλάει μόνος του. Για παράδειγμα, πιθανότατα μπορείτε να πείτε αν κάποιος είναι άνδρας ή γυναίκα ή αν είναι νέος ή μεγάλος, αλλά το Speech2Face υπερβαίνει αυτό το απλό λογικό συμπέρασμα. Μπορεί να προσδιορίσει με αρκετή ακρίβεια το σχήμα της μύτης, των ζυγωματικών ή του σαγονιού κάποιου μόνο από τη φωνή του, επειδή ο τρόπος με τον οποίο είναι δομημένα η μύτη και τα άλλα οστά στο πρόσωπό μας καθορίζει τον τρόπο που ακουγόμαστε!