Η Microsoft επιδεικνύει καθολικό μεταφραστή Αγγλικά σε Κινέζικα που διατηρεί τη φωνή και την προφορά σας

Ένας καθολικός μεταφραστής Star Trek

Σε μια εκδήλωση στην Κίνα, ο επικεφαλής της Microsoft Research, Rick Rashid, παρουσίασε μια μηχανή μετάφρασης ομιλίας-προς-ομιλία σε πραγματικό χρόνο. Όχι μόνο η μετάφραση είναι πολύ ακριβής, αλλά και το λογισμικό διατηρεί τον τόνο και τον τονισμό του χρήστη. Δεν μιλάμε μόνο για έναν ψηφιακό, ρομποτικό μεταφραστή εδώ - αυτό είναι σταθερά μέσα στα βασίλεια του Γιατρός Ποιος ή Star Trek καθολική μετάφραση.



Ο καλύτερος τρόπος για να εκτιμήσετε αυτήν την τεχνολογία είναι να παρακολουθήσετε το παρακάτω βίντεο. Τα πρώτα έξι λεπτά περίπου είναι ο Rick Rashid που εξηγεί τη θεμελιώδη δυσκολία της μετάφρασης μέσω υπολογιστή και, στη συνέχεια, τα τελευταία λεπτά δείχνουν πραγματικά τη μηχανή μετάφρασης ομιλίας-προς-ομιλία Αγγλικά προς Μανταρίνι. Δυστυχώς, δεν μιλάω κινέζικα, οπότε δεν μπορώ να βεβαιώσω την αλήθεια της μετάφρασης, αλλά το κοινό - περίπου 2.000 Κινέζοι μαθητές - φαίνεται μάλλον εντυπωσιασμένο. Ένας επαγγελματίας αγγλόφωνος / κινέζος διερμηνέας μου είπε επίσης ότι η μετάφραση στον υπολογιστή είναι εκπληκτικά καλή. όχι μέχρι το επίπεδο της ανθρώπινης μετάφρασης, αλλά πλησιάζει.



Υπάρχει, φυσικά, πολλή τεχνολογική μαγεία συμβαίνει πίσω από τα παρασκήνια. Για αρχή, το λογισμικό πρέπει να εκπαιδευτεί - τόσο με λίγες ώρες εγγενών, ομιλούμενων Κινέζων, όσο και μία ώρα από τα ομιλούμενα Αγγλικά του Rick Rashid. Από αυτό, το λογισμικό ουσιαστικά διασπά την ομιλία σας στα μικρότερα συστατικά (φωνήματα) και στη συνέχεια τα συνενώνει με το κινεζικό ισοδύναμο, δημιουργώντας έναν μεγάλο χάρτη από ήχους από Αγγλικά σε Μανδαρινικά. Στη συνέχεια, κατά τη διάρκεια της πραγματικής παρουσίασης επί σκηνής, το λογισμικό μετατρέπει την ομιλία του σε κείμενο (όπως βλέπετε στην αριστερή οθόνη), το κείμενό του σε κείμενο Mandarin (δεξιά οθόνη) και, στη συνέχεια, το Rashid / Chinese mash-up δημιουργήθηκε κατά τη διάρκεια της προπόνησης Η διαδικασία χρησιμοποιείται για να μετατρέψει αυτό το κείμενο σε προφορικές λέξεις.



Το τελικό αποτέλεσμα έχει σίγουρα μια ισχυρή ένδειξη ψηφιοποιημένου, ρομποτικού Microsoft Sam, αλλά είναι εκπληκτικό το πόσο διατηρείται η προφορά, η χροιά και ο τονισμός του Rashid.

Όσον αφορά την ακρίβεια, η Microsoft λέει ότι το πλήρες σύστημα έχει ποσοστό σφάλματος περίπου μία λέξη στις οκτώ - βελτίωση κατά 30% σε σχέση με την προηγούμενη καλύτερη λέξη σε πέντε. Μια τέτοια δραματική βελτίωση ήταν δυνατή με τη χρήση του Βαθιά νευρωνικά δίκτυα , μια τεχνική μηχανικής μάθησης που επινοήθηκε από τον Geoffrey Hinton του Πανεπιστημίου του Τορόντο. Το Deep Neural Network είναι βασικά ένα τεχνητό νευρωνικό δίκτυο (λογισμικό που διαμορφώνει χιλιάδες διασυνδεδεμένους «νευρώνες»), αλλά με κάποιες αλλαγές ώστε να μιμείται πιο στενά τη συμπεριφορά του ανθρώπινου εγκεφάλου.

Προχωρώντας προς τα εμπρός, το μεγάλο ερώτημα είναι όταν το λογισμικό μετάφρασης ομιλίας-ομιλίας της Microsoft Research θα βρει πραγματικά το δρόμο του στην αγορά - και ναι, σε περίπτωση που αναρωτιέστε, το λογισμικό δεν περιορίζεται μόνο στα Αγγλικά και στα Κινέζικα. Μπορούν να χρησιμοποιηθούν και οι 26 γλώσσες που υποστηρίζονται από την Πλατφόρμα ομιλίας της Microsoft, συμπεριλαμβανομένου του Mandarin-to-English. Η πιο προφανής περίπτωση χρήσης θα ήταν στο smartphone σας Windows Phone 8 (ή 9;) ή στο Skype: Θα μπορούσατε να καλέσετε μια εταιρεία στην Κίνα ή τη Γερμανία ή τη Βραζιλία, να μιλήσετε κανονικά στα αγγλικά και θα ακούσουν τη φωνή σας στην τοπική τους γλώσσα . Θα μπορούσατε επίσης να χρησιμοποιήσετε το smartphone σας ως καθολικός μεταφραστής ενώ ταξιδεύετε. Όπως μπορείτε να δείτε παρακάτω, η Microsoft έπαιζε με μετάφραση τηλεφώνου σε τηλέφωνο σε πραγματικό χρόνο το 2010:

Πιθανώς η Microsoft εργάζεται σε τέτοιες εφαρμογές - αλλά πιθανότατα παρεμποδίζεται από πρακτικά ζητήματα, όπως η ισχύς επεξεργασίας που απαιτείται για τη μετάφραση ομιλίας σε λόγο ή παρέχει μια εύχρηστη διεπαφή για τη διαδικασία εκπαίδευσης / μάθησης. Η ίδια η διαδικασία εκπαίδευσης μπορεί να απαιτεί περισσότερη ισχύ επεξεργασίας από ό, τι ένας οικιακός χρήστης μπορεί να προσφέρει επίσης. Υπάρχει πάντοτε το σύννεφο!

Copyright © Ολα Τα Δικαιώματα Διατηρούνται | 2007es.com