Berlin (dpa/tmn) – Auf Reisen haben sie schon vielen Menschen aus der Patsche geholfen: Übersetzungs-Apps. Mit ihrer Hilfe kann man übersetzte Wörter, Sätze und ganze Texte herzeigen oder verschicken, bei Bedarf meist auch laut vorlesen lassen, wenn die Verständigung sonst nicht klappt.
Dank Künstlicher Intelligenz (KI) dürften solche Anwendungen bald in einer ganz neuen Qualität verfügbar sein. Und das nicht nur für Reisende, sondern für alle, die beruflich oder privat in Sprachen kommunizieren müssen, die sie gar nicht oder nicht gut genug für den jeweiligen Zweck beherrschen.
Übersetzer spricht mit der eigenen Stimme
So hat Google ein neues KI-Modell namens Audio-Palm vorgestellt, das sowohl Text als auch Sprache erkennen, verarbeiten und erzeugen kann, etwa für Übersetzungen und sogar mit der eigenen Stimme der jeweiligen Nutzerin oder des jeweiligen Nutzers.
Die durchaus eindrucksvollen Ergebnisse ihrer Arbeit demonstrieren die Wissenschaftler in einem Video, aber auch mit Audio-Vergleichsbeispielen in diversen Sprachen auf der Projektseite.
Ein kurzer Sprachbefehl reicht zum Anlernen
Das neue Modell übertreffe «bestehende Systeme für Sprachübersetzungsaufgaben erheblich», sind sich die Forscherinnen und Forscher sicher. Und: Schon eine «kurze gesprochene Aufforderung» genüge, damit das Modell die eigene Stimme auf diverse andere Sprachen übertragen könne.
Bei Audio-Palm handelt es sich um die Zusammenführung des KI-Sprachmodells Palm mit dem KI-Audiogenerator Audio-LM. Palm kommt etwa auch in Googles Chatbot Bard zum Einsatz. Informationen darüber, ob und wann Audio-Palm beispielsweise bei Google Translate zum Einsatz kommen könnte, gibt es auf der Projektseite aber noch nicht.