
Eine KI als Dolmetscher? Immer wieder wird gefragt, ob Simultandolmetscher bald von Künstlicher Intelligenz (KI) ersetzt werden. Verständlich, denn die Fortschritte in der Spracherkennung sind bemerkenswert. Selbst wir als professionelle Dolmetscher sind beeindruckt von der Vielfalt an Akzenten und der Qualität, die Speech-to-Text-Systeme wie otter.ai bieten: deutsches Englisch, französisches Englisch, irisches Englisch, indisches Englisch … kaum ein Wunsch bleibt offen!
Maschinen statt Dolmetscher – Was KI kann
Da Large Language Models mit schier unbegrenzten Textmengen und Aussprachevarianten trainiert werden können, sind KI-Übersetzer eine wertvolle Hilfe beim Hörverstehen und auch beim Dolmetschen selbst. Ebenso beim reinen Transkribieren von Zahlen, wo Schnelligkeit und Präzision gefragter sind als das Verstehen der zugrundeliegenden Botschaft. Schwieriger wird es beim Übertragen von gesprochenen Botschaften, also dem Gemeinten in eine andere Sprache. Das zeigt sich beim Zoom-Dolmetschen genauso wie bei allen anderen Dolmetschmodi. Insbesondere beim Simultandolmetschen haben KI-Übersetzungen viele Nachteile.
Was KI-Übersetzer nicht können
Die aktuellen KI-Übersetzer bzw. KI-Dolmetscher haben „oberflächliche“ Probleme, die nicht zu unterschätzen sind:
- zu hohe Latenz (also Wartezeit für die Zuhörenden)
- falsche Segmentierung (Erkennung von Wort-, Abschnitts- und Satzgrenzen)
- Verwirrung bei Rednerwechseln
Der wesentliche Unterschied zwischen Mensch und Maschine liegt jedoch im echten Verstehen von Sachzusammenhängen und Situationen.
Das Kommunikationsquadrat und die 4 Ebenen der Kommunikation
Um die grundlegenden Unterschiede in der Funktionsweise besser zu verstehen, ist das Kommunikationsquadrat von Friedemann Schulz von Thun sehr nützlich. Dieses Modell beschreibt vier Ebenen, auf denen wir eine Botschaft senden oder empfangen (auch als „vier Ohren der Kommunikation“ bekannt):
- eine Sachinformation (worüber ich informiere)
- eine Selbstkundgabe (was ich von mir zu erkennen gebe)
- einen Beziehungshinweis (was ich von dir halte und wie ich zu dir stehe)
- einen Appell (was ich bei dir erreichen möchte)
Statistische maschinelle Übersetzung
So funktionieren KI-Dolmetscher auf Sachebene
Durch die Vektordarstellung von sprachlichen Einheiten in Large Language Modells sind zwar semantische Nuancen und Beziehungen zwischen Wörtern abbildbar. Dennoch arbeiten LLMs grundsätzlich nach dem statistischen Prinzip des guess the next word, je nach dem, wie häufig bestimmte Wörter im beim Training verwendeten Textmaterial in Nachbarschaft zueinander aufgetreten sind.
Auf dieser Grundlage wird ein inhaltliches Verständnis auf sehr beeindruckende Weise simuliert. Dabei gilt: Je weniger verbreitet eine Sprache, je weniger bekannt oder je neuer ein Thema, desto schwieriger für die KI. Denn in solchen Fällen verfügt die KI über deutlich weniger Trainingsmaterial.
Eine höhere Annäherung an die Inhalte einer gedolmetschten Veranstaltung kann dabei durch das „Einfüttern“ von relevantem Textmaterial erreicht werden. Dennoch bleibt ein LLM immer an der Textoberfläche. Die Folgen:
- sogenannte „Halluzinationen“
- Falschaussagen
- Widersprüche
- Satzabrisse
- unmotivierte Lücken
So kann aus der „Entfristung der Arbeitsverträge“ eine „termination of the contracts“ werden, weil diese Entsprechung statistisch wahrscheinlich ist.
Plausibilität prüfen, zusammenfassen, erläutern, schlussfolgern – all dies sind Strategien, die auf tiefem menschlichem Verständnis beruhen. Darum kann eine Dolmetscher-KI keine professionelle Verdolmetschung ersetzen.
Zwischenmenschlichkeit lässt sich nicht berechnen
Ob bei Vorträgen, Schulungen oder Verhandlungen: Immer geht es um das Zwischenmenschliche. Man möchte überzeugen oder sich austauschen, eventuell Vertrauen, gegenseitiges Verständnis und eine stabile (Geschäfts)-Beziehung aufbauen.
Wie kompetent sind KI-Übersetzer in den drei anderen persönlich-emotionalen Ebenen des Kommunikationsmodells? Zum Beispiel wenn Kommunikationsteilnehmer etwas von sich preisgeben oder mehr über das Gegenüber und seine Motivationen, Gefühle oder Wertvorstellungen herausfinden möchten? Wenn man eine gewisse Wirkung – etwa Begeisterung oder Engagement – beim Gegenüber erzielen möchte? Oder wenn man wissen möchte, wie der andere zu einem selbst steht?
Computer können all das nicht erfassen:
- Bezug zur realen Situation, dem tatsächlich Gemeinten, dem Hintergrund der Gesprächssituation und den Absichten der Kommunikationsparteien
- Nonverbale Kommunikation, die einen immensen Anteil am Funktionieren von menschlicher Kommunikation hat
Menschlicher Dolmetscher statt Maschine
KI oder Dolmetscher? Wenn es ums Verstehen geht, eindeutig Letzteres. Denn genau hier liegt der Mehrwert des Dolmetschers, der, wie es die englische Benennung „Interpreter” bereits nahelegt, zu interpretieren vermag. Hauptberufliche Dolmetscher haben stets die Fragen im Hinterkopf: „Was meint diese Person? Was will sie? Und: wie sage ich es am besten?”
Und nicht nur das: Auch wenn es darum geht, zu beraten, in welchen Fällen welche Art des Dolmetschens am sinnvollsten ist, oder ob die sogenannte Automatic Speech Translation nicht doch eine Option sein könnte, haben professionelle Konferenzdolmetscher auf allen Ebenen des Kommunikationsquadrats ein offenes Ohr.
- KI vs. Dolmetscher – Können KI-Übersetzer Dolmetscher ersetzen? - 07. April 2025