
Ein beliebter Aufreger zum Börsengang von Alibaba war die deutsche Version von Alibaba.com. Die B2B-Site strotzt vor grauenhaften Übersetzungsfehlern. So werden in der Rubrik Motorrad „Körperteile“ zum Kauf angeboten und für feine Textilien offeriert ein chinesischer Händler „achselzucken für hochzeitspitze stoff“. Viele Kommentatoren sprachen Alibaba prompt die Kenntnis der lokalen Märkte ab, ohne freilich in Betracht zu ziehen, dass Deutschland für die Asiaten noch längst nicht im Fokus des Expansionsinteresses steht. Die englischen Texte wurden einfach durch Google Translate gejagt und dann auf einer Website zusammengefasst. Die „Körperteile“ sind das deutsche Pendant zu dem durchaus gängigen Begriff für Ersatzteile, den Bodyparts. In China sagte man sich offensichtlich: Besser ein schlechtes Angebot für die Deutschen als gar keines.
Damit das der Klingel-Gruppe nicht passiert, arbeitet Jens Ullrich derzeit an einer Übersetzungs-Management-Software. Zu einem gewissen Grad an Automatisierung kommt eine Schlussredaktion, die die Texte nicht nur auf Fehler untersucht sondern ihnen auch eine persönliche Note verleihen soll. Die Software überwacht einen Workflow zwischen den beteiligten Stellen. „Da die Internationalisierung der wichtigste Wachstumshebel ist, ist ein solches Tool eine sehr wichtige Sache“, so Ullrich.
Die halbautomatische Erstellung von Texten ist auch das Handwerk der Stuttgarter Aexea. Das Unternehmen, gegründet von Saim Rolf Alkan, einem Schwaben mit türkischen Wurzeln, der den Deutschen Jahre lange „Texten für online“ beizubringen versuchte, hat eine Software entwickelt, die vollautomatisch lesefreundliche Fließtexte erstellt. Das tut sie für Redaktionen ebenso wie für Onlinehändler. Die Software erzeugt die Texte, die Redaktion in Stuttgart erarbeitet die Regeln, nach denen die Software arbeitet und redigiert die Ergebnisse.
„Wir sind derzeit in vielen Bereichen unterwegs wie Inneneinrichtung, Make-up oder Mode, und hier wird die Software als Hilfswerkzeug für die Redakteure eingesetzt. Es ermöglicht ihnen , mit einigen schnellen Eingaben komplexe, produktbezogene Texte zu erzeugen“, erläutert Chefentwickkler Frank Feulner dem Technikmagazin IX.
In den USA auf dem Vormarsch
Einen kleinen Eindruck, was die Aexea-Maschine zu leisten vermag, zeigt die Website fussballheute.net. Dort füttert Aexea seine Software mit den Daten aus der Fußballbundesliga und lässt die Maschine Vorberichte zu den Partien schreiben. Am heutigen Freitag erwartet die Software, dass Hoffenheim sich an Mainz 05 die „Zähne ausbeißen“ könnte.

Genau diese Lebendigkeit der Formulierung ist eines der Herzstücke der Aexea-Software und eine Kernanforderung an automatisierte Texte. Sie dürfen – gerade im eCommerce – keinesfalls über Händler hinweg identisch sein und sollen sich auch innerhalb einer Website voneinander unterscheiden, um nicht langweilig zu wirken. So kennt „Fussballprogrammierung“ eine ganze Reihe von Formulierungen, die synonym eingesetzt werden können, um ähnliche Phänomene zu beschreiben. „Schier unlösbare Probleme“ fallen in die gleiche Kategorie wie „das Leben schwer machen“. Dennoch sind ausgerechnet heute die ersten beiden Überschriften bei den Vorberichten praktisch identisch.
Das Verfahren, dass von Aexea hier eingesetzt wird setzt Einzelwörter unter Berücksichtigung der grammatikalischen Regeln zu ganzen Sätzen zusammen. Das ist ein sehr komplexes Verfahren, das zu Beginn einen hohen Setup-Aufwand erfordert. Läuft die Maschine aber, dann skaliert sie recht mühelos auf eine größere Textmenge solange das im gleichen Kontext bleibt.
In den USA bereits zu einige Popularität gelangt ist das Verfahren von Narrative Science. Hier setzt die Maschine Textfragmente so genannte Phrasen zusammen. Das System ist leichter zu konfigurieren, liefert aber eine deutlich geringere Bandbreite an Ergebnissen. So wird die Software vor allem im standardisierten Datenjournalismus eingesetzt, also bei der Erzeugung eines Spielberichts zu zumeist unterklassigen Events oder zur Interpretation von Betriebsergebnissen in der Wirtschaftspresse. Narrative Science arbeitet unter anderem für Forbes, Konkurrent Automated Insights unter anderem für die Nachrichtenagentur AP.
Chancen und Risiken
Wer nun meint, er würde einen automatisierten Text so einfach erkennen, wie eine schlechte Alibaba-Übersetzung, der sei auf den Karlstad-Test hingeweisen, eine der wenigen Untersuchungen zur Informationsqualität bei automatischen Texten. Tatsächlich konnten 46 Studenten keinen wesentliche Qualitätsunterscheid zwischen einem menschlichen und einem Robotertext feststellen. Der eine war eben etwas emotionaler, wogegen der andere als sachlicher bewertet wurde.
Für den Einsatz im E-Commerce sind automatisiert erstellte Texte von hohem Interesse. Sie reduzieren den Arbeitsaufwand bei der Produktbeschreibung erheblich und senken die Kosten. Mit einem guten System im Hintergrund lässt sich auch die Gefahr von Duplicate Content minimieren. Die Redakteure bei Aexea sind bestens ausgebildet in Sachen Suchmaschinenoptimierung. Vor allem vor dem Hintergrund der steigenden Anforderungen an eine Personalisierung der Customer Experience können Textmaschinen einen wertvollen Beitrag leisten.

Dennoch gibt es auch eine ganze Reihe von Problemfeldern. Wer ist der „Urheber“ eines automatisierten Textes. Müssen Nutzer darüber informiert werden, wenn Produktbeschreibungen von Maschinen erzeugt werden? Genügen variable Produktseiten den Informationspflichten des Versandhandels und was passiert mit der Customer Experience, wenn der Nutzer auf dem Tablet einen anderen Produkttext liest, als auf seinem Desktop.
Dennoch: Mit dem Thema der automatisierten Texterstellung muss sich ein eifriger Shopmanager heute beschäftigen. Zwar geben die großen Onlineshops das ungern zu, aber viele von ihnen setzen längst auf Robotertexte. Drei Millionen davon hat die Aexea-Engine allein 2013 veröffentlicht.