PAUL GREGORY +++ LANGUAGE FOR CLARITY

Zur Messung der sprachlichen Komplexität:
Algorithmen vonnöten

Problemstellung bzw. Aufgabe: Übersetzer und deren Auftraggeber brauchen dringend eine objektive Bemessungsgrundlage für ihre Aufgaben. Eine Messlatte nach Zeilen oder Wortzahl lässt mit das Wichtigste – nämlich die semantischen und grammatikalischen Aspekte – völlig außer Acht. Es ist ein Armutsbeweis der sogenannten „Industry“ inklusive der Übersetzerverbände, dass dieses Problem im Zeitalter der Datenbanken, Translation Memories und Maschinenübersetzung bisher nicht angegangen wurde.

Die Bemessung wird u.a. für Aufgaben gebraucht, deren eigentlicher Umfang zu Beginn unübersichtlich ist. Zum Beispiel sind die Ausgangstexte teilweise noch nicht geschrieben; oder es handelt sich um viele dutzende, sogar hunderte Seiten. Der Teufel steckt im Detail. Zehn gut geschriebene Seiten lassen sich schnell und zufriedenstellend übersetzen, die nächsten zehn (etwa von einem anderen Autor) unmöglich (d.h. weder schnell noch zufriedenstellend).

Die Notlösung einer Abrechnung nach Stunden hat rein rhetorischen Charakter und somit fällt sie aus. Der Kunde kann die Anzahl der Stunden kaum kontrollieren, ebenfalls nicht, wie intensiv oder produktiv diese geleistet werden, noch wissen alle Übersetzer, wie lange sie tatsächlich an einer Aufgabe mit welcher Aufmerksamkeit gesessen haben. Man kann für sich, je nach Arbeitspersönlichkeit, die Stunden (oder Tage) gern zu Gegenkontrolle protokollieren. Ob 10(0) Stunden zu €50 oder 5(0) Stunden zu €100 ist letztlich eine Sache der Positionierung: vielleicht bei dem einen Kunden erstes, bei einem anderen letzteres.

Eine seriöse Einschätzung des Arbeitsaufwandes für die Übersetzung von zehn oder hundert Seiten braucht selbst viel Zeit. Mit Überfliegen ist es zuverlässig nicht getan. Im heutigen Geschäftsklima wird diese Arbeit selten bezahlt. Das Angebot kommt demnach einem Glücksspiel gleich. Ein nachdenkliche Verbandsleitung hätte sich längst dafür eingesetzt, dass Angebote (ggf. laut Gesetz) bezahlt werden. Das gibt es in manchen Branchen, wenn zwar in anderen (mit wenig vergleichbaren Rahmenbedingungen) nicht. Da bietet sich die Zusammenarbeit mit anderen freien Berufen an. Derartige kleinere Schritte wären mehr wert und weniger kontrovers als das ewiggestrige, aussichtslose und bedenkliche Forderung nach einer Verkämmerung oder eines sonstigen Schutzes des Berufs (Zertifizierung usw.). Aber auch – oder eher erst recht – bei einer bezahlten Kostenschätzung wäre ein Algorithmus vonnöten, der einen Text nuanciert auswertet.

Mein Konzept des „Zeilenwertes“ gerät an Grenzen: Mit meinem Konzept des Zeilenwertes habe ich vor Jahren einen ersten Schritt getan.* Danach werden schwierig zu übersetzende Sätze (z.B. Schachtelsätze, verwirrende oder ungrammatikalische Formulierungen) doppelt sogar mehrfach gezählt: und Termini als volle oder doppelte Zeilen ohnehin, insbesondere wenn diese ungewöhnlich oder inkonsequent verwendet werden (z.B. bei Homonymen). Dafür Passagen, die praktisch keine Bearbeitung (z.B. Namenslisten) bedürfen sowie Satzwiederholungen nur geringfügig. Das Wort „Zeilenwert“ kann auf einer Rechnung stehen, ohne dass es weiter erläutert wird: Es reicht der Hinweis auf eine Erklärung auf einer Website oder ein Begleitzettel („Lieferschein“).

Mit dem „Zeilenwert“ kann aber eine Rechnungssumme erst nachträglich bestimmt werden. Er kann zudem leicht angefochten werden, denn viel liegt damit im Ermessen des Rechnungsstellers.

Unterwegs zu einer Lösung:
Eine verwandte Branche ist weiter als wir, wenn auch mit teils entgegengesetzten Zielvorgaben. Bei
http://www.schreiblabor.com/textanalyse/
kann ein Text in Sekundenschnelle kostenlos mit folgenden (und mehreren weiteren) Kennzahlen ausgewertet werden: Anzahl verschiedener Wörter, Anzahl der langen Wörter, Anteil der langen Sätze.
(Leider ist diese Website nicht mehr auffindbar!)

Man bestimme mit diesen Eckgrößen einen Wortpreis, vereinbart oder berechnet etwa das Doppelte für die verschiedenen Wörter und einen Aufpreis für die überlangen Sätze. Dies als Übergangslösung. Schon wesentlich besser als Wortzahl oder Zeilenzählung.

(Im Übrigen, wo kommt diese Berechnungsbasis historisch her, als ob Übersetzer gehobene Schreibkräfte wären? Vermutlich von den ersten Agenturen, die sich somit das Leben aufkosten der Arbeitsleistenden stark vereinfachen wollten. Und bei diesem Nebenthema kurz zu verweilen: Eine transparente Agenturrechnung würde die Vermittlung und Aufbereitung getrennt von den reinen Übersetzungskosten ausweisen. Darauf könnten Firmenkunden bestehen, tun es aber nicht. Ansonsten käme den freien Berufen im allgemeinen ein unabhängiger Staat zugute, der im der Lage wäre, die eigene steuerliche Gestaltung zu bestimmen, wie dies aber in der EU unvorstellbar ist. So würde eine Umsatzsteuer anstelle Mehrwertsteuer die Bündelung unserer Leistungen mit fremden Leistungen – bzw. Vermittlungskosten –behindern.* )

Ausarbeitung für unsere Zwecke:
Wie geht es weiter, damit die Kennzahlen auf unsere Zwecke abgestimmt werden? Man bräuchte zunächst die Einbindung von kleineren und größeren Wörterbüchern. So kann der Algorithmus anhand eines kleinen zweisprachigen Wörterbuchs feststellen, wie viele Wörter einer Vorlage dort aufzufinden sind, wie viele nicht. Anschließend kann zur Analyse ein größeres Wörterbuch herangezogen werden. Alternativ erstellt (bzw. findet) man eine Liste der Wörter einer Sprache, die diese je nach Häufigkeit des Vorkommens einstuft. Zum Beispiel: die 10.000 am häufigsten auftretenden Wörter, die 20.000 am häufigsten auftretenden Wörter, und so weiter. Die Software würde also die Wörter einer Vorlage mit einer Zählung deren Auftretens auflisten* und je nach Geläufigkeit einstufen.

Wissenschaftlich kann man später gern Untersuchungen ausführen, wie je nach Sprachpaar die Aufteilung der Wörter (500, 5000, 10.000 ...) hinsichtlich Frequenzgruppen am nächsten die Übersetzungsschwierigkeit wiedergeben kann. Zuerst aber reicht es, wenn eine grobe und für jedermann nachvollziehbare Messlatte hergestellt wird. Dies gilt auch für die Cent-Zuweisungen der Gruppierungen.

Die Komplexität des Satzbaus dürfte bei der Bemessung sich schwieriger gestalten. Wenn aber halbwegs vorzeigbare Maschinenübersetzung schon möglich ist, die nicht allein auf Datenbanken zurückgreift, so müsste diese Aufgabe für die entsprechenden Informatiker eher ein Spaziergang sein. In der Zwischenzeit wäre geholfen, wenn zumindest die Ausreißer automatisiert identifiziert werden. So könnte die Software alle Sätze mit einer Länge größer als dreißig, sechzig und neunzig Wörter zwecks Überprüfung und getrennte Berechnung exportieren. (Länge allein ist freilich kein verlässliches Kriterium für Komplexität, hier könnte aber leicht jeder Übersetzer eine Einschätzung vornehmen.)

Als Selbstverständlichkeit bleibt unter dem Strich der Umstand, dass unsere äußerst verschiedenen Leistungen niemals wirklich auf wenige Zahlen gebracht werden können. Die Präzisierung hat ihre Grenzen. Nicht zuletzt in der Betriebswirtschaft, wo man das Wort „Unternehmenswert“ – englisch „Goodwill“ – geprägt hat. Der gute Wille und somit dessen Leistung ist mit der übertriebenen (d.h. kleinkarierten) Berechnung weiterhin nicht vereinbar.
Fußnoten:
* Siehe meinen Vortrag „Professionalität und Rechnungsgrundlagen“ für die BDÜ-Konferenz “Übersetzen in die Zukunft” im Oktober 2012, Nachdruck im Tagungsband sowie auf meiner Website www.language-for-clarity.de dort unter „Professionalität“. Oder kurzgefasst im ADÜ-Infoblatt 1/2018 Seite 20.

Zu den sonst heranzuziehenden Sites gehören
https://www.wissenskurator.de/online-tools-zur-textverstaendlichkeit-im-selbsttest/ mit entsprechenden Links und Hinweisen. Für Englisch auch gibt es Tools, z.B. https://storytoolz.com/readability. Abgesehen von der reinen Statistik ist hier für Übersetzer interessant der Blick nach Füllwörtern und deren Eliminierung. So sollten bei der Übertragung viele Bindewörter und „insbesondere“ Verstärkungen sowie dergleichen gar nicht erst übersetzt werden – notfalls können solche in der Zielsprache in geringen Mengen nachträglich hinzugefügt werden, um den Lesefluss der Sätze den zielsprachlichen Gewohnheiten anzupassen.
Den Hinweis auf diese Auswertungstools verdanke ich Lukas Felsberger von CERN, Genf.

* Siehe „Die Umkehr der Umsatzsteuer“ in meinem Buch „Klasse Verantwortung – Weichenstellungen für eine starke Mittelschicht“ ISBN 978-3-00-049448-2 und sonst auf www.klasseverantwortung.de

Schlägt man z.B. bei https://www.collinsdictionary.com/dictionary/english nach, so wird geschichtlich sowie in der Gegenwart das Vorkommen des Suchwortes mit einer groben Klassifizierung („selten“, „häufig“) angegeben. Ähnliches habe ich für Deutsch leider nicht gefunden, obwohl mit der Ausbreitung der „Leichten Sprache“ dies demnächst kommen müsste.

* Bis ca. Ende der 90 Jahre hatte ich unter MS-DOS eine derartige Software, die dann bei einem Systemwechsel verlorenging.

Autor
Paul Charles Gregory
Beaumont, Haute-Loire, im Sommer 2019