Gesellschaftlicher Zugang
© bmfsfj.com

Schau mal, es geht!

Leuchtturmprojekt ErLeSen: KI-generierte Leichte Sprache ebnet den Weg zur Barrierefreiheit im Netz

ErLeSen, das steht für Erstellung und Analyse Leichter Sprache durch Künstliche Intelligenz. Unter diesem Namen startete im März dieses Jahres ein Projekt zur KI-generierten Leichten Sprache unter der Leitung von Prof. Dr. Bodo Kraft, Experte für Wirtschaftsinformatik an der FH Aachen. „Ein nicht ganz einfaches Unterfangen", berichtet Kraft. Das vom Bundesamt für Familie und zivilgesellschaftliche Aufgaben (BAFzA) geförderte Vorhaben befindet sich auf der Zielgeraden.

Der enorme Nutzen einer barrierefreien Sprache

Zehn Millionen Menschen in Deutschland benötigen entweder Leichte oder Einfache Sprache, berichtete Anne Leichtfuß in einem Interview mit dem Ministerium für Arbeit und Soziales im Mai. Mit den Flüchtlingen, die in den letzten Jahren nach Deutschland gekommen sind, sei die Zahl noch einmal gestiegen – wahrscheinlich auf etwa 14 Millionen.

Prof. Dr. Bodo Kraft ist seit 2010 Professor für Wirtschaftsinformatik an der Fachhochschule Aachen. Er forscht im Bereich der Natürlichen Sprachverarbeitung (NLP) und leitet das Projekt ErLeSen.

Beide Sprach-Formen sind darauf ausgerichtet, Informationen für Menschen leichter zugänglich zu machen, die Schwierigkeiten beim Lesen und Verstehen komplexer Texte haben. Dadurch können Menschen mit geringen Deutschkenntnissen, mit Lern- oder Leseschwierigkeiten sowie Menschen mit Behinderung barrierefrei(er) teilhaben.

Das KI-Projekt von Prof. Dr. Bodo Kraft und seinem Team hat somit eine hohe Relevanz. Denn ErLeSen fokussiert sich auf das Erzeugen von Leichter Sprache. Diese folgt besonderen Regeln und Strukturen, wie einer begrenzten Anzahl von Wörtern und einer einfachen Satzstruktur, um den Text für Leser*innen verständlicher zu machen. Sie beruht zum Großteil auf den Regeln des Netzwerkes Leichte Sprache e.V. An diesem Regelwerk haben unter anderem auch Menschen mit Lernschwierigkeiten mitgearbeitet. Die Einfache Sprache verfolgt ein ähnliches Ziel, hat aber keine festen Regeln oder Strukturen. Es gibt lediglich allgemeine Prinzipien zur Vereinfachung von Texten, was eine KI-Generierung erschwert.

Die Komplexität hinter der Vereinfachung

Zu Beginn des Projekts sammelte die Forschungsgruppe zunächst das nötige Wissen zusammen, um sich dann ins Feld zu begeben. Wie funktioniert Leichte Sprache? Welche Anforderungen gibt es? Wo gibt es sie schon, wo noch nicht? „Es ist nicht so einfach, wie es scheint", sagt Kraft. Quantitativ mangele es nicht an Leichter Sprache im Netz, qualitativ aber schon. Denn sei Leichte Sprache schlecht KI-generiert, sorge sie für nur noch mehr Arbeit. „Dann muss eine Person den gesamten Text überarbeiten. Da geht es schneller, ihn selbst zu schreiben", weiß der Professor.

»

Künstliche neuronale Netze sind heute die Basis für viele Aufgabenstellungen der künstlichen Intelligenz. Die Grundidee ist angelehnt an die Nervenzellen und Verbindungen im menschlichen Gehirn.

«
Prof. Dr. Bodo Kraft

Das Ziel einer guten KI-generierten Leichten Sprache muss zwischen 80 bis 90 Prozent liegen. Das bedeutet, dass es in den meisten Situationen, in denen menschliche Sprache verarbeitet wird, erfolgreich funktioniert. Es muss lediglich noch einmal Gegengelesen werden. Kraft berichtet: „Um das zu erreichen, haben wir kontinuierlich mit dem Büro für Leichte Sprache in Köln zusammengearbeitet. Die Mitarbeitenden dort haben uns geschult und überprüfen ständig unsere Ergebnisse."
Sobald einmal klar war, was Leichte Sprache für Anforderungen mit sich bringt, machte sich das Team daran, Textdaten zusammenzutragen. „Künstliche Neuronale Netze sind heute die Basis für viele Aufgabenstellungen der künstlichen Intelligenz", erklärt Kraft, „die Grundidee ist angelehnt an die Nervenzellen und Verbindungen im menschlichen Gehirn."

Diese Verknüpfungen mussten mithilfe eines Textkorpus in Leichter Sprache erst geschaffen werden. Wie das menschliche Gehirn muss auch das neuronale Netz lernen, um Wissen zu erwerben. Dies geschieht durch einen Trainingsprozess, bei dem das neuronale Netz mit bekannten Aufgaben und deren Lösungen gefüttert wird. Wenn dieser Prozess oft genug wiederholt wird, entsteht ein gut justiertes Netz, das in der Lage ist, neue, unbekannte Aufgaben zu lösen.

Der Weg vom Trainingskorpus zur eigenen KI

Da ChatGPT über einen großen Datenspeicher verfügt, erwägte das Team zunächst, den Chatbot für die Generierung Leichter Sprache zu nutzen. Doch die Ergebnisse waren laut dem Professor bescheiden. Er führt das darauf zurück, dass das Programm mit einem anderen Fokus trainiert wurde. Das Team probierte es also andersherum: Sie ließen sich Leichte Sprache in normale übersetzen. „Wir haben dann im Internet nach Texten in Leichter Sprache gesucht – inzwischen gibt es da ja wirklich schon viel – und uns das in ‚normale’ Sprache von ChatGPT übersetzen lassen". So begann die Suche im Netz nach Leichter Sprache, aus der sich schließlich ein Trainingskorpus mit Sprachpaaren (Leichte Sprache | normale Sprache) ergab. „Es klingt banal, aber das war ein völlig neuer Ansatz”, sagt Kraft schmunzelnd.

Gesetzesänderung von 2018

Seit dem 1. Januar 2018 gibt es in Deutschland eine Änderung des Gesetzes zur Gleichstellung von Menschen mit Behinderungen (BGG), bei der § 11 um die Verständlichkeit und Leichte Sprache erweitert wurde.

 

Die Generierung von Leichter Sprache ist demnach vergleichbar mit der Übersetzung in eine andere Sprache: Schwierige Begriffe werden aufgelöst, Sätze verkürzt, Syntax angepasst. Wichtig ist, dass die Sätze ihren Sinn nicht verlieren. Dann ging es mit den Sprachpaaren an das Anlernen einer eigenen KI mithilfe des Deep Learning Ansatzes. Dabei entstehen mehrschichtige, künstliche, neuronale Netze, mit deren Hilfe Maschinensysteme große Datenmengen analysieren, Muster erkennen und gelernte Inhalte immer wieder verknüpfen können. Keine leichte Aufgabe, doch das Projekt ist von Erfolg gekrönt.

Inzwischen ist die KI-generierte Sprache von Kraft und seinem Team so weit, dass sie die 80 bis 90 Prozent erfüllt. Sie kann also in der Mehrzahl der Fälle erfolgreich und effektiv eingesetzt werden. Auch das Büro für Leichte Sprache in Köln hat grünes Licht gegeben. Nun steht einer Veröffentlichung von ErLeSen nichts mehr im Wege: In sechs Monaten soll das Projekt online gehen.

Ein Beispiel dafür, wie „normale" Sprache zu Leichter Sprache werden kann.
© Civic Coding Forum

ErLeSen soll nachnutzbar gemacht werden

Das Ziel der Forschenden ist es, die KI in einer Art Webportal als Open-Source-Datensatz zu veröffentlichen und somit nachnutzbar zu machen. Kraft und sein Team erhoffen sich, dass Leichte Sprache dadurch weiter im Netz verbreitet wird und mehr Teilhabe entstehen kann.

Ob ein langfristiger Nutzen entsteht, hängt vor allem davon ab, ob sich dem Thema auch zukünftig jemand annimmt. Denn bei ErLeSen handelt es sich um ein Leuchtturmprojekt. Das Webportal wäre eine Möglichkeit, die Daten weiter nutzbar zu machen. „Es braucht jedoch Menschen, die so ein Projekt vorantreiben. Das kann aus idealistischen oder wirtschaftlichen Gründen sein. Hauptsache, die Arbeit war nicht umsonst und leistet einen Beitrag zur Barrierefreiheit", sagt Kraft.

Daran sollte allen gelegen sein. Das BAFzA hat immerhin 225.000 Euro investiert. Außerdem sind gesellschaftsrelevante Themen wie die Barrierefreiheit stets für viele Menschen interessant.

© Inclusion Europe

Auf europäischer Ebene

...setzt sich die Organisation Inclusion Europe” bereits seit 1988 für die Gleichberechtigung und Teilhabe von Menschen mit geistigen Behinderungen, ihren Familienmitgliedern und Interessen ein. Sie hat dazu ein Wörterbuch in Leichter Sprache und eine Checkliste entwickelt.