Navigation auf uzh.ch

Suche

Institut für Computerlinguistik Texttechnologie

InvestigaDiff

Das Forschungsprojekt InvestigaDiff befasst sich mit der Synchronisierung von Textdokumenten in verschiedenen Sprachen. Das Projekt wird vom Schweizerischen Nationalfonds gefördert und ist auf drei Jahre angelegt (2024–2027).

Kontext des Projekts

Unter dem Begriff «Generative Künstliche Intelligenz» hat sich Technologie etabliert, welche unter anderem die Bearbeitung von Texten erleichtert. So können Sprachmodelle wie z.B. GPT Texte in einem gewünschten Stil umformulieren oder Entwürfe für neue Texte generieren. Zudem können neuronale Übersetzungssysteme maschinelle Übersetzungen in vielen Sprachen anfertigen.

Jedoch ist unklar, wie gut sich diese Technologie für die Wartung von bestehenden Texten eignet – etwa für das Aktualisieren von Texten oder für den inhaltlichen Abgleich von Sprachversionen.

Das Forschungsprojekt «InvestigaDiff» soll diese Lücke füllen und die technologische Grundlage für neue Anwendungen dieser Art schaffen.

Inhalt und Ziel des Projekts

Wir unterscheiden zwischen zwei Anwendungen, die sich gegenseitig ergänzen:

(1) Das automatische Erkennen von inhaltlichen Differenzen zwischen Texten. Wichtig ist dabei, dass zwischen inhaltlichen und stilistischen Differenzen gut unterschieden werden kann und dass der Schweregrad einer Differenz korrekt eingeschätzt wird.

(2) Das Generieren von Vorschlägen, wie Differenzen zwischen Texten behutsam behoben werden können («Synchronisierung»). Besondere Herausforderungen sind zu erwarten, wenn verschiedene Sprachen oder Textsorten gleichzeitig verarbeitet werden sollen.

Wissenschaftlicher und gesellschaftlicher Kontext

Mit dem zunehmenden Einsatz von generativer KI in der Gesellschaft wird auch die Zahl der Texte und Dokumente zunehmen, die gewartet und mit der Zeit angepasst werden müssen.

Zugleich ermöglicht das Forschungsprojekt eine neue Perspektive auf Sprachmodelle und verwandte Systeme: Wo liegen ihre Grenzen, und gibt es einfache Algorithmen oder technische Anpassungen, mit denen ihr Potential noch besser ausgeschöpft werden kann?

Projektleiter:

Rico Sennrich

Mitarbeitende:

Jannis Vamvas

Zwei Doktorierende ab Sommer/Herbst 2024.