KI gestützte automatische Untertitelung für Videos – auch mit CH-Dialekten
2 Minuten Lektüre — Die Entwicklungen im Bereich der künstlichen Intelligenz (KI) und die sich daraus ergeben Möglichkeiten sind beeindruckend und haben auch im Bereich der Videoproduktion nicht Halt gemacht. So setzt Puresive Films neuerdings einen Workflow ein, um Untertitel automatisiert erstellen zu lassen. Schweizer Dialekte sowie andere Sprachen werden dabei unterstützt.
Der Vorteil: Für unsere Kundinnen und Kunden entfällt der lästige und zeitaufwändige Arbeitsschritt der manuellen Transkription teils langer Sprachsequenzen. Dieser wichtige Arbeitsschritt, um zum Beispiel die Barrierefreiheit zu gewährleisten sowie den Videocontent für die Social-Media-Nutzung ohne Ton zu optimieren, entfällt nun. Um den Erwartungen unserer Kundschaft gerecht zu werden, erfolgt ein Korrekturlesen sowie die Feinjustierung der Untertitelsequenzen weiterhin durch einen Video-Editor.
Auch unterschiedliche Schweizerdeutsche Dialekte sowie Räteromanisch können wir nun automatisiert ins Hochdeutsche transkribieren lassen. Dabei arbeiten wir mit einer Softwarelösung eines Schweizer Anbieters. Anhand von etlichen Stunden Archivmaterial vom Schweizer Radio und Fernsehen (SRF) wurde der Algorithmus trainiert und bietet nun eine fast zeitgleiche und zuverlässige Transkription ins Hochdeutsche an.
Das Benützen der oben erwähnten Software ist nicht ganz gratis. In der jetzigen Testphase werden wir aber keine Zusatzkosten unseren Kundinnen und Kunden verrechnen und erhoffen uns längerfristig, die Kosten für die Untertitelung sogar reduzieren zu können. Im Moment bleibt die Zeitersparnis für unsere Kundschaft, durch das Wegfallen der Transkription. Wir erhoffen uns damit schon einmal kurzfristig einen Mehrwert bieten zu können.