2025-06-09 00:26:49 +02:00

213 lines
17 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

Transkript - Anna-Lena Ratz, Produktmanager WTG IP1
00:00:00 Sprecher 1
Bitte stelle dich einmal vor und erläutere deinen beruflichen Hintergrund und deine Rolle innerhalb der WTG.
00:00:10 Sprecher 2
Ja, mein Name ist \[IP1\]. Ich bin bei der WTG angestellt und \[Beschreibung der Arbeitsstelle entfernt\].
00:00:33 Sprecher 1
Nutzt du in deinem Alltag oder auch im Berufsalltag bereits KI-Systeme und welche Erfahrungen hast du damit gemacht?
00:00:44 Sprecher 2
Absolut. ChatGPT nutze ich täglich mehrmals. Für Grafikerstellungen nutze ich noch KI und ich habe auch schon mal mit KI für Präsentationserstellungen gearbeitet.
00:01:03 Sprecher 1
Wie waren deine Erfahrungen damit?
00:01:06 Sprecher 2
Durchweg gut also je besser man füttert, desto besser der Output. Manchmal aber halt auch Grütze, die rauskommt.
00:01:16 Sprecher 1
Welche Ziele verfolgt die WTG mit dem Einsatz des entwickelten Echtzeitübersetzers im Bereich Notrufkommunikation?
00:01:25 Sprecher 2
Unsere große Vision ist es, Sprachbarrieren zu eliminieren. Wir möchten eine Welt schaffen, in der jeder Mensch sich mit jedem verständigen kann und Sprache kein Thema mehr ist und gerade in der Notrufkommunikation möchten wir unseren Kunden, also den Disponenten, ermöglichen alle Anrufer zu verstehen und mit jedem sprechen zu können und wir helfen den Helfern, um Hilfe zu leisten.
00:02:01 Sprecher 1
Gibt es irgendwelche Vorteile dieser Technologie, für den Disponenten, aber auch für den Anrufer, die du hervorheben kannst?
00:02:14 Sprecher 2
Auf jeden Fall. Also es ist von Mehrwert, wenn die beiden sich verstehen. Was wir technologisch drin haben, ist die automatische Spracherkennung. Der 24/7-Dolmetscher, der immer bereitsteht, der 58 Sprachen spricht und der sowohl für den Disponenten, das in die Sprache des Disponenten wandelt, als auch für den Anrufer in die Sprache vom Anrufer wandelt.
00:02:48 Sprecher 1
Welche Herausforderungen hast du in Bezug auf Akzeptanz oder Vertrauen gegenüber dem Übersetzer erlebt, sei es intern, aber auch extern?
00:03:00 Sprecher 2
Das ist eine spannende Frage. Also meistens auf Messen haben wir da diesen klassischen Aha-Effekt oder Wow-Effekt. Wenn du jemanden das erzählst, dann glaubt er dir erstmal nicht. Was viele sagen, ist dieser „Babel Fish“. Der „Babel Fish“ ist eine Science-Fiction Figur \[aus den Neunzigern\] und jetzt sagen alle, dieser „Babel Fish“ ist jetzt Wirklichkeit geworden. Science-Fiction wird Wirklichkeit, und das ist etwas, wovon man nur geträumt hatte und ist jetzt Wirklichkeit, und viele begreifen das noch nicht und vielen kannst du das auch, glaube ich, gar nicht so technisch erklären. Das ist auch egal. Wenn man das aber zeigt, wie es funktioniert, wird gestaunt und „Er macht das wirklich“ und dieses überrascht sein, dass es das wirklich tut, was es soll. Es ist für mich so normal geworden, als für andere, die noch mal weiter weg sind von KI oder solche Systeme nicht täglich nutzen. Es ist komplett faszinierend, dass es das wirklich tut, auch, dass die Latenz sehr kurz gehalten ist und dass der auch schon richtig gut spricht.
00:04:29 Sprecher 1
Wie unterscheidet es sich zu intern?
00:04:32 Sprecher 2
Ich glaube, da wir ein Technologieunternehmen sind, haben wir intern die Akzeptanz schon höher. Da hat man nicht mal diesen Wow-Effekt, da kommen eher noch mal Fragen wie: Warum kann er noch kein Speech-to-Speech. Also da fehlen direkt Anforderungen. Aber bei Externen kommt es auch ein bisschen auf die Branche an. Wenn ich mit ITlern spreche oder Mitarbeitern, die dann die Anwendung nutzen würden, sind es auch noch mal Unterschiede, weil die ITler können das auch näher nachvollziehen, aber bei den normalen Mitarbeitern, auch Disponenten, da ist der Wow-Effekt schon höher.
00:05:21 Sprecher 1
Also steht das technische Knowhow mit der Akzeptanz zusammen? Also wenn das schon mal vorhanden ist, dann ist eine gewisse grundlegende Akzeptanz auch da?
00:05:32 Sprecher 2
Ja, Akzeptanz und Ja, doch.
00:05:39 Sprecher 1
Also hängt für dich die Transparenz über die Funktionsweise des Übersetzers auch mit dem Vertrauen zusammen?
00:05:55 Sprecher 2
Also da muss man auch sagen, ich hole immer andere Stories raus. Es kommt darauf an mit wem ich spreche, je nachdem erkläre ich wie es funktioniert. Wenn es technisch versierte Personen sind, da kann ich auch technisch drüber sprechen und dann sind es auch andere Fragen. Dann kommen so Vertrauensfragen wie: Wie ist das gehostet? Lernt die KI mit? Hört die immer mit? Was passiert mit dem Transkript? Wenn ich dann aber mit weniger technisch versierten \[Personen\] spreche, dann sind die Fragen schon anders.
00:06:35 Sprecher 1
Welche Maßnahmen wurden bereits getroffen oder könnten deiner Meinung nach ergriffen werden, um Transparenz zu gewährleisten?
00:06:52 Sprecher 2
Es gibt verschiedene Ansätze, um die Zielgruppe abzuholen. Ich glaube, viel Aufklärungsarbeit ist notwendig, und zwar nicht nur über unser Tool, sondern generell in die KI und das auch wirklich leicht verständlich zu machen, wie KI funktioniert und nicht mit Buzzwords und diese Buzzwords dann auch im Alltag einfließen lassen. Ich glaube, das wäre auch ziemlich sinnvoll, wenn das durch Unternehmen geschieht. Also wenn Unternehmen ihre Mitarbeiter schulen. Wenn dieses Thema nicht bei jedem Einzelnen liegt. Ich meine, diese Entwicklungsschritte mit diesen Big Steps hatten wir schon in der Vergangenheit - Internet oder das Handy - das man jetzt wirklich auch unterwegs telefonieren kann, und das sind halt immer so neue große Technologien, wo man eben abholen muss. Ich weiß nicht, wie es damals funktioniert hat. Wie hat man damals gelernt, ins Internet zu gehen? Wie hat man damals gelernt, wie das Handy funktioniert? Ich glaube, genauso müssen wir auch lernen mit KI umzugehen.
00:08:10 Sprecher 1
Also bessere Kommunikation über oder überhaupt Kommunikation darüber, auch im öffentlichen Bereich?
00:08:17 Sprecher 2
Ja, nur das Problem bei KI ist, glaube ich, dass es immer komplizierter wird. Du kannst es nicht anfassen, es ist Software. Du hast kein Handy in der Hand, du hast keine Internetseite, die du aufrufst, sondern es ist einfach anhand von Datenbasis da.
00:08:39 Sprecher 1
Hast du Bedenken, dass persönliche Daten bei der Nutzung von KI-Systemen gespeichert oder weitergegeben werden?
00:08:53 Sprecher 2
Also ich bin mir recht sicher, dass das passiert. Genau, also mir ist bewusst, dass es passiert.
00:09:02 Sprecher 1
Sollte dennoch irgendwas passieren, damit du dich in Bezug darauf sicherer fühlst? Wie würdest du dem ganzen mehr vertrauen?
00:09:14 Sprecher 2
„Sicher“ ist ein dehnbarer Begriff. Ich glaube, wir haben in Deutschland schon sehr viele Verordnungen und Vorschriften. Ich persönlich würde es immer so sehen: Wenn es mir einen großen Mehrwert bietet, dann ist mir das egal, was für Daten irgendwo hingelangen, wenn mein Ziel erreicht wird.
00:09:36 Sprecher 1
Wie geht die WTG mit diesen Herausforderungen im Datenschutzbereich um?
00:09:43 Sprecher 2
Ja, das ist noch ziemlich schwierig, weil es gerade für KI-Tools noch keine ISO-Zertifizierung oder Grundnorm gibt. Es gibt jetzt den AI Act, der in Kraft getreten ist. Das ist auch typisch Deutschland, bevor wir KI supporten, supporten wir erstmal die Reglementierung davon. Wir als WTG müssen da immer up-to-date sein. Wir müssen uns darüber informieren, wir haben Datenschutzbeauftragte und das ist ein wichtiger Punkt für uns. Gerade in Deutschland für Behörden, die unsere Zielgruppen sind, müssen wir datenschutzkonform vorgehen.
00:10:26 Sprecher 1
Wem vertraust du im Notfall mehr: dem menschlichen Übersetzer oder der KI, und warum?
00:10:38 Sprecher 2
Das ist eine gute Frage: KI oder Mensch? Ein Mensch funktioniert auf Basis von Emotionen und von dem, was er gelernt hat. Aber das Gelernte ist beim Menschen eher eine subjektive Wahrnehmung. Wenn ich gelernt hab, dass ein gewisses Wort auf Spanisch so heißt, dann heißt es so aber das basiert auf meiner Erfahrung und nicht das, was vielleicht unbedingt stimmen muss. Eine KI ist wirklich trainiert auf Grundlage von Daten. Wenn die Daten stimmen, stimmt die KI und dann stimmt der Output, weil bei einem Übersetzungstool, denke ich, dass die Daten einer KI um einige Faktoren besser sind als beim Menschen. Ich glaube, was da ein bisschen auf dem Weg bleiben kann, sind die emotionalen Interpretationen. Der KI-Dolmetscher ist dann einfach hart und ehrlich und übersetzt genau das, was gesagt wird. Man muss glaube ich noch mal in der Zukunft hingehen und gewisse Phrasen, die in bestimmten Sprachen etwas mitgeben sollen, muss eine KI noch lernen. Aber grundsätzlich glaube ich, dass eine KI Stand jetzt schon besser übersetzt als ein Dolmetscher, gerade weil es viel mehr Sprachen kann.
00:12:11 Sprecher 1
Was sollte deiner Meinung nach am aktuellen Systemdesign oder Einsatz eben von TONI verbessert werden, sei es technisch, organisatorisch oder kommunikativ?
00:12:30 Sprecher 2
Also ich finde das schon sehr gut. Aber Verbesserungen sind immer möglich. Was ich gut finde, wäre der TONI-to-go, den wir jetzt auch gerade bisschen treiben, ein Echtzeitübersetzer für alle Fälle, den man vor Ort überall dabeihaben kann. Ich glaube, technologisch wäre \[Speech-to-Speech\] sinnvoll. Ich komme gerade aus \[einem Meeting zu TONI\], und dort hat man gesehen, wie Speech-to-Speech funktionieren kann. Das können wir nämlich gerade, ob wir es jetzt implementieren, dafür muss man erst mal die Anforderungen definieren. D. h. was genau ist Speech to speech, Umsetzungsdesign, etc.? Kommunikativ glaube ich, dass wir noch viel mehr schreien müssen, weil das ist so ein wichtiges Thema gerade in Notrufbereichen, eine Sprachbarriere zu beseitigen und den Disponenten zu entlasten. Ich glaube auch, dass es nicht nur für den Notruf sinnvoll ist, sondern ich glaube an was Größeres, und zwar, dass die Stadt es auch nutzen kann als Stadtmarketing, dass man sagt bei uns werden alle Notrufe beantwortet, dass auch Menschen als Touristen dorthin kommen und Notrufe wählen können und dass die Stadt attraktiver wird. Wir werden bunter, wir werden vielfältiger und da brauchen wir Lösungen für.
00:14:10 Sprecher 1
Gibt es Pläne zur Weiterentwicklung oder neuen Funktionen, abgesehen von Speech-to-Speech, oder auch anderen KI-Tools?
00:14:27 Sprecher 2
Ja, also ich glaube, dass wir da noch ganz, ganz am Anfang sind mit den Möglichkeiten und den Produkten, die wir entwickeln werden in Richtung KI. Es gibt Überlegungen, tatsächlich schon für weitere Produkte. Aber noch nichts Konkretes, wo wir sagen, das macht jetzt Sinn und da fangen wir an zu entwickeln.
00:14:55 Sprecher 1
Gibt es Trends in der BOS-Branche, die deiner Meinung nach Einfluss auf die Entwicklung von KI-basierten Übersetzungssystemen haben könnten?
00:15:03 Sprecher 2
Auf jeden Fall. Es wird der Generationenwechsel von den Führungskräften, von den Einsatzkräften beziehungsweise von den Leitstellendisponenten kommen. Die Verjüngungskur führt, glaube ich, dazu, dass neue Technologien akzeptierter werden. Ich habe letztens gelesen, dass die Polizei NRW das digitale Verhör eingeführt hat und die ganzen Einsatzkräfte mit 2.500 Tablets ausgestattet hat und so was ist halt ein Gamechanger - ein Türöffner. Wenn du jetzt erst mal ein Tablet hast, dann kannst du da auch verschiedene Applikationen drauflaufen lassen. Genauso denke ich, dass es sich in der Leitstelle auch ändern wird. Wenn wir jetzt heute in die Leitstelle gehen, dann fallen wir tot um, weil wir denken: „Oh, willkommen zurück im 1980“ und das wird hoffentlich in 10 Jahren ganz anders sein und wir denken: „Oh, willkommen in 2060“. Wir müssen irgendwie dahin gehen, dass die kritische Infrastruktur, gerade die Leitstellen, nicht Verlierer des technologischen Wandels sind und immer zurückhängen, sondern das wäre doch super, wenn genau diese zentralen Infrastrukturen, die Vorreiter wären, nicht weil sie es testen sollen, sondern weil sie die beste Technologie besitzen sollten und damit ausgestattet werden sollten.
00:16:41 Sprecher 1
Wie lief der Entwicklungsprozess des Übersetzers?
00:16:56 Sprecher 2
Der Entwicklungsprozess lief gut. Wir haben eng mit Disponenten und mit Kunden zusammengearbeitet, was uns sehr geholfen hat, um dieses direkte User Feedback zu bekommen. Ich denke, das merkt man auch ganz stark in dem Design des Produktes und den Anforderungen, die es wieder gibt.
00:17:19 Sprecher 1
Okay und gab es irgendwelche Herausforderungen oder Rückmeldungen von den Nutzern während der Entwicklung?
00:17:27 Sprecher 2
Also was für uns eine große Herausforderung nach wie vor ist, sind die großen Datenmengen. Du brauchst Stand heute immer noch so viel Rechenleistung für Sprachübersetzung. Die ganze Hardware ist eher eine Schlacht und macht nicht so viel Spaß. Ich glaube, da werden wir in den nächsten Monaten, Jahren auf jeden Fall viel, viel besser werden noch und die Hardware wird kleiner und günstiger. Das wird noch mal einen richtigen Schwung geben. Von den Nutzern gab es Feedback, zum Beispiel das mit dem Fenster, so dass wir jetzt auf ein Fenster gewechselt sind von zwei Fenstern, wir die Textbausteine kategorisiert haben, man den Chat leeren kann, oder ein Anrufbutton TONI. Den „Anruf beenden“-Button gab es auch nicht von Anfang an.
00:18:34 Sprecher 1
Gab es bestimmte Überlegungen von Anfang an hinter dem Design oder den Funktionen des Produkts?
00:18:44 Sprecher 2
Also Überlegungen gab es von Anfang an. Wir haben eine Anforderungsliste definiert und die Anforderungen mit dem Produktdesigner besprochen. Dann wurde UI/ UX getätigt, ausgeführt und dann haben wir das abgenommen und entwickelt.
00:19:08 Sprecher 1
Inwiefern fließt das Feedback von Nutzern in deine Entscheidungen zur Produktentwicklung ein und gibt es dafür Beispiele wie Nutzerwünsche umgesetzt wurden?
00:19:28 Sprecher 2
Ja, wir haben ein Feedback-Konzept und das Feedback fließt direkt in die Entwicklung mit ein. Ein Beispiel wäre die Veränderung des Fensters, dass aus zwei Fenstern eins wurde.
00:19:51 Sprecher 1
Wie priorisierst du Funktionen oder auch Anforderungen für den Übersetzer?
00:19:59 Sprecher 2
Du hast verschiedene Stakeholder: Du hast die Anwender, du hast das Business, du hast Geschäftsführer, du hast die Visionäre, du hast den Vertrieb und musst alle unter einen Hut bekommen. Von allen kriegst du Anforderungen und Wünsche was noch mit rein soll. Aber dann geht es daran zu priorisieren: Was hat den meisten Effekt? Was wäre jetzt an dieser Stelle das Sinnvollste? Welche Ziele verfolgen wir an dieser Stelle - Bekanntheitsgrad erhöhen, Optimierung für die jetzigen Benutzer, das ganze produktfähig zu machen, um von mehreren genutzt zu werden, so in Richtung Multi-Tenant-Fähigkeit? Da muss man dann abwägen und priorisieren. Man kann das mit Scoring Modellen machen, aber im Endeffekt ist es eine subjektive Wahrnehmung.
00:21:10 Sprecher 1
Inwiefern wird das Thema Vertrauen während der Produktentwicklung berücksichtigt?
00:21:19 Sprecher 2
Das Vertrauensthema habe ich recht häufig, wenn ich das Produkt präsentiere. Wenn mir Fragen gestellt werden wie: Wie lange dauert denn die Übersetzung und erkennt er auch wirklich die Sprache? Wechselt er die Sprache? Dann merke ich, es ist eine Frage in den Funktionen. Fragst du mich gerade das Feature Set ab oder fragst du mich, wie gut der funktioniert und wie gut ist da dieses Vertrauen? Ich glaube, das liegt sehr, sehr nah beieinander, weil das ist auch so, wenn du Mitarbeiter hast. Dann fragst du auch nach den Skills und misst ein bisschen daran, vertraust du ihm, traust du ihm das zu, ob er dafür geeignet ist. Das erfährst du anhand was kann der denn. Deswegen sind diese Fragen nach den Funktionen häufig und enden darin zu überlegen, vertraue ich dem Teil.
00:22:33 Sprecher 1
Werden spezielle Maßnahmen ergriffen, um das Vertrauen bei den Nutzern aufzubauen?
00:22:39 Sprecher 2
Ja, Success Stories sind, glaube ich, das wirksamste Tool. Dieses zeigen, dass andere es auch geschafft haben zu vertrauen und dass die glücklich sind. Wir haben diese „Danke!“-Kampagne und ich glaube die hat einen großen Impact auf das Vertrauen. Das könnte mein Kamerad sein, das könnte der Leitstellendisponent sein, der jetzt morgen hier arbeitet und zu uns wechselt. Der vertraut dem, also tue ich es auch. Ich vertraue nicht der WTG, weil die wollen das verkaufen, sondern ich vertraue den Leuten, die auf meinem Level sind und wenn die sagen, das ist ein geiles Ding, dann vertraue ich dem auch, deren Meinung ist mir wichtiger.
00:23:28 Sprecher 1
Also die Kommunikation darüber dann auch wieder?
00:23:32 Sprecher 2
Ja und ErfahrungsträgerInnen.
00:23:37 Sprecher 1
Das waren alle meine Fragen, außer du hast noch was, was du möchtest?