[Born-IT] DSGVO: Google hat Sprachaufzeichnungen weiter gegeben

Google hat gerade eingestanden, dass vertrauliche Sprachaufzeichnungen eines Sprachassistenten von einem beauftragten Sprachanalysten in den Niederlanden unbefugt weiter gegeben wurden. Das dürfte ein Verstoß gegen die Datenschutzgrundverordnung (DSGVO) sein, ist aber auf jeden Fall kritisch zu sehen und zeigt, wie




Autor: Günter Born
 
Tipp: Man kann die KI nur mit menschlichen Input verbessern. Woher soll die KI sonst wissen ob sie etwas richtig versteht? Von einer anderen KI?
ich hab den Job als Student mal gemacht, gibt gut Geld. Man sitzt am Computer und transkribiert tausende Sprachfetzen. Das ist schon Jahre her und war bevor es Alexa gab. Ohne das Menschen Stichproben anhören und so "Ground Truth" erzeugen geht es jedenfalls nicht.
 
> Tipp: Man kann die KI nur mit menschlichen Input verbessern. Woher soll die KI sonst wissen ob sie etwas richtig versteht? Von einer anderen KI?
mit etwas Starthilfe geht das schon:
 
Das liegt allerdings daran, dass es sich dabei um ein Spiel handelt und damit extern der Erfolg ermittelt werden kann aka hat die KI gewonnen oder verloren.
Das geht bei maschineller Erkennung nicht, die KI kann nicht wissen, ob sie jetzt richtg oder schlecht 'geraten' hat.
 
Das die Daten "vertrauenswürdigen" Personen und unternehmen weiter gegeben werden steht auch in der Datenschutzerklärung - das die Person nun was nicht vereinbartes gemacht hat ist zu klären. Das das ein Problem im Sinne der DSGVO ist bezweifle ich und das die Erkennung nicht von ganz alleine Lerne ist ebenfalls klar... und damit keine Überraschung.
Wer das ding kauft hat ja auch hoffentlich nie erwartet das die Sprache das Haus nicht verlässt.

Was ich vor ein paar Monaten gelesen habe geht das offline inzwischen in den google labs recht gut - das heißt in 1.2 jahren könnte die Erkennung auch ohne Internet gehen - dann schaue ich mir sowas auch mal an,
 
@BurnerR:

Warum werden dann nicht einfach freiwillige Probanden eingesetzt, die entsprechende Geräte zur Verfügung bekommen?
Zu aufwendig bzw. müsste man vermutlich mit tausenden Probanden machen. Und dann weißt du noch nicht 100%, ob die nicht unbewusst deutlicher sprechen, weil sie ja wissen, dass ihre Stimme analysiert wird.
 
> Das liegt allerdings daran, dass es sich dabei um ein Spiel handelt und damit extern der Erfolg ermittelt werden kann aka hat die KI gewonnen oder verloren.
> Das geht bei maschineller Erkennung nicht, die KI kann nicht wissen, ob sie jetzt richtg oder schlecht 'geraten' hat.
man sucht Auswege mit "syntetischen Daten":

"... entwickelt sich gerade eine Industrie für synthetische KI-Trainingsdaten. Mit dabei sind auffällig viele Anbieter von Computerspielen [...] Die Synergien sind groß: Das Verhalten von Personen oder die Bewegung von Autos ist in Computerspielen bereits enthalten, man kann sie direkt zum Training von KI nutzen. "
Schon interessant, frage mich warum jetzt erst, das Potential der Game-Coder in die "normale" Wirtschaft zu übernehmen muss doch gigantisch sein, wenn man bedenkt was es da für krude "Software" in manchen Branchen gibt.
 
Von den mehr als tausend Auszügen von Sprachaufzeichnungen waren 153 Gespräche dabei, die nie hätten aufgezeichnet werden dürfen. Dort wurde eindeutig nie der Befehl ‘Okay Google’ gegeben.

false positives :rolleyes:

Keyword spotting ist eine lokale Fähigkeit von Human Voice Interface Devices.
 
Zurück
Oben