[Born-IT] DSGVO: Google hat Sprachaufzeichnungen weiter gegeben

BurnerR · 12 Juli 2019

Tipp: Man kann die KI nur mit menschlichen Input verbessern. Woher soll die KI sonst wissen ob sie etwas richtig versteht? Von einer anderen KI?
ich hab den Job als Student mal gemacht, gibt gut Geld. Man sitzt am Computer und transkribiert tausende Sprachfetzen. Das ist schon Jahre her und war bevor es Alexa gab. Ohne das Menschen Stichproben anhören und so "Ground Truth" erzeugen geht es jedenfalls nicht.

Trolling Stone · 12 Juli 2019

@BurnerR:

Warum werden dann nicht einfach freiwillige Probanden eingesetzt, die entsprechende Geräte zur Verfügung bekommen?

obedi · 12 Juli 2019

> Tipp: Man kann die KI nur mit menschlichen Input verbessern. Woher soll die KI sonst wissen ob sie etwas richtig versteht? Von einer anderen KI?
mit etwas Starthilfe geht das schon:

You do not have permission to view link please Anmelden or Registrieren

BurnerR · 13 Juli 2019

Das liegt allerdings daran, dass es sich dabei um ein Spiel handelt und damit extern der Erfolg ermittelt werden kann aka hat die KI gewonnen oder verloren.
Das geht bei maschineller Erkennung nicht, die KI kann nicht wissen, ob sie jetzt richtg oder schlecht 'geraten' hat.

drfuture · 13 Juli 2019

Das die Daten "vertrauenswürdigen" Personen und unternehmen weiter gegeben werden steht auch in der Datenschutzerklärung - das die Person nun was nicht vereinbartes gemacht hat ist zu klären. Das das ein Problem im Sinne der DSGVO ist bezweifle ich und das die Erkennung nicht von ganz alleine Lerne ist ebenfalls klar... und damit keine Überraschung.
Wer das ding kauft hat ja auch hoffentlich nie erwartet das die Sprache das Haus nicht verlässt.

Was ich vor ein paar Monaten gelesen habe geht das offline inzwischen in den google labs recht gut - das heißt in 1.2 jahren könnte die Erkennung auch ohne Internet gehen - dann schaue ich mir sowas auch mal an,

BurnerR · 13 Juli 2019

Trolling Stone schrieb:
@BurnerR:

Warum werden dann nicht einfach freiwillige Probanden eingesetzt, die entsprechende Geräte zur Verfügung bekommen?

Zu aufwendig bzw. müsste man vermutlich mit tausenden Probanden machen. Und dann weißt du noch nicht 100%, ob die nicht unbewusst deutlicher sprechen, weil sie ja wissen, dass ihre Stimme analysiert wird.

obedi · 15 Juli 2019

> Das liegt allerdings daran, dass es sich dabei um ein Spiel handelt und damit extern der Erfolg ermittelt werden kann aka hat die KI gewonnen oder verloren.
> Das geht bei maschineller Erkennung nicht, die KI kann nicht wissen, ob sie jetzt richtg oder schlecht 'geraten' hat.
man sucht Auswege mit "syntetischen Daten":

You do not have permission to view link please Anmelden or Registrieren

"... entwickelt sich gerade eine Industrie für synthetische KI-Trainingsdaten. Mit dabei sind auffällig viele Anbieter von Computerspielen [...] Die Synergien sind groß: Das Verhalten von Personen oder die Bewegung von Autos ist in Computerspielen bereits enthalten, man kann sie direkt zum Training von KI nutzen. "
Schon interessant, frage mich warum jetzt erst, das Potential der Game-Coder in die "normale" Wirtschaft zu übernehmen muss doch gigantisch sein, wenn man bedenkt was es da für krude "Software" in manchen Branchen gibt.

Shodan · 16 Juli 2019

Born-IT schrieb:
Von den mehr als tausend Auszügen von Sprachaufzeichnungen waren 153 Gespräche dabei, die nie hätten aufgezeichnet werden dürfen. Dort wurde eindeutig nie der Befehl ‘Okay Google’ gegeben.

false positives :rolleyes:

Keyword spotting ist eine lokale Fähigkeit von Human Voice Interface Devices.

[Born-IT] DSGVO: Google hat Sprachaufzeichnungen weiter gegeben

Weitere

BurnerR

Bot #0384479

Trolling Stone

Arrrr

obedi

NGBler

BurnerR

Bot #0384479

drfuture

Zeitreisender

BurnerR

Bot #0384479

obedi

NGBler

Shodan

runs on biochips