Au motif de ce qu'il faut améliorer l'IA, des tiers écoutent ce que vous dites à Google Home.

IceCream · le 13 juillet 2019

Google Home est une famille d’enceintes connectées à Internet que la firme de Mountain View associe à un programme informatique qui leur confère de « l’intelligence. » Dans le jargon du milieu, on parle d’assistant personnel intelligent et, du côté de la firme de Mountain View, c’est l’application Google Assistant que l’on retrouve aussi sur les smartphones qui officie.

Dans le principe, l’assistant personnel associé à un appareil (enceinte connectée, smartphone) est conçu pour recueillir les commandes vocales émises par un utilisateur. Ces dernières sont transmises à un serveur distant qui les analyse et donne suite à la requête que l’utilisateur a formulée. Le processus d’enregistrement est lancé par une commande vocale dédiée, ce qui suppose que sans elle rien ne se passe.

La Fondation de radio-télévision néerlandaise a obtenu une dizaine de tels enregistrements d’un collaborateur de Google – un employé d’un sous-traitant de la firme de Mountain View – qui, pour faire montre de crédibilité, a présenté son contrat de travail. L’organisme de la radiodiffusion flamande VRT est, par le même biais, rentré en possession d’un millier de contenus audios.

Dans ses conditions d’utilisateur, la firme de Mountain View n’est pas explicite à ce propos, mais ce qu’il faut bien souligner certains enregistrements sont passés en revue par des opérateurs humains. Le collaborateur de Google qui a tenu a resté sous anonymat l’a fait savoir. « Il est important que les gens se rendent compte que des tiers écoutent ces contenus », dit-il.

Ce dernier reçoit de Google quelques centimes par enregistrement pour écrire ce qu’il entend. « Sur les extraits, vous pouvez entendre comment des gens demandent à Google Home de régler l'alarme ou de vérifier les heures d'ouverture d'un magasin. D'autres demandent à Google de jouer leur musique préférée ou posent une question ludique pour tester l'appareil. Mais selon l'employé de Google, il lui arrive parfois d'entendre des commandes vocales très personnelles, par exemple des hommes qui demandent à Google de chercher des contenus pornographiques.

L’employé rapporte qu’il arrive aussi que les audios n’aient rien à voir avec des commandes vocales destinées aux système de Google. Il dit avoir écouté une douzaine d’échanges du type querelles ou conversations intimes. « Je me souviens d'un long extrait dans lequel j'ai senti qu'il y avait de la violence physique, dans lequel quelqu'un était dans le besoin, avec beaucoup de bruits de fond », rapporte la Fondation de radio-télévision néerlandaise.

La firme de Montain View s’appuie sur des tiers comme celui-ci de part le monde pour, dit-t-elle, améliorer son assistant personnel.

« Nous travaillons avec des experts en langues du monde entier pour améliorer nos technologies de traitement de la parole. Nous nous appuyons sur des transcriptions faites à partir d'un petit nombre de clips audio. Ce travail est crucial pour le développement de la technologie qui rend possible des produits tels que l'assistant Google. Les experts en langues ne passent en revue qu'environ 0,2 % de tous les clips audio qui ne sonte pas liés à des données personnelles. Nous avons récemment appris que l'un de ces experts en langue aurait violé notre politique de sécurité des données en divulguant des clips audio en néerlandais. Nous enquêtons de façon active sur cette affaire et lorsque nous constatons une violation de notre politique, nous prenons des mesures rapides qui peuvent aller jusqu'à la résiliation de notre contrat avec le partenaire », a déclaré Google en réponse aux publications liées à ces développements.

Ces derniers ne sont pas sans faire penser à ceux qui concernent un concurrent direct de la firme de Mountain View dans la filière des assistants personnels vocaux – Amazon. Il y a peu, le géant mondial du commerce en ligne a confirmé qu’il conserve les enregistrements vocaux obtenus via Alexa tant que les utilisateurs ne les suppriment pas. L’entreprise constitue ainsi une base de données de contenus audios dans laquelle ses employés peuvent puiser. Derrière, il y a un travail d’écoute, de transcription et d’annotation qui est fait par ces derniers.

Comme Google, Amazon a indiqué que ces employés ne passent en revue qu’un très faible échantillon d’enregistrements vocaux Alexa. En sus, l’entreprise a fait savoir que ces employés n’ont pas directement accès aux informations permettant d’identifier la personne ou le compte dans le cadre de ce flux de travail. Amazon se veut claire sur ceci que les opérations de traitement de données sont menées avec le terme confidentialité comme maître mot.

« Nous prenons au sérieux la sécurité et la confidentialité des informations personnelles de nos clients. Nous n'annotons qu'un nombre extrêmement faible d'interactions provenant d'un ensemble aléatoire de clients afin d'améliorer l’expérience de nos clients. Par exemple, ces informations nous aident à former nos systèmes de reconnaissance vocale et de compréhension du langage naturel, afin qu'Alexa puisse mieux comprendre vos demandes, ou nous assurer que le service fonctionne au mieux pour tout le monde. Nous mettons en œuvre des garanties techniques et opérationnelles strictes et avons une politique de tolérance zéro envers les abus sur notre système. Dans ce cadre, les employés n'ont pas d'accès direct à des informations qui leur permettraient d'identifier une personne ou un compte. Nous traitons toutes les informations avec la plus grande confidentialité, utilisons l'authentification multifactorielle pour restreindre l'accès, le cryptage du service et les audits de notre environnement de contrôle pour le protéger, et les clients peuvent également supprimer leurs interactions vocales avec Alexa à tout moment », a répondu l’entreprise.

Source : Fondation de radio-télévision néerlandaise .

mecano91 · le 26 août 2019

Il y a toujours eu des interventions humaines pour corriger se que l'informatique ne reconnaît pas comme avec les chèque bancaire avant les coordonnées bancaires codées magnétiquement et les automates si la machine ne reconnaissait pas c'est des intervenants qui les Corrigaient , pour le courrier également quant les machines de tri n'arrivent pas à lire

Mais aussi nous même sur Internet en remplissant les CAPTCHA qui sont souvent des images que la reconnaissance auto n'a pas reconnu et que l'on corrige donc bénévolement [emoji12]

Envoyé de mon MI 9 en utilisant Tapatalk

Connexion

LaraGeek

Au motif de ce qu'il faut améliorer l'IA, des tiers écoutent ce que vous dites à Google Home.

Messages recommandés

IceCream

Lien vers le commentaire

Partager sur d’autres sites

mecano91

Lien vers le commentaire

Partager sur d’autres sites

Parcourir

Activité