Publicité
Technopop

Siri aime mieux les hommes

11-10-2019

Photo: iStock

Les assistants vocaux sont surtout performants auprès d’une clientèle: les hommes. Est-ce un problème purement technique ou culturel?

La popularité des systèmes à commande vocale comme Siri et Alexa ne se dément pas : ce marché vaut 40 milliards de dollars américains ! Mais lorsqu’on y regarde de plus près, on se rend compte que ces assistants sont surtout performants pour une portion de la population. Vous l’aurez deviné, ceux qui les conçoivent : les hommes.

En mars 2018, Delip Rao, vice-président à la recherche de la Fondation IA, expliquait que, historiquement, les systèmes de reconnaissance vocale ont toujours moins bien décrypté les voix féminines que les voix masculines. Déjà, en 2017, des chercheurs américains le constataient : sur YouTube, la génération automatique de sous-titres se révélait moins précise pour les voix de femmes (et celles avec un accent écossais !).

La reconnaissance vocale est désormais répandue dans nombre d’applications. En voiture, on peut demander que joue de la musique. Dans les centres d’appels, un tel système est souvent requis pour comprendre à quel service le client veut accéder. Même chose pour les applications d’apprentissage de langues, qui l’utilisent pour corriger une mauvaise prononciation. Une étude de Deloitte prévoit que l’industrie des assistants vocaux à domicile atteindra 250 millions d’unités d’ici la fin de l’année 2019 à travers le monde.

L’intelligence artificielle et sa capacité à apprendre sont basées sur des jeux de données. Plus l’on a de données pour nourrir l’algorithme, plus le résultat est pertinent. Or, force est de constater qu’on n’a pas fourni assez de voix diversifiées à la machine. Certains plaident que ces voix sont peu disponibles, d’autres affirment que personne n’a pensé à inclure ces voix.

Il y aurait peut-être une explication purement technique, selon l’experte en mégadonnées et linguiste Rachael Tatman, qui travaille chez Kaggle, une plateforme de compétitions en science des données. Les femmes ont généralement des voix plus aiguës et soufflées, ce qui se traduit par un signal acoustique moins fort. Ce sont des voix plus à risque d’être noyées dans le bruit ambiant et donc d’être mal comprises.

Pour contrer ce problème, on conseille aux utilisateurs de parler plus fort, de parler davantage « en direction de l’appareil », de détacher leurs mots. Bref, on leur demande de s’adapter au système. Pourtant, le but d’une machine est d’être au service de l’humain et non l’inverse. Google affirme que son système de reconnaissance du langage humain est fiable à 95 % ; mais de quels humains parle-t-on au juste ?

Publicité

À lire aussi

Technopop

IA: À l’école du bien et du mal

Des armes autonomes qui ciblent un ennemi et le combattent sans intervention humaine' C'est possible.
Catherine Mathys 04-09-2017
Technopop

Technopop: Le réveil du géant Microsoft

Il y a quelques années, Microsoft était perçu comme un géant déclin. Aujourd'hui, il revient en force. Quel est le secret de sa réussite?
Chloé Freslon 17-01-2019
Technopop

Ouvre grand les yeux, je te dirai qui tu es

Vous n'en pouvez plus des mots de passe à retenir et à changer périodiquement. Ça tombe bien, l'authentification par la biométrie gagne en popularité.
Catherine Mathys 29-06-2017