Publicité
Technopop

Siri aime mieux les hommes

11-10-2019

Photo: iStock

Les assistants vocaux sont surtout performants auprès d’une clientèle: les hommes. Est-ce un problème purement technique ou culturel?

La popularité des systèmes à commande vocale comme Siri et Alexa ne se dément pas : ce marché vaut 40 milliards de dollars américains ! Mais lorsqu’on y regarde de plus près, on se rend compte que ces assistants sont surtout performants pour une portion de la population. Vous l’aurez deviné, ceux qui les conçoivent : les hommes.

En mars 2018, Delip Rao, vice-président à la recherche de la Fondation IA, expliquait que, historiquement, les systèmes de reconnaissance vocale ont toujours moins bien décrypté les voix féminines que les voix masculines. Déjà, en 2017, des chercheurs américains le constataient : sur YouTube, la génération automatique de sous-titres se révélait moins précise pour les voix de femmes (et celles avec un accent écossais !).

La reconnaissance vocale est désormais répandue dans nombre d’applications. En voiture, on peut demander que joue de la musique. Dans les centres d’appels, un tel système est souvent requis pour comprendre à quel service le client veut accéder. Même chose pour les applications d’apprentissage de langues, qui l’utilisent pour corriger une mauvaise prononciation. Une étude de Deloitte prévoit que l’industrie des assistants vocaux à domicile atteindra 250 millions d’unités d’ici la fin de l’année 2019 à travers le monde.

L’intelligence artificielle et sa capacité à apprendre sont basées sur des jeux de données. Plus l’on a de données pour nourrir l’algorithme, plus le résultat est pertinent. Or, force est de constater qu’on n’a pas fourni assez de voix diversifiées à la machine. Certains plaident que ces voix sont peu disponibles, d’autres affirment que personne n’a pensé à inclure ces voix.

Il y aurait peut-être une explication purement technique, selon l’experte en mégadonnées et linguiste Rachael Tatman, qui travaille chez Kaggle, une plateforme de compétitions en science des données. Les femmes ont généralement des voix plus aiguës et soufflées, ce qui se traduit par un signal acoustique moins fort. Ce sont des voix plus à risque d’être noyées dans le bruit ambiant et donc d’être mal comprises.

Pour contrer ce problème, on conseille aux utilisateurs de parler plus fort, de parler davantage « en direction de l’appareil », de détacher leurs mots. Bref, on leur demande de s’adapter au système. Pourtant, le but d’une machine est d’être au service de l’humain et non l’inverse. Google affirme que son système de reconnaissance du langage humain est fiable à 95 % ; mais de quels humains parle-t-on au juste ?

Publicité

À lire aussi

Technopop

Les CV sous l’oeil de l’IA

Si on n'y prend garde l'IA perpétue nos biais dans le recrutement de nouveaux employés. Mais pourrait-elle aussi nous en sauver ?
Chloé Freslon 26-08-2019
Technopop

À mort, le télécopieur?

Bien qu'il n'ait pas évolué depuis 30 ans, le fax est encore largement utilisé.
Catherine Mathys 11-10-2018
Technopop

Courriel, je t’aime, je te hais

Cessons de nous leurrer. Vider la boîte de réception entièrement est une utopie. Certains téméraires y parviennent parfois, mais ce n’est qu’une question d’heures avant que le compteur affiche à nouveau des dizaines de courriels non lus.
Catherine Mathys 15-02-2018