September 20, 2020

 

A l’occasion de la Conférence internationale sur le machine learning (ICML), qui s’est tenue du 12 au 18 juillet, une équipe de recherche de Facebook a présenté un modèle d’intelligence artificielle capable de détecter 5 voix différentes sur un bruit de fond.

 

Le centre de recherche Facebook AI de Tel Aviv annonce avoir mis au point un modèle de traitement du signal capable d’isoler jusqu’à 5 voix différentes à partir d’un seul micro. Son système permettrait, selon le géant américain, d’améliorer le rapport signal sur bruit de plus de 1,5 dB par rapport aux technologies de pointe actuellement disponibles. Les chercheurs expliquent avoir bâti cette solution en s’appuyant sur une nouvelle architecture de réseau de neurones, fonctionnant sous forme d’onde acoustique brute. Le système testé en laboratoire serait en mesure de détecter par lui-même le nombre de locuteurs et de les séparer du bruit de fond. Parmi les applications possibles à terme, Facebook évoque des progrès dans la qualité des communications et messages téléphoniques, des performances des assistants vocaux, mais aussi des aides auditives. On sait depuis des années que les fabricants d’oreillettes et de smartphones développent des technologies directement liées à l’amélioration de l’audition. Avec cette recherche Facebook, les Gafam (comme d’autres acteurs extérieurs au secteur) mettent un pied de plus dans le développement du machine learning en audio.