La reconnaissance vocale pour les langues parlées en Suisse

Etre capable de retranscrire les langues parlées en Suisse, notamment le suisse allemand, telle est la mission de la start-up valaisanne recapp IT, qui a développé un système de reconnaissance vocale pour transformer des discussions en textes. Innosuisse soutient la start-up à différents niveaux et l’a notamment soutenue dans la commercialisation de ses produits.

Retranscrire à la main de longs procès-verbaux de réunions est parfois un casse-tête. Mais grâce à de nouvelles technologies, ce processus peut aujourd’hui être entièrement automatisé. En Suisse, la start-up recapp IT AG surfe sur cette vague depuis plusieurs années, au point d’avoir créé un outil de reconnaissance vocale capable de retranscrire notamment tous les dialectes suisses alémaniques !

recapp IT AG est née de la frustration ressentie par David Imseng alors qu’il menait des recherches sur la reconnaissance vocale à l’institut de recherche Idiap à Martigny. «A l’époque, je me sentais coincé dans l’univers de la recherche. Je ne faisais que publier des rapports et construire des modèles qui ne voyaient pas le jour concrètement». C’est alors qu’en 2013, le jeune ingénieur construit «pour s’amuser» le premier système capable de retranscrire le dialecte alémanique valaisan, considéré comme l’un des plus difficiles à comprendre. «Cette année-là, il n’existait pas encore de système capable de déchiffrer les différents dialectes parlés en Suisse d’où la nécessité d’agir», explique David Imseng.

Cette première expérience est un succès et en 2014, il cofonde, avec sa femme Erika, recapp IT. Aujourd’hui, la société basée à Viège en Valais, a considérablement développé sa technologie et compte parmi ses clients de nombreux parlements cantonaux, des médias, des étudiants et des particuliers. Grâce à l’intelligence artificielle, le système mis au point est capable de reconnaître les quatre langues nationales, de distinguer les différents dialectes alémaniques ainsi que l’anglais.

Différentes fonctions disponibles
Il suffit d’enregistrer les discussions verbales d’une séance ou d’une interview pour que le logiciel conçu par recapp IT puisse retranscrire les échanges. Cerise sur le gâteau, une segmentation claire des tours de paroles ainsi que la ponctuation et la mise en forme sont automatiquement intégrées au texte. L’outil permet, par ailleurs, de procéder à des recherches par mots-clés ou d’indexer des archives audio ou vidéo.

recapp-innosuisse

Innosuisse comme bras de levier
Pour le CEO, l’aide reçue à travers Innosuisse est « très importante». L’entreprise est soutenue à plusieurs niveaux. D’un côté, et pour encore améliorer sa technologie, la start-up mène actuellement un projet d’innovation en partenariat avec l’Idiap. «Ce projet nous permet de financer nos recherches, ce qui ne serait pas possible sans l’aide d’Innosuisse». De l’autre côté, recapp IT est suivi par un coach spécialisé dans le cadre du programme Start-up Coaching. «Ce suivi personnalisé permet d’éviter beaucoup d’erreurs commises par d’autres start-up à leurs débuts. En obtenant le certificat Innosuisse, nous avons par ailleurs gagné en crédibilité auprès des investisseurs.»

Encore plus loin
Pour fonctionner, la reconnaissance vocale utilise des techniques d'apprentissage automatique, telles que les réseaux neuronaux, afin d'apprendre de quoi est fait le langage. «Le système doit apprendre comment les sons que nous produisons à l'intérieur des mots sont façonnés et comment le langage est structuré. Pour "apprendre" à la machine ces deux caractéristiques, vous devez l'alimenter en données. Elle doit s’instruire à partir d'exemples. Elle réussira alors à déterminer qu’un mot est plus fréquent qu’un autre dans tel ou tel contexte. Elle l'apprendra parce qu'elle le "verra" plusieurs fois», explique Virginie Holm, linguiste informaticienne.

Pour cette spécialiste du langage informatique, nous ne sommes qu’au début du développement de la reconnaissance vocale. Selon elle, la technique a encore un fort potentiel d’évolution. «Je pense que la reconnaissance vocale n'est qu'une étape vers la compréhension même du langage. Les machines devront un jour être non seulement capables de retranscrire des mots mais aussi de comprendre leur signification et de retransmettre leur message intrinsèque. Il reste encore beaucoup à faire dans cette direction.» De quoi donc bien occuper recapp IT pour les années à venir.

Dernière modification 14.02.2022

Début de la page

recapp-virginie-david

Virginie Holm, linguiste informaticienne et David Imseng, CEO à recapp IT.  

https://www.innosuisse.ch/content/inno/fr/home/success-stories/activites-encouragement/start-up/recapp.html