a tecnologia Texto para fala em estilo espontâneo, desenvolvido por Laboratório de Inteligência Artificial da Xiaomi na China, é uma das últimas fronteiras quando se trata de reconhecimento de voz e uso de dispositivos via voz. O projeto que nascido dentro do laboratório leva o nome de "Possuir minha voz". Permite que os destinatários que infelizmente sofrem de distúrbios da fala ter vozes únicas e personalizadas para se comunicar com outras pessoas. Vamos ver em detalhes o que é e desde quando a empresa chinesa está trabalhando nisso.
A Xiaomi revelou sua mais recente aplicação de algoritmos avançados e tecnologia de fala autodesenvolvida que ajuda pessoas com distúrbios da fala
Xiaomi se preocupa com as pessoas e busca atender suas diferentes necessidades por meio da inovação tecnológica. Nos últimos anos, a marca chinesa descobriu o desejo de muitos usuários com distúrbios de linguagem de possui sua própria voz, mesmo único, para ser usado na comunicação diária. Por esse motivo, a Xiaomi montou a equipe do projeto "Possuir minha voz". Zhu Xi, coordenador do Comitê de Tecnologia do Tech for Good da Xiaomi, disse:
Estamos entusiasmados em explorar os múltiplos valores que a inovação tecnológica nos oferece, como responder às solicitações dos usuários para identidade pessoal e construção de identidade
Para gerar a voz mais adequada e personalizada para o usuário com deficiência de fala, a equipe do projeto Xiaomi recrutou mais de 200 voluntários dentro para dar a sua voz. O algoritmo de correspondência de impressão de voz foi usado para comparar as características das vozes doadas pelos voluntários com as da voz do destinatário. Por meio dessa abordagem, foi encontrou a voz mais adequada como som de referência voz básica para o destinatário.
Veja também: Mi Band 7 sai com muita data e preço | foto
Mais tarde, os estudiosos usaram a tecnologia de síntese de fala de estilo espontâneo para treinar o modelo de inteligência artificial. Dessa forma, um ritmo e uma entonação naturais capazes de serem adicionados gradativamente a essa nova voz expressar com sinceridade a emoção e o tom de um ser humano.
Zhu Xi acrescentou:
Se percebermos e atendermos às necessidades dos grupos minoritários em um estágio inicial, o processo de disseminação da tecnologia poderá ser bastante reduzido. Isso permite que os benefícios das novas tecnologias se tornem imediatamente acessíveis a usuários com necessidades especiais
A espinha dorsal deste projeto é um grupo de especialistas em tecnologia de voz por Xiaomi AI Lab. De 2017 publicaram 37 artigos nesse sentido e estiveram presentes em círculos importantes como oConferência Internacional sobre Acústica, Fala e Processamento de Sinais (ICASP). O sucesso de "Possuir minha voz”Depende principalmente do estilo espontâneo da tecnologia Text-To-Speech que eles desenvolveram. O estilo espontâneo da tecnologia Text-To-Speech essencialmente faz com que a voz sintetizada pareça um ser humano real em sua entonação, pausa, velocidade e outras características. Isso substitui a sensação monótona e não natural da voz eletrônica por uma mais natural.