A Microsoft afirma ter feito um avanço significativo na tecnologia de reconhecimento de voz, que em breve tornará assistentes de inteligência artificial capazes de entender e transcrever conversas. Sua mais recente pesquisa sobre transcrição de palavras resultou em uma tecnologia tão eficaz quanto a capacidade dos seres humanos em reconhecer palavras como parte de um discurso livre.
Porém, não satisfeita, a Microsoft quer dar um passo além - tornar a inteligência artificial melhor que humanos para entender palavras e transcrevê-las. A nova tecnologia compreende uma conversa com uma taxa de erro de apenas 5,9%. Isso é "quase igual" às pessoas que foram convidadas a transcrever a mesma conversa. A taxa de erro registrada pelo software de Redmond é menor do que o Switchboard, que é o padrão da indústria.
Este marco significa que, pela primeira vez, um computador pode reconhecer as palavras dentro do contexto de uma conversa, assim como uma pessoa faria. Com isso, a equipe supera uma meta estipulada menos de um ano atrás. Xuedong Huang, cientista fala-chefe da empresa, disse que "esta é uma conquista histórica".
Essas pesquisas e seus avanços serão usados para melhorar as ferramentas da Microsoft que usam o reconhecimento de voz, incluindo Xbox e Cortana. Harry Shum, vice-presidente executivo do grupo de inteligência artificial e pesquisa da empresa, conta que os resultados superam as expectativas de anos atrás. "Até cinco anos atrás, eu não teria pensado que poderia conseguir isso. Eu não teria pensado que seria possível", disse.
Isso fará com que a Cortana seja mais poderosa, tornando possível uma assistente verdadeiramente inteligentePara atingir a marca de paridade humana, a equipe usou o Computational Network Toolkit, da Microsoft, um sistema para a aprendizagem profunda (deep learning) que os pesquisadores têm disponibilizado no GitHub através de uma licença de código aberto.
Mas apesar dos grandes avanços nos últimos anos no reconhecimento de fala, os pesquisadores alertam que ainda há muito trabalho a ser feito. Os pesquisadores estão trabalhando em maneiras de se certificar de que o reconhecimento de voz funciona bem em situações da vida real. Isso inclui lugares onde há uma grande quantidade de ruído ao fundo, como em uma festa, por exemplo.
Eles também vão se concentrar em melhores maneiras de ajudar a tecnologia a atribuir nomes individuais aos interlocutores quando várias pessoas estão falando, e em certificar-se de que ela funciona bem com uma grande variedade de vozes, independentemente da idade, o sotaque ou habilidade.
A longo prazo, os pesquisadores vão se concentrar em maneiras de ensinar os computadores não apenas a transcrever o que as pessoas estão falando, mas também compreender as palavras que estão sendo ditas. Isso daria à tecnologia a capacidade de responder a perguntas ou agir com base no que os usuários dizem.
Link original: http://www.tudocelular.com/tech/noticias/n80747/cortana-inteligencia-artificial-transcricao.html
Nenhum comentário:
Postar um comentário