Um artigo interessante que encontrei foi sobre transcrição de aúdio em português. Embora os melhores resultados sejam obtidos com o Google Speech, chamou-me a atenção que existe uma solução de código aberto,
Vosk. Ela utiliza o mecanismo de reconhecimento de fala Kaldi, para o qual existe modelos prontos para português e um modelo em construção para
português do Brasil. Quem sabe um dia realizamos o sonho de ter um assistente pessoal de código aberto que fala português (se cuida, Alexa!).