$type=slider$snippet=hide$cate=0

Reconhecimento de voz que funciona

SHARE:

Usei programas de reconhecimento desde os anos 1990. Agora, mais recentemente, estive em contato com o Siri do iphone e a uma solução do Goo...

Usei programas de reconhecimento desde os anos 1990. Agora, mais recentemente, estive em contato com o Siri do iphone e a uma solução do Google para fazer pesquisas pela voz usando a apenas a fala. Todavia, com o LG G2 eu tive a minha melhor experiência com essa tecnologia.



Voltamos para 1990, nessa época o Via Voice da IBM era o que havia de mais popular e eficaz em termos reconhecimento de voz (Via Voice foi introduzido em 1997, e em 1999 havia uma versão gratuita do programa). Para funcionar, Você tinha que treinar o software durante 40 minutos a uma hora. Então, você começava a fazer ditados para comandar o computador usando comando de voz como "abra o Word". Era um treino individualizado, ou seja, se um segundo usuário também usasse o Via Voice seria necessário também se submeter a uma torturante sessão de treinamento do software. Apesar de enjoado funcionava razoavelmente bem. Tinha um percentual de acerto semelhante ao que você teria digitando seus textos. mas não era muito prático e eu acabei não usando. Mas ficou a lembrança de uma interface diferente para entrar dados no computador.

Voice recognition (reconhecimento de voz) se refere ao reconhecimento de "quem" está falando, enquanto acontecendo a fala. Aplicado nos sistemas que necessitam de treino para traduzir a fala em texto e para sistemas de identificação de segurança. Speech recognition (reconhecimento de fala) é o termo que se refere ao processo automático de traduzir o que é dito em texto. Em alguns smart

O tempo passou e vieram os smartphones, que funcionam como um assistente pessoal com um crescente poder de processamento. Versões melhoradas do Via Voice foram se sucedendo, junto com o hardware necessário para seu uso, inaugurando uma nova fase de seu desenvolvimento em 2005, quando ele deixou de ser da IBM passando para ScanSoft. Surgiu a busca por voz do Google e o Siri do iPhone 4S, que permite responder questões e até transferir compromissos da agenda do usuário, de uma data para outra, tudo meio da fala.

Também já conseguia pedir a "programação de cinema em Brasília" sem digitar nada na busca por voz do Google no Galaxy S II. Apesar disso, outras consultas mais complexas eram simplesmente decepcionantes.

Deixei de lado essa tecnologia durante um tempo, sempre na esperança de que, em algum ponto no futuro dialogaríamos com os computadores em uma perfeita simbiose do reconhecimento de voz, fala e inteligência artificial. Onde essa última viabilizaria o uso das outras atividades, enquanto aquelas, permitiriam que a IA fosse continuamente alimentada e aprimorada.

Ainda espero fazer uma reunião de brainstorm com imagens, textos e links relacionados surgindo enquanto minha equipe dialoga sobre algum tema relevante. Mas não tenho pressa.

Incorporei a busca por voz no Blog Brasil Acadêmico durante um tempo, cheguei a usar um serviço de alguma operadora de telefonia, TV por assinatura, ou algo semelhante, onde dizia alguma palavra chave do menu de opções para selecionar o item (algo do tipo: "Diga 'futebol' para assinar o campeonato brasileiro pay per view"). Mas de fato não via nenhum grande avanço nessa área muito "palpável" para o usuário comum.

Mas o Google parece ter feitos avanços significativos nessa área, tenho que testemunhar que fiquei bem impressionado com a facilidade de anotar coisa a fazer na lista de tarefas de meu último smartphone Android.

Registros do tipo "reconhecer assinatura no cartório" ou "chamar seguro residencial para consertar torneira" funcionaram bem o que possibilitou uma agilidade inédita no planejamento de tarefas simples.

Ainda havia alguma confusão entre o "do" e o "no", mas, nesse caso, nem fazia tanta diferença. Para um lembrete do tipo post-it tanto faz estar escrito "pegar talão de cheques no banco" ou "pegar talão de cheques DO banco". E após encher minha "to-do list" das férias, percebi estar diante de uma forma de interação com grande potencial.

Resolvi escrever o post que você está lendo apenas ditando. Aqui apareceram os problemas. Embora tivesse com um roteiro mais ou menos delineado em mente, ainda me atrapalhava quando lembrava não estar certo de nomes e datas. E isso diminuía o ritmo e a clareza de minha fala.

Ditar um texto é bem diferente de dialogar ou mesmo de dar uma palestra. Especialmente sendo gravado.

Após algum tempo, o mecanismo da sua fala também começa a cansar, e a impostação de voz já não é a mesma. Destarte, notei que os erros se concentraram mais no final do texto.

Outra problema digno de observação, o app Blogger oficial da Google Inc. para Android parece não salvar as atualizações automaticamente, quando comparado com a versão web para desktop.

Assim, acabei perdendo a primeira versão desse texto.

Além disso, é necessário estar conectado com o Google durante o processo de reconhecimento e por algum motivo a ligação online com a empresa caiu durante a captura da fala.

Mesmo assim, foi muito bom pegar as ideias gerais do que pretendia escrever e editar. Surgia vez por outra alguns termos estranhos, e engraçados, como o meu "desde os anos 1990" que virou "10 dos anos 1990", porém, percebo uma melhora significativa no funcionamento do reconhecimento, especialmente se considerarmos não haver necessidade de treino do sistema (minha esposa também ficou admirada de sua fala ser reconhecida sem erros e sem treino) e em português do Brasil, o que é ainda mais admirável.

O vídeo a seguir mostra uma experiência usando o app Google Drive para Android, um G2 (com um processador de 2,26 GHz Snapdragon 800 Quad-Core da Qualcomm, que certamente faz diferença) e atrás do aparelho você vê o resultado saindo em um monitor também no Google Drive no browser, em um PC. Perceba que falando mais pausadamente o resultado tende a sair melhor.



Bem, vou finalizar esse post fazendo uma demonstração em tempo real de como está avançada a tecnologia de reconhecimento de voz, especialmente para o português do Brasil. Obrigado pela atenção. Agora vou passar para edição desse trecho.

COMMENTS

Nome

A divulgar,2,Abelha,3,acessibilidade,17,acessório,2,Acidente,38,Acidentes,2,Acústica,12,Adágios,1,Adestramento,5,Administração,5,adulto,1,Aerodinâmica,4,Aeronáutica,8,África,5,Agência Brasil,3,Agropecuária,1,AIDS,1,Alcoolismo,7,Alemanha,3,Alerta,1,Algoritmo,6,Alimento,1,Alzheimer,4,Amazon,1,Amazônia,3,Análise Combinatória,1,Anatomia,5,Android,2,Animação,40,Animais de Estimação,6,Animal,1,Antropologia,12,Apicultura,4,App,5,Apple,5,Apresentação,4,aquário,1,Argentina,4,Arqueologia,5,arquitetura,14,Arte,113,Astrobiologia,1,Astronomia,12,Ativismo,16,Áudio,3,Audio FX,2,Áustria,1,Autismo,2,Auto-ajuda,9,Automobilismo,14,Automóvel,9,aventura,3,Aviação,4,Aviônica,8,Bahia,1,Balonismo,3,Banco de Dados,3,Beber e Dirigir,1,biblioteconomia,2,Bicicleta,1,Biografia,11,Biologia,128,Biologia Marinha,15,bioquímica,4,Biotecnologia,16,Blog,25,Blogger,24,Boato,3,Bomba,1,borderô de desconto,1,Botânica,4,Brasil,18,Brasília,6,BRIC,1,Browser,9,Bugs,3,CAD,1,Calor,2,Câmera lenta,1,Campanha,35,câncer,4,cardiologia,12,carreira,2,Casemods,1,Caso Isabella Nardoni,1,Caso Snowden,1,Celebridades,6,celular,21,Células-Tronco,3,Cérebro,2,Charge,20,China,10,Cibercultura,2,Ciclovia,1,Cidadania,37,Ciência,131,Cinema,40,Clip,1,Cliparts,1,Cloud computing,4,Comédia,1,competência,1,Complemento de dois,1,Comportamento,213,Computação,62,Computação em grade,5,Computação forense,2,Computação Gráfica,106,Computação Móvel,1,Comunicação e Marketing,100,Concurso,1,Concurso Cultural de Natal,1,Concursos Público,2,Concursos Públicos,3,Conectômica,1,Conspiração,2,Consumidor,7,Consumismo,3,contabilidade,2,Contos,41,Copa do Mundo,26,Cordel,3,Coreia do Norte,1,Coreia do Sul,1,Corpo,2,Coruja,1,cosmética,2,Cosmologia,5,Criança,1,Crime,40,Crime Digital,6,crise,8,crise econômica,9,crônica,5,crônicas,5,Cronologia,1,CSS,3,Cuba,4,Culinária,8,Cultura,7,Curiosidades,111,custos fixo,1,custos variáveis,1,Dança,5,DAO,1,Darwin,8,Decoração,1,demência,1,Demografia,1,Denúncia,9,Dermatologia,6,Desastre Natural,12,Descoberta,1,desconto duplicatas,1,Desenho instrucional,2,Desenvolvimento de jogos,6,Design,16,Dia das Mães,1,Dia do professor,1,diabetes,5,Dicas,59,Didática,1,Dieta,3,diplomacia,2,Direito,143,Direito Eleitoral,1,Direito Internacional,27,Direito Tributário,1,Direitos Humanos,33,Disney,3,Distrito Federal,1,Documentário,37,Doutorado,1,download,2,Drogas,6,e-Book,1,e-governo,2,Ecologia,72,Economia,63,Editoração Eletrônica,1,Educação,192,Educação a Distância,86,educação física,16,Educação sexual,6,Efeitos Sonoros,4,Egiptologia,1,Eleições,18,Eleições 2014,12,Eletricidade,9,eletrônica,3,empreendedorismo,5,enciclopédia,1,endocrinologia,5,Enem,3,Energia,10,Energia Alternativa,11,Energia Nuclear,8,Engenharia,31,Engenharia Civil,4,Engenharia de materiais,11,Engenharia de Software,3,Engenharia Genética,20,Engenharia Mecânica,1,Enretenimento,1,Ensino a Distância,9,Ensino Superior,3,Entomologia,4,Entretenimento,23,Entrevista,55,Epidemiologia,15,Equador,1,Escândalo,4,Escritório,1,Espaço,53,Espanha,1,Espanhol,2,Espeleologia,1,Espetáculo,8,Espionagem,15,Esporte,37,Estação,1,Estágio,1,Estatísticas,25,estrutura de dados,1,Ética,12,EUA,12,Evento,20,Evolução,3,Exercícios físicos,2,Exobiologia,1,experiência,39,fábulas,2,Facebook,15,Farmacologia,7,Favo,1,Feminismo,1,Férias,1,Ferramentas,5,FIFA,2,Filantropia,4,Filmes,14,Filosofia,18,Firefox,1,Física,69,Física Quântica,2,Fisiologia,5,Fisioterapia,4,Flagrante,2,Flamengo,1,Folclore,3,Fome,1,Fonoaudiologia,6,Fotografia,30,Fotos em 360 graus,6,França,5,Francês,1,frases,2,Fraude,4,Freeware,42,Futebol,36,Futurologia,45,gadget,86,Gafe,1,Gastroenterologia,4,Gastronomia,2,Geek,1,Genética,27,Geofísica,1,Geografia,35,Geologia,7,Geometria,6,geopolítica,10,Geriatria,4,Gestão de Configuração,2,Gestão de Projetos,11,Gestão do conhecimento,5,Ginecologia,3,Glass,1,Google,69,Governo,3,GPS,1,Gradiente,1,gramática,10,Gravidez,1,Grécia,1,Grécia Antiga,1,Guerra,25,Guinness,1,H2,2,Haiti,3,hardware,29,História,125,HIV,1,homenagem,42,Horologia,1,HPV,1,HTML,6,Humor,192,Humor Negro,7,IBM,2,ICIJ,1,Idioma,29,IHC,8,ilo,29,ilusão,30,ilusionismo,5,Imagem 3D,16,Imagens,4,Imagine Cup,1,Império Romano,2,Imprensa,26,Impressora 3D,13,Incêndio,1,Inclusão digital,8,Índia,2,Índios,1,Infectologia,11,Infográfico,24,Informática,37,Inglaterra,1,Inglês,14,Inovação,120,Inteligência Artificial,23,interativo,1,Interface,149,Interfaces Hápticas,14,Internacional,21,Internacionalização da Amazônia,3,Internet,149,Inundação,2,Invenção,19,Inventos,6,iPad,1,IPEA,1,iphone,3,Irã,3,Iraque,1,Israel,6,Japão,2,Java,2,Java.,2,jogos,9,Jogos educativos,9,Jogos Olímpicos,10,Jornalismo,47,Justiça,4,Kinect,10,Le Monde Diplomatique Brasil,6,Letras,1,Lexicografia,1,Liderança,2,Life Hacking,17,Linguística,5,Literatura,36,Livro,30,Lógica,11,Logística,2,Lua,1,Maçonaria,4,Malásia,2,Malvinas,2,Malware,1,Mapa,37,Mapas,3,Marte,1,Mastologia,1,Matemática,45,Matemática Financeira,1,maternidade,1,Mecânica,6,Mecânica dos Fluidos,2,Mecatrônica,38,Medicina,358,Medicina Esportiva,1,Medicina Veterinária,4,Meio Ambiente,84,Mel,1,melanoma,1,Memória,4,memorização,2,Mente,4,Mercado de Trabalho,45,mercosul,1,Mestrado,1,meteorologia,9,Metodologia Científica,26,México,1,Microbiologia,4,Microsoft,10,Mídia Social,44,Militar,11,Mineralogia,1,Mistério,2,MIT,4,Mitologia,2,Mobilidade,1,Mobilidade Urbana,2,MonaVie,1,Montanhismo,1,Moodle,1,Mossad,1,Motivação,1,MSF,1,Mudança Climática,18,Mulher,3,Multimídia,13,museu,8,Música,67,MVC,1,Nanotecnologia,29,Nasa,13,Natação,1,Natal,16,Natureza,1,Negócios,16,Neurociência,44,Neurologia,63,Nordeste,2,Noruega,1,notícias,7,Novidades,18,Novo Enem,2,Números,1,Nutrição,43,Obama,1,Obesidade,9,Observatório da Imprensa,20,Obstetrícia,3,Oceanografia,7,odontologia,4,Offshore Leaks,2,oftalmologia,8,Olimpíadas,5,oncologia,30,ONU,8,Opinião,79,Óptica,15,Oracle,1,Oriente Médio,4,Orkut,2,Ornitologia,1,ortografia,3,Ortopedia,3,Ótica,7,Otorrinolaringologia,1,Paginadores,1,paleontologia,1,Paquistão,1,Pará,2,Paraguai,1,parkinson,2,Passeio virtual,1,Patinação,1,Pediatria,5,Pensamentos,1,performance,1,Periférico,1,Pesca,2,Pesquisa,147,Petição,1,Petrobrás,3,Petróleo,7,Photoshop,5,Pirataria,7,planilha de custo,1,Playstation 3,2,Plebiscito,2,Pneumologia,1,Podcast,4,Poesia,23,Poítica,1,Política,206,Portugal,4,português,14,Pós-graduação,1,prazo médio,1,Pré-sal,4,Prêmio Nobel,4,primatologia,1,privacidade,9,produtividade,3,professor Hamilton Alves,2,Programa Gratuito,4,Programação,36,Projeto Truco,2,Promoção,1,Propaganda,5,Psicanálise,1,Psicologia,202,Psicologia Animal,21,Psiquiatria,9,Pública,7,publicidade,17,Publieditorial,2,Quadrinhos,9,Quads,5,Qualidade,3,Qualidade de Vida,11,química,24,realidade aumentada,31,realidade diminuída,2,Realidade Virtual,18,Reconhecimento de imagem,10,Reconhecimento de voz,2,Recorde,1,Redação,1,redes,6,Referência,1,Referendo,1,Reforma Política,1,Relacionamento,1,Relações Internacionais,30,Religião,32,Responsabilidade Social,4,Retrospectiva,1,Rio 2016,3,Rio Grande do Norte,1,Rio Grande do Sul,1,robótica,61,Roda Viva,21,Roma,1,roteiro,1,RSA,1,Rússia,1,Samsung,1,Sanitarismo,4,Santa Catarina,1,São Paulo,2,Saúde,354,Savant,1,Segunda Guerra Mundial,16,Segurança,104,Segurança da Informação,50,Seleção Natural,2,serviço,1,Serviço Online,1,Sexologia,2,sexualidade,5,Show,7,SIGGRAPH,1,Simulação,24,Sismologia,2,Sistema operacional,3,Sistemas de Numeração,1,Sites de Busca,11,Sociedade,4,Sociologia,33,Software,25,Software Livre,17,Sol,2,Sono,2,Sony,2,SOPA,2,Suécia,3,Sugestão de presentes,53,Sun,1,supercomputadores,2,Sustentabilidade,4,Tabagismo,4,Talento precoce,1,taxa de juros efetiva,1,taxa de juros nominal,1,Taxas Equivalentes,1,Taxidermia,1,Teatro,23,Técnicas de Estudo,2,Tecnologia,416,Tecnologia da Informação,25,TED,193,TedMed,2,TEDx Rio+20,1,TEDxAmazônia,1,TEDxAsaSul,1,Telefonia,57,Televisão,39,Temas,1,Tempo,1,Tendências,9,Teologia,5,teoria das supercordas,1,Terremoto,7,Terrorismo,14,Testes,17,Tipologia,7,Tomada de Decisão,1,tradução,4,Trânsito,8,transporte,27,tributo,3,Trigonometria,1,Tubarão,2,Turismo,18,Tutorial,17,Twitter,6,UFG,1,ufologia,3,UFRJ,1,universidade,3,Urbanismo,15,Urologia,1,USP,2,Utilidade Pública,3,Utilitário,1,Vale,1,Vaticano,1,Ventriloquismo,3,Verão,1,vestibular,2,Vestimenta,1,Vida Digital,7,Vida Moderna,16,Vida Selvagem,10,Vídeo,5,Videogame,103,Vídeos,608,Vídeos 360,1,Violência,3,Vírus,2,Visão Computacional,3,Vôlei,1,Vulcanologia,6,Watergate Política,1,Web 2.0,28,Web Application,75,Web Semântica,1,Web Seminar,1,webdesign,7,Webinar,1,widget,2,WikiLeaks,33,Wikipedia,1,Windows,5,Xadrez,1,YouTube,4,Zoologia,52,
ltr
item
BrAcad: Reconhecimento de voz que funciona
Reconhecimento de voz que funciona
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgAjvf3uWKxlf8HFoBf5NFDlCJ98LygJ20O19_olxP2E-YRv0-ocdn7ir4pg5m3AMlAqVV3n2TXZlHROSt38FXrs1ud6DZy-cCCsklFmuOSvz_xKuA8lOrqh0HTbDBZN53jmsZBqfoZ4C0/s400/recFala.jpg
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgAjvf3uWKxlf8HFoBf5NFDlCJ98LygJ20O19_olxP2E-YRv0-ocdn7ir4pg5m3AMlAqVV3n2TXZlHROSt38FXrs1ud6DZy-cCCsklFmuOSvz_xKuA8lOrqh0HTbDBZN53jmsZBqfoZ4C0/s72-c/recFala.jpg
BrAcad
https://minimal-war.blogspot.com/2013/12/reconhecimento-de-voz-que-funciona.html
https://minimal-war.blogspot.com/
http://minimal-war.blogspot.com/
http://minimal-war.blogspot.com/2013/12/reconhecimento-de-voz-que-funciona.html
true
5404866010248693673
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy