$type=slider$snippet=hide$cate=0

Vozes sintéticas, tão únicas como impressões digitais

SHARE:

Muitas pessoas com distúrbios da fala grave usam um aparelho computadorizado para sua comunicação. Porém existem poucas opções de vozes dife...

Muitas pessoas com distúrbios da fala grave usam um aparelho computadorizado para sua comunicação. Porém existem poucas opções de vozes diferentes. É por isso que Stephen Hawking tem um sotaque americano e o porquê de muitas pessoas terem a mesma voz, muitas vezes com efeito incongruente. A cientista da fala, Rupal Patel, quis fazer algo sobre isso e nesta maravilhosa palestra ela compartilha seu trabalho de criar vozes únicas para aqueles sem voz.

Hoje eu quero falar sobre um aspecto poderoso e fundamental de quem nós somos: nossa voz. Cada um de nós possui uma impressão de voz única que reflete nossa idade, nosso tamanho até mesmo nosso estilo de vida e personalidade. Como dizia o poeta Longfellow, "a voz humana é o órgão da alma." Como sou uma cientista no campo da fala, acho fascinante como a voz é emitida, e eu tenho uma ideia de como isto pode ser construído. Isto é o que gostaria de compartilhar com vocês.



Começo tocando um exemplo de uma voz que poderão reconhecer.

(Gravação) Stephen Hawking: "Penso que foi bastante óbvio o que eu quiz dizer."

Rupal Patel: Esta era a voz do Professor Stephen Hawking. O que não devem saber é que esta mesma voz pode ser usada por esta menininha com distúrbio da fala devido a uma condição neurológica. Na verdade, todas essas pessoas podem estar usando a mesma voz, porque as opções disponíveis são poucas. Só nos EUA há 2.5 milhões de americanos impossibilitados de falar, e muitos deles usam dispositivos computadorizados para se comunicarem. São milhões de pessoas no mundo todo usando vozes genéricas, inclusive Professor Hawking, que usa uma voz com sotaque americano. Esta falta de uma voz sintética individualizada realmente me tocou muito quando participava de uma conferência de tecnologia assistiva alguns anos atrás, e eu lembro entrando na exibição e vendo uma menininha e um homem adulto conversando, cada um com seu dispositivo mas com uma mesma voz. E olhei em volta e vi isto acontecendo a minha volta, centenas de pessoas usando um punhado de vozes, vozes que não condiziam com seus corpos ou suas personalidades. Nunca sonharíamos de colocar numa menininha uma prótese de um homem adulto. Então por quê a mesma protética voz? Isto mexeu comigo e eu quis fazer algo sobre isto.

Vou mostrar um exemplo de duas pessoas com distúrbios da fala graves. Quero que ouçam como elas soam. Elas estão expressando a mesma coisa

(Primeira voz)

(Segunda voz) Provavelmente vocês não entenderam o que disseram mas espero que tenham ouvido suas identidades vocais únicas.

A seguir, eu quis saber como nós poderíamos preparar essas habilidades vocais residuais e construir uma tecnologia que pudesse ser personalizada, vozes personalizadas para elas. Entrei em contato com meu colaborador, Tim Bunnell. Dr. Bunnell é um especialista em síntese de fala, e ele vem desenvolvendo vozes personalizadas para pessoas colocando junto exemplos pré-gravados das suas vozes e reconstruindo uma voz para eles. Estas pessoas perderam a voz ao longo da vida. Não tínhamos o luxo de exemplos pré-gravados da fala para aqueles nascidos com o distúrbio da fala. Mas pensei, deve haver uma forma de reverter uma designada voz a partir de alguma pequena sobra.

Então decidimos fazer exatamente isto. Com uma pequena ajuda financeira da Fundação Nacional de Ciência decidimos criar vozes personalizadas que capturavam suas identidades vocais únicas. Chamamos este projeto de VocalID, ou Vocal I.D., como em identidade vocal.

Antes de entrar em detalhes de como a voz é feita e os deixar ouvir preciso lhes dar uma lição da fala bem rápida. Certo? Primeiro, sabemos que a voz muda de forma dramática ao longo do desenvolvimento. O som das crianças é diferente do som dos adolescentes que soa diferente dos adultos. Nós todos tivemos esta experiência. Segundo, a fala é uma combinação da fonte, que são vibrações geradas pela sua caixa de voz que são então puxadas pelo restante do seu trato vocal. Estas são as cavidades da sua cabeça e pescoço que vibram, e elas filtram a fonte do som para produzir as consoantes e as vogais. Esta combinação de fonte e filtro é como produzimos a fala. Isto acontece em uma pessoa.

Eu já tinha dito que passei grande parte da minha carreira entendendo e estudando as características da fonte das pessoas com grave distúrbios da fala, e o que constatei foi que embora seus filtros estejam danificados, eram capazes de articular a fonte: o tom da voz, o volume, o ritmo. Estes são chamados de versificação e venho registrando há anos que as habilidades de versificação dessas pessoas estão conservadas. Quando percebi que estes mesmos indicadores são também importantes para a identidade do falante, eu tive esta ideia. Por quê não aproveitar a fonte da pessoa que queremos com que a voz se pareça pois está conservada, e pegar o filtro emprestado de alguém da mesma idade e tamanho, porque elas podem articular a fala, e as misturar? Porque quando as misturamos conseguimos uma voz tão clara quanto o nosso 'falante substituto', a pessoa de quem pedimos o filtro emprestado, e é semelhante à identidade do nosso 'falante alvo'. É muito simples. Esta é a ciência por detrás do que estamos desenvolvendo.

Uma vez que se tem isto em mente, como podemos construir esta voz? Bem, precisamos achar alguém disposto a ser um substituto. Isto não é tão intimidante. Para se ser um substituto doador você só precisa dizer entre centenas e milhares de palavras. O processo é mais ou menos assim.

(Vídeo) Voz: As coisas acontecem em pares.

Eu adoro dormir.

O céu está azul sem nuvens.

RP: Ela continuará assim durante umas 3 ou 4 horas, e a ideia não é ela dizer tudo que o alvo vai dizer, mas incluir todos os sons combinados que ocorrem na linguagem. Quanto mais fala se tem, melhor soa a sua futura voz. Após estas gravações precisamos analizá-las em pequenos fragmentos da fala, combinando um ou dois sons, às vezes até as palavras inteiras um banco de dados. que começam a expandir Chamaremos este banco de dados de banco de vozes. O poder deste banco de vozes é que a partir dele, agora nós podemos criar qualquer expressão nova como, "Adoro chocolate"– todo mundo precisa ser capaz de dizer isto – buscamos no banco de dados e encontramos todos os segmentos necessários para articular a expressão

(Vídeo) Voz: Adoro chocolate.

RP: Então, isto é síntese da fala Chama-se síntese de concatenação e isso é o que estamos usando. Esta não é a novidade. A novidade é como fazemos com que soe como esta jovem.

Esta é Samantha. Eu a conheci quando ela tinha nove anos e desde então, minha equipe e eu temos tentado construir uma voz personalizada para ela. Primeiro nós tivemos que encontrar um doador substituto, depois pedimos a Samantha para produzir algumas expressões. O que ela pode expressar na maioria das vezes é o som das vogais, mas isto não é suficiente para se extrair as características da sua fonte. O que acontece a seguir é melhor descrito com a analogia da minha filha. Ela tem 6 anos. Ela chama isso de misturando cores para pintar vozes. Isto é lindo. É exatamente isto. A voz de Samantha é como um exemplo concentrado de corante vermelho que podemos infundir nas gravações de sua substituta para conseguir uma voz cor de rosa assim.

(Vídeo) Samantha: Aaaaaah.

RP: Agora, Samantha pode dizer isso.

(Vídeo) Samantha: Esta voz é só para mim. Mal posso esperar para usar minha nova voz com meus amigos.

RP: Obrigada. (Aplausos)

Eu nunca vou esquecer este sorriso gentil estampado em seu rosto quando ela ouviu aquela voz pela primeira vez Há milhões de pessoas em todo o mundo como Samantha, milhões, e isto é apenas o começo. Até agora nós conseguimos alguns substitutos falantes nos Estados Unidos. que doaram suas vozes, e temos usado estas vozes para construir nossas primeiras vozes personalizadas. Mas ainda precisamos fazer muito mais. Para Samantha, sua substituta é de algum lugar no Centro-Oeste, um estranho que lhe deu o dom da voz. Como uma cientista, eu estou muito entusiasmada de tirar este trabalho do laboratório e finalmente implementar isto no mundo real para que possa ter um impacto mundial real O que ainda quero compartilhar com vocês é como eu visualizo levar este trabalho para o próximo nível. Eu imagino um mundo de doadores substitutos de todo tipo de formação, de tamanhos e idades diferentes, unindo-se juntos nesta unidade de voz para dar às pessoas vozes tão coloridas quanto suas personalidades. Para isso, um primeiro passo, nós criamos este site na Internet: VocaliD.org, como uma forma de reunir estes que desejam se juntar a nós. como doadores de vozes, como doadores especialistas, de qualquer forma, para fazer esta visão uma realidade

Diz-se que a doação de sangue pode salvar vidas. Bem, a doação de suas vozes pode mudar vidas Tudo que precisamos são algumas horas de fala do nosso 'falante substituto', e apenas uma vogal do 'falante alvo', para criar uma identidade vocal única.

Essa é a ciência por trás do que fazemos. Quero concluir colocando um círculo de volta no lado humano que é realmente a verdadeira inspiração para este trabalho. Cerca de 5 anos atrás nós construímos nossa primeira voz por um garoto chamado William. Quando sua mãe ouviu primeira voz, disse: "É assim que a voz de William teria soado se ele pudesse falar." Eu vi William escrever uma mensagem em seu dispositivo. Eu pensei, que será que ele está pensando? Imaginem usando voz de outra pessoa durante 9 anos e finalmente encontrando sua própria voz. Imagine só.

Wiiliam disse: "Nunca me ouvi antes."

Obrigada.

(Aplausos)

[Via BBA]

COMMENTS

Nome

A divulgar,2,Abelha,3,acessibilidade,17,acessório,2,Acidente,38,Acidentes,2,Acústica,12,Adágios,1,Adestramento,5,Administração,5,adulto,1,Aerodinâmica,4,Aeronáutica,8,África,5,Agência Brasil,3,Agropecuária,1,AIDS,1,Alcoolismo,7,Alemanha,3,Alerta,1,Algoritmo,6,Alimento,1,Alzheimer,4,Amazon,1,Amazônia,3,Análise Combinatória,1,Anatomia,5,Android,2,Animação,40,Animais de Estimação,6,Animal,1,Antropologia,12,Apicultura,4,App,5,Apple,5,Apresentação,4,aquário,1,Argentina,4,Arqueologia,5,arquitetura,14,Arte,113,Astrobiologia,1,Astronomia,12,Ativismo,16,Áudio,3,Audio FX,2,Áustria,1,Autismo,2,Auto-ajuda,9,Automobilismo,14,Automóvel,9,aventura,3,Aviação,4,Aviônica,8,Bahia,1,Balonismo,3,Banco de Dados,3,Beber e Dirigir,1,biblioteconomia,2,Bicicleta,1,Biografia,11,Biologia,128,Biologia Marinha,15,bioquímica,4,Biotecnologia,16,Blog,25,Blogger,24,Boato,3,Bomba,1,borderô de desconto,1,Botânica,4,Brasil,18,Brasília,6,BRIC,1,Browser,9,Bugs,3,CAD,1,Calor,2,Câmera lenta,1,Campanha,35,câncer,4,cardiologia,12,carreira,2,Casemods,1,Caso Isabella Nardoni,1,Caso Snowden,1,Celebridades,6,celular,21,Células-Tronco,3,Cérebro,2,Charge,20,China,10,Cibercultura,2,Ciclovia,1,Cidadania,37,Ciência,131,Cinema,40,Clip,1,Cliparts,1,Cloud computing,4,Comédia,1,competência,1,Complemento de dois,1,Comportamento,213,Computação,62,Computação em grade,5,Computação forense,2,Computação Gráfica,106,Computação Móvel,1,Comunicação e Marketing,100,Concurso,1,Concurso Cultural de Natal,1,Concursos Público,2,Concursos Públicos,3,Conectômica,1,Conspiração,2,Consumidor,7,Consumismo,3,contabilidade,2,Contos,41,Copa do Mundo,26,Cordel,3,Coreia do Norte,1,Coreia do Sul,1,Corpo,2,Coruja,1,cosmética,2,Cosmologia,5,Criança,1,Crime,40,Crime Digital,6,crise,8,crise econômica,9,crônica,5,crônicas,5,Cronologia,1,CSS,3,Cuba,4,Culinária,8,Cultura,7,Curiosidades,111,custos fixo,1,custos variáveis,1,Dança,5,DAO,1,Darwin,8,Decoração,1,demência,1,Demografia,1,Denúncia,9,Dermatologia,6,Desastre Natural,12,Descoberta,1,desconto duplicatas,1,Desenho instrucional,2,Desenvolvimento de jogos,6,Design,16,Dia das Mães,1,Dia do professor,1,diabetes,5,Dicas,59,Didática,1,Dieta,3,diplomacia,2,Direito,143,Direito Eleitoral,1,Direito Internacional,27,Direito Tributário,1,Direitos Humanos,33,Disney,3,Distrito Federal,1,Documentário,37,Doutorado,1,download,2,Drogas,6,e-Book,1,e-governo,2,Ecologia,72,Economia,63,Editoração Eletrônica,1,Educação,192,Educação a Distância,86,educação física,16,Educação sexual,6,Efeitos Sonoros,4,Egiptologia,1,Eleições,18,Eleições 2014,12,Eletricidade,9,eletrônica,3,empreendedorismo,5,enciclopédia,1,endocrinologia,5,Enem,3,Energia,10,Energia Alternativa,11,Energia Nuclear,8,Engenharia,31,Engenharia Civil,4,Engenharia de materiais,11,Engenharia de Software,3,Engenharia Genética,20,Engenharia Mecânica,1,Enretenimento,1,Ensino a Distância,9,Ensino Superior,3,Entomologia,4,Entretenimento,23,Entrevista,55,Epidemiologia,15,Equador,1,Escândalo,4,Escritório,1,Espaço,53,Espanha,1,Espanhol,2,Espeleologia,1,Espetáculo,8,Espionagem,15,Esporte,37,Estação,1,Estágio,1,Estatísticas,25,estrutura de dados,1,Ética,12,EUA,12,Evento,20,Evolução,3,Exercícios físicos,2,Exobiologia,1,experiência,39,fábulas,2,Facebook,15,Farmacologia,7,Favo,1,Feminismo,1,Férias,1,Ferramentas,5,FIFA,2,Filantropia,4,Filmes,14,Filosofia,18,Firefox,1,Física,69,Física Quântica,2,Fisiologia,5,Fisioterapia,4,Flagrante,2,Flamengo,1,Folclore,3,Fome,1,Fonoaudiologia,6,Fotografia,30,Fotos em 360 graus,6,França,5,Francês,1,frases,2,Fraude,4,Freeware,42,Futebol,36,Futurologia,45,gadget,86,Gafe,1,Gastroenterologia,4,Gastronomia,2,Geek,1,Genética,27,Geofísica,1,Geografia,35,Geologia,7,Geometria,6,geopolítica,10,Geriatria,4,Gestão de Configuração,2,Gestão de Projetos,11,Gestão do conhecimento,5,Ginecologia,3,Glass,1,Google,69,Governo,3,GPS,1,Gradiente,1,gramática,10,Gravidez,1,Grécia,1,Grécia Antiga,1,Guerra,25,Guinness,1,H2,2,Haiti,3,hardware,29,História,125,HIV,1,homenagem,42,Horologia,1,HPV,1,HTML,6,Humor,192,Humor Negro,7,IBM,2,ICIJ,1,Idioma,29,IHC,8,ilo,29,ilusão,30,ilusionismo,5,Imagem 3D,16,Imagens,4,Imagine Cup,1,Império Romano,2,Imprensa,26,Impressora 3D,13,Incêndio,1,Inclusão digital,8,Índia,2,Índios,1,Infectologia,11,Infográfico,24,Informática,37,Inglaterra,1,Inglês,14,Inovação,120,Inteligência Artificial,23,interativo,1,Interface,149,Interfaces Hápticas,14,Internacional,21,Internacionalização da Amazônia,3,Internet,149,Inundação,2,Invenção,19,Inventos,6,iPad,1,IPEA,1,iphone,3,Irã,3,Iraque,1,Israel,6,Japão,2,Java,2,Java.,2,jogos,9,Jogos educativos,9,Jogos Olímpicos,10,Jornalismo,47,Justiça,4,Kinect,10,Le Monde Diplomatique Brasil,6,Letras,1,Lexicografia,1,Liderança,2,Life Hacking,17,Linguística,5,Literatura,36,Livro,30,Lógica,11,Logística,2,Lua,1,Maçonaria,4,Malásia,2,Malvinas,2,Malware,1,Mapa,37,Mapas,3,Marte,1,Mastologia,1,Matemática,45,Matemática Financeira,1,maternidade,1,Mecânica,6,Mecânica dos Fluidos,2,Mecatrônica,38,Medicina,358,Medicina Esportiva,1,Medicina Veterinária,4,Meio Ambiente,84,Mel,1,melanoma,1,Memória,4,memorização,2,Mente,4,Mercado de Trabalho,45,mercosul,1,Mestrado,1,meteorologia,9,Metodologia Científica,26,México,1,Microbiologia,4,Microsoft,10,Mídia Social,44,Militar,11,Mineralogia,1,Mistério,2,MIT,4,Mitologia,2,Mobilidade,1,Mobilidade Urbana,2,MonaVie,1,Montanhismo,1,Moodle,1,Mossad,1,Motivação,1,MSF,1,Mudança Climática,18,Mulher,3,Multimídia,13,museu,8,Música,67,MVC,1,Nanotecnologia,29,Nasa,13,Natação,1,Natal,16,Natureza,1,Negócios,16,Neurociência,44,Neurologia,63,Nordeste,2,Noruega,1,notícias,7,Novidades,18,Novo Enem,2,Números,1,Nutrição,43,Obama,1,Obesidade,9,Observatório da Imprensa,20,Obstetrícia,3,Oceanografia,7,odontologia,4,Offshore Leaks,2,oftalmologia,8,Olimpíadas,5,oncologia,30,ONU,8,Opinião,79,Óptica,15,Oracle,1,Oriente Médio,4,Orkut,2,Ornitologia,1,ortografia,3,Ortopedia,3,Ótica,7,Otorrinolaringologia,1,Paginadores,1,paleontologia,1,Paquistão,1,Pará,2,Paraguai,1,parkinson,2,Passeio virtual,1,Patinação,1,Pediatria,5,Pensamentos,1,performance,1,Periférico,1,Pesca,2,Pesquisa,147,Petição,1,Petrobrás,3,Petróleo,7,Photoshop,5,Pirataria,7,planilha de custo,1,Playstation 3,2,Plebiscito,2,Pneumologia,1,Podcast,4,Poesia,23,Poítica,1,Política,206,Portugal,4,português,14,Pós-graduação,1,prazo médio,1,Pré-sal,4,Prêmio Nobel,4,primatologia,1,privacidade,9,produtividade,3,professor Hamilton Alves,2,Programa Gratuito,4,Programação,36,Projeto Truco,2,Promoção,1,Propaganda,5,Psicanálise,1,Psicologia,202,Psicologia Animal,21,Psiquiatria,9,Pública,7,publicidade,17,Publieditorial,2,Quadrinhos,9,Quads,5,Qualidade,3,Qualidade de Vida,11,química,24,realidade aumentada,31,realidade diminuída,2,Realidade Virtual,18,Reconhecimento de imagem,10,Reconhecimento de voz,2,Recorde,1,Redação,1,redes,6,Referência,1,Referendo,1,Reforma Política,1,Relacionamento,1,Relações Internacionais,30,Religião,32,Responsabilidade Social,4,Retrospectiva,1,Rio 2016,3,Rio Grande do Norte,1,Rio Grande do Sul,1,robótica,61,Roda Viva,21,Roma,1,roteiro,1,RSA,1,Rússia,1,Samsung,1,Sanitarismo,4,Santa Catarina,1,São Paulo,2,Saúde,354,Savant,1,Segunda Guerra Mundial,16,Segurança,104,Segurança da Informação,50,Seleção Natural,2,serviço,1,Serviço Online,1,Sexologia,2,sexualidade,5,Show,7,SIGGRAPH,1,Simulação,24,Sismologia,2,Sistema operacional,3,Sistemas de Numeração,1,Sites de Busca,11,Sociedade,4,Sociologia,33,Software,25,Software Livre,17,Sol,2,Sono,2,Sony,2,SOPA,2,Suécia,3,Sugestão de presentes,53,Sun,1,supercomputadores,2,Sustentabilidade,4,Tabagismo,4,Talento precoce,1,taxa de juros efetiva,1,taxa de juros nominal,1,Taxas Equivalentes,1,Taxidermia,1,Teatro,23,Técnicas de Estudo,2,Tecnologia,416,Tecnologia da Informação,25,TED,193,TedMed,2,TEDx Rio+20,1,TEDxAmazônia,1,TEDxAsaSul,1,Telefonia,57,Televisão,39,Temas,1,Tempo,1,Tendências,9,Teologia,5,teoria das supercordas,1,Terremoto,7,Terrorismo,14,Testes,17,Tipologia,7,Tomada de Decisão,1,tradução,4,Trânsito,8,transporte,27,tributo,3,Trigonometria,1,Tubarão,2,Turismo,18,Tutorial,17,Twitter,6,UFG,1,ufologia,3,UFRJ,1,universidade,3,Urbanismo,15,Urologia,1,USP,2,Utilidade Pública,3,Utilitário,1,Vale,1,Vaticano,1,Ventriloquismo,3,Verão,1,vestibular,2,Vestimenta,1,Vida Digital,7,Vida Moderna,16,Vida Selvagem,10,Vídeo,5,Videogame,103,Vídeos,608,Vídeos 360,1,Violência,3,Vírus,2,Visão Computacional,3,Vôlei,1,Vulcanologia,6,Watergate Política,1,Web 2.0,28,Web Application,75,Web Semântica,1,Web Seminar,1,webdesign,7,Webinar,1,widget,2,WikiLeaks,33,Wikipedia,1,Windows,5,Xadrez,1,YouTube,4,Zoologia,52,
ltr
item
BrAcad: Vozes sintéticas, tão únicas como impressões digitais
Vozes sintéticas, tão únicas como impressões digitais
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEinRY_vw_eBAV-2uEnlEIfUloGC4zbpNIxbtqhwhArL9VTue6wKrZHbhFxuI_QW0RMjNJyhWv646Uegn6jb8rLqGfCs2U9Y13FMcJYzBX2JbnKrkm0zV1qja_Toy6UmlwY7FWJy_bvM5IQ/s400/RupalPatel.jpg
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEinRY_vw_eBAV-2uEnlEIfUloGC4zbpNIxbtqhwhArL9VTue6wKrZHbhFxuI_QW0RMjNJyhWv646Uegn6jb8rLqGfCs2U9Y13FMcJYzBX2JbnKrkm0zV1qja_Toy6UmlwY7FWJy_bvM5IQ/s72-c/RupalPatel.jpg
BrAcad
https://minimal-war.blogspot.com/2014/02/vozes-sinteticas-tao-unicas-como.html
https://minimal-war.blogspot.com/
http://minimal-war.blogspot.com/
http://minimal-war.blogspot.com/2014/02/vozes-sinteticas-tao-unicas-como.html
true
5404866010248693673
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy