Por que o Google Tradutor geralmente engana Yorùbá – e outros idiomas – Global Voices em Português

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Grupo de Usuários da Wikimedia Nigéria, outubro de 2018 via Wikimedia Commons CC.BY.2.0.

O idioma inglês dominou o discurso on-line como o idioma “universal” da comunicação desde o início da internet. Em fevereiro de 2020, mais da metade dos sites da Internet está em inglês, de acordo com a WebTech3.

Porém, à medida que mais pessoas ficam online que falam idiomas diferentes, isso provocou uma revolução digital linguística – acesso imediato a traduções em inglês de vários idiomas com o clique de um botão.

Muitas empresas de tecnologia recentemente se esforçaram para documentar palavras não inglesas na internet, abrindo caminho para a digitalização de vários idiomas. Google, Nomes Ioruba, Masakhane MT e ALC são exemplos de empresas e empresas iniciantes que tentam se casar com tecnologia com idiomas diferentes do inglês.

No final de fevereiro de 2020, o Google anunciado que adicionaria cinco novos idiomas aos seus serviços do Google Tradutor, incluindo Kinyarwanda, Uighur, Tatar, Turcomenistão e Odia, após um hiato de quatro anos na adição de novos idiomas.

Um homem parece perplexo enquanto lê um texto online. Foto de Oladimeji Ajegbile, de código aberto via Pexels.

Mas você já clicou na opção de tradução e percebeu que a tradução em inglês é, na melhor das hipóteses, apenas OK? E, na pior das hipóteses, não é preciso?

Existem muitas controvérsias e dificuldades quando se trata de fazer esse tipo de trabalho de tradução e acesso ao idioma.

O Twitter oferece a tradução do idioma Yorùbá para o inglês via Google Translate o máximo possível e, geralmente, o resultado não é totalmente ruim – talvez algumas palavras estejam corretas.

A razão para esses desafios é que as empresas de tecnologia geralmente coletam seus dados lingüísticos para tradução em inglês, provenientes da Internet. Esses dados podem funcionar para alguns idiomas, mas idiomas como o iorùbá e o Ìgbò, dois idiomas principais da Nigéria, são desafiadores, devido às marcas de acento inadequadas ou imprecisas para indicar tons nessas palavras.

Leia Também  Atualização sobre o coronavírus: a Grã-Bretanha pode enfrentar meses de caos, enquanto vírus mortais paralisam eventos no Reino Unido | Mundo | Notícia

Em resposta ao motivo pelo qual o Google levou quatro anos para adicionar cinco novos idiomas, um porta-voz da empresa explicou:

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

O Google Tradutor aprende com as traduções existentes encontradas na Web e, quando os idiomas não possuem conteúdo abundante na Web, é difícil para o nosso sistema suportá-las de maneira eficaz. … No entanto, devido aos recentes avanços em nossa tecnologia de aprendizado de máquina e ao envolvimento ativo dos membros da comunidade do Google Tradutor, pudemos adicionar suporte para esses idiomas.

Além disso, a maioria das pessoas não é tão boa com ortografias – ou grafias – nessas línguas. Como resultado, boas traduções não são computadas porque esses erros não são sinalizados como inadequados.

A maioria das traduções feitas por máquinas traduz algumas palavras erradas, especialmente palavras com nuances culturais. Por exemplo, palavras Yorùbá ayaba e obabìnrin têm seus significados situados em um contexto cultural. A maioria das máquinas traduz as duas palavras como “rainha”. No entanto, do ponto de vista tradicional e cultural, é essencial observar que os significados de ayaba e obabìnrin são diferentes: ‘babìnrin significa “rainha” em inglês, enquanto ayaba é “esposa do rei”.

Mesmo com essas complicações de tradução, a tecnologia ajudou no avanço das línguas africanas nos espaços digitais, estimulando a cunhagem de novas palavras. Os idiomas africanos cresceram com o influxo de novos aparelhos, como smartphones e tablets, à medida que novas palavras são inventadas para nomear essas novas ferramentas e conceitos tecnológicos. Esse processo expandiu o uso e a funcionalidade desses idiomas.

Com o surgimento de novas tecnologias, os vocabulários de muitas línguas africanas tornaram-se mais sofisticados. Por exemplo, a língua Yorùbá possui algumas palavras influenciadas pela tecnologia, como erọ amúlétutù (“ar condicionado”), erọ Ìbánisọ̀rọ̀ (“Telefone”) e erọ Ìlọta (“Moedor”). Da mesma forma, a língua igbo possui palavras como ekwè nti (“Telefone”) e vocêgbọ̀ àlà (“veículo”). Essas sociedades deram nomes a esses aparelhos com base nas funções que executam.

Leia Também  Atirador do massacre de mesquita que matou 51 morrerá na prisão | Mundo | Notícia

Nos cursos de transmissão e publicidade em Yorùbá, os alunos aprendem que a maioria das pessoas chama TV erọ Amóhùnmáwòrán. Essa cunhagem gera muitas perguntas e opiniões – alguns estudantes argumentam que câmeras de vídeo e gravadores também podem ser chamados de erọ amóhùnmáwòrán com base em suas funcionalidades.

Esses desafios linguísticos no espaço tecnológico são saudáveis ​​para os idiomas – estimulam o pensamento crítico para o avanço linguístico e tecnológico.

Em 2019, o Google abriu seu primeiro centro de pesquisa em IA em Accra, Gana, focado em melhorar a “capacidade do Google Translate de capturar idiomas africanos com mais precisão”, segundo a CNN. O cientista de pesquisa Moustapha Cisse, que lidera o trabalho de inteligência artificial do Google na África, acredita que “um continente com mais de 2.000 dialetos merece ser mais bem servido”, conforme publicado pela CNN.

Mozilla e BMZ anunciou recentemente sua cooperação para abrir a tecnologia de voz para os idiomas africanos. Com iniciativas como essa, há mais para mostrar no futuro no que diz respeito aos estudos em línguas africanas.



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br