terça-feira, 4 de maio de 2010

A língua do Google


A língua do Google

A tradução quase instantânea de textos para 52 línguas é apenas o primeiro passo rumo a um comunicador universal em que o idioma deixa de ser barreira e passa a ser o portal do grande encontro das culturas.

As diferenças de idioma são um divisor da humanidade. Há dois caminhos para contornar essa barreira. Num deles, busca-se um retorno à linguagem única que, segundo a Bíblia, existia antes da Torre de Babel. Ao longo da história, algumas línguas de fato procuraram desempenhar esse papel. Por exemplo, o latim, na Antiguidade, ou o inglês, nos dias de hoje. Línguas artificiais como o esperanto, criado no século XIX pelo polonês L.L. Zamenhof, também se candidataram a realizar essa tarefa. O outro caminho é o da tradução universal. Em princípio, seria coisa de ficção científica. O mais insólito modelo de tradutor universal aparece no livro O Guia do Mochileiro das Galáxias, dos anos 70: um peixinho é introduzido no ouvido do protagonista e verte frases alienígenas para o inglês. Na série Jornada nas Estrelas, a tecnologia entra em cena e um dispositivo permite a conversa não somente entre "terráqueos", mas entre habitantes de diferentes planetas. Pois bem: como acontece com frequência, a ficção científica não estava lidando com o impossível, mas apenas antecipando o futuro. A tecnologia já está avançada na criação de um tradutor universal. O sistema mais eficiente opera nos computadores do Google, o gigante da internet. Hoje, ele permite a tradução instantânea de textos escritos em 52 idiomas. Para o leitor, é como colocar-se diante de uma biblioteca infinita e descobrir que todas as publicações estão em português. Estima-se que em dez anos já sejam 250 as línguas contempladas. E, nesse ponto, a inclusão de aplicativos de tradução simultânea em computadores e telefones celulares permitirá que bilhões de pessoas se entendam – sem jamais ter de abandonar a própria língua.

Por trás do Google Tradutor está o conhecimento acumulado em inteligência artificial (I.A.), ramo da computação que se dedica ao desenvolvimento de modelos e programas que produzem nas máquinas um comportamento "inteligente". Nascida nos anos 40, a área produziu experimentos famosos como o robô Eliza, software que simulava diálogos reais na década de 60, e o supercomputador Deep Blue, da IBM, que em 1997 derrotou o campeão russo Garry Kasparov em uma partida de xadrez. O "cérebro" da máquina podia analisar cerca de 200.milhões de jogadas por segundo na busca do xeque-mate. O primeiro estágio da tradução universal – a de textos – já atingiu na internet um nível que linguistas e especialistas em inteligência artificial classificam como avançado. Isso quer dizer que, embora os erros de tradução da ferramenta sejam perceptíveis, os textos que ela apresenta permitem a compreensão do assunto de que eles tratam.

O funcionamento do tradutor do Google remete à Pedra de Roseta, o bloco de granito de 1,20 metro de altura que foi encontrado pelo exército de Napoleão, no século XVIII, e serviu de chave para a decifração dos hieróglifos egípcios. A Pedra traz inscrições de um mesmo texto na antiga língua do Egito e em grego. No século XIX, coube aos estudiosos Thomas Young e Jean-François Champollion relacionar os termos dos dois idiomas para desvendar a língua dos faraós. De forma análoga, os computadores do Google trabalham com pares de textos em línguas diferentes e calculam a probabilidade de palavras de uma delas corresponderem a termos da outra (veja figura abaixo). Com base nesses cálculos, o sistema é capaz de, em menos de um segundo, montar textos em 52 línguas, cada vez que um usuário o requisita.


O tradutor do Google está à frente dos rivais. Em pesquisas patrocinadas pelo governo americano, ele supera com frequência ferramentas de outras empresas e universidades. "Ele também é reconhecido como o melhor entre os sistemas comerciais", diz David Yarowsky, professor de ciência da computação da Universidade Johns Hopkins, nos Estados Unidos. Isso significa sobrepujar os rivais Bing Translator, da Microsoft, e Babel Fish, do Yahoo!. "Hoje, a potência da ferramenta está relacionada ao tamanho de seu banco de dados. E também ao uso de supercomputadores, com sua imensa capacidade de processar informações", explica Helena Caseli, pesquisadora do Laboratório de Linguística Computacional da Universidade Federal de São Carlos. Se são esses os fatores determinantes, é certo que o tradutor vai evoluir. O aumento na capacidade de processar informações dos supercomputadores é garantido pela Lei de Moore – que postula que a capacidade dos chips dobra a cada 24 meses. O banco de dados do Google também cresce continuamente. Ele começou a ser formado em 2006, com textos oficiais da ONU vertidos para seis idiomas. Em seguida, a empresa recorreu a documentos bilíngues de arquivos públicos. Finalmente, mergulhou na internet. Hoje, seus próprios usuários ajudam a ampliar o banco de dados sugerindo traduções alternativas àquelas que lhes são apresentadas. "Há, no entanto, certo limite para essa abordagem", diz Miles Osborne, pesquisador da Universidade de Edimburgo, na Escócia, que trabalhou no projeto do Google. É por isso que vem sendo estudada a inclusão de regras gramaticais no programa: além dos algoritmos, ele usaria essas regras para compor textos mais fluentes. Hoje, as traduções invariavelmente contêm tropeços de gramática. Assim mesmo, quem se detém em uma página estrangeira, esteja ela escrita em mandarim, africânder, vietnamita, japonês ou hindi, já sabe ao menos sobre o que se fala ali. "Há cinco anos, isso era impossível. Daqui a cinco anos, teremos mais fluência", afirma David Yarowsky.

À medida que os tradutores avançarem, seus impactos deverão se espalhar pelas mais variadas áreas. No campo acadêmico, por exemplo, o avanço será dramático. "Em algumas áreas, como ciência e tecnologia, as versões automáticas poderão ser até melhores do que as feitas por humanos, pois, para nós, é muito difícil guardar detalhes de temas específicos", diz Yarowsky. Considere-se que atualmente, nos campos de ciências, tecnologia, finanças e administração, 90% do conteúdo de alta qualidade está em inglês, e a importância dos tradutores automáticos para milhões de estudantes e profissionais ao redor do mundo se torna clara. Yarowsky também aponta frutos na economia: "Será mais fácil vender produtos e serviços ao exterior, com a eliminação de custos com tradução de manuais técnicos, material promocional e e-mails". Atualmente, turistas já se beneficiam da tecnologia na hora de escolher destinos de viagem sem levar em conta a língua local, uma vez que ferramentas como a do Google estão disponíveis em celulares. Há outros dispositivos portáteis que fazem a conversão voz-texto ou texto-voz. Soldados americanos enviados ao Afeganistão já testaram tal aparelho, que dispara mensagens sonoras escolhidas pelos militares na língua local. "É a chance de pessoas de todas as partes do mundo saberem o que as demais pensam. Assim, suas diferenças podem ser minimizadas", diz Yarowsky. "Eu não sei o que um garoto de Bagdá pensa sobre os Estados Unidos, mas gostaria de saber." O Google já colocou seu arsenal também à disposição de outras ferramentas. Além de verter páginas da web, seu know-how na área traduz documentos apresentados por usuários, chats de texto via Google Talk e até converte legendas de vídeos no YouTube. Para conectar línguas e mentes via celular, precisará agregar ao sistema o reconhecimento de voz, desenvolvido por várias empresas ao redor do mundo. "A tradução voz a voz é incrível, e nós adoraríamos realizá-la", reconhece Nate Tyler, relações-públicas do Google internacional. É mais do que isso. E, embora a empresa tente despistar, o mercado espera dela a ferramenta para a próxima década.


Laura Guzman

A americana de 20 anos está há quatro meses em São Paulo, onde realiza um intercâmbio universitário. Ela recorre ao tradutor automático para dirimir dúvidas na hora de escrever e ler artigos extensos em português.

"Eu me sinto segura para usar o idioma,
mas vez ou outra as dúvidas aparecem"

A linguagem cotidiana já começa a ser desbravada pelos tradutores automáticos. A frase "Cê vai lá né?", por exemplo, recebe uma tradução bastante adequada no Google Tradutor: "You going there right?". A própria empresa reconhece, contudo, que sua máquina tem um limite claro: a literatura, sobretudo aquela que subverte a gramática e abusa da ironia, fazendo com que uma mesma palavra possa ter vários significados. "Se você tentar traduzir poesia pelo sistema, vai receber um novo tipo de poesia", brincou, durante uma apresentação, o pai da ferramenta do Google, o alemão Franz Josef Och. Mas isso não é demérito nenhum. Há uma infinidade de estudos literários que falam da "impossibilidade da tradução" – ou que, ao menos, lembram o velho adágio "Traduttore, traditore" ("Tradutor, traidor"). "Não existe efetivamente tradução perfeita entre línguas. Cada uma delas tem estrutura e recursos idiomáticos próprios, intraduzíveis. Você pode convertê-los em termos semânticos, mas não analíticos", diz Jacó Guinzburg, tradutor de francês, inglês, alemão, iídiche e hebraico. "Mas é claro que existem alguns trabalhos excelentes. É o caso da versão de As Minas do Rei Salomão feita por Eça de Queiroz: em inglês, é uma obra de segunda, mas se tornou primorosa em português."

Com o avanço dos sistemas de tradução de línguas por computador, a exigência de aprender um idioma estrangeiro poderá ser abalada. Estudo da empresa de RH Catho Online mostra que o salário médio do brasileiro que domina o inglês e o espanhol é em média 125% superior ao de trabalhadores que não falam esses idiomas. Mas, se a tecnologia evoluir como se espera, a questão terá de ser revista: valerá a pena investir mais de 50 000 reais, custo de um curso completo de inglês de primeiro nível, se em tese for possível contar com as máquinas? "Quando têm a oportunidade de escolha, as pessoas preferem se expressar no idioma materno", diz o linguista britânico David Crystal, estudioso das relações entre língua e internet. "A eficiência dos sistemas de tradução poderá provocar certo desinteresse pelo aprendizado de idiomas estrangeiros." Mas seria um erro abandonar de vez o hábito de aprender línguas. O italiano Luciano Floridi, filósofo da informação, lembra que conhecer um idioma é uma experiência insubstituível, um mergulho em outra cultura. "Há palavras intraduzíveis: se você quer falar sobre saudade, tem de usar o português", exemplifica. Isso, contudo, não demove o filósofo da posição de entusiasta da tradução digital, que para ele ocorrerá em um regime de perdas e ganhos. "Imagine que eu nunca tenha ido ao Brasil e certo dia vá a um restaurante típico em Londres: a receita é brasileira, mas a linguiça é inglesa. Ou seja, não é o mesmo que ir ao Brasil, mas é melhor do que nada."


Felipe Carvalho Zulato

Navegar pelas redes sociais é tarefa do relações-públicas de 23 anos, que vive em Belo Horizonte. Antes de descobrir o tradutor, conferir as páginas de sites japoneses era frustrante.

"As traduções ainda pecam na concordância, mas ao menos me permitem avançar no trabalho"

Se tivessem surgido mais cedo, como ansiava o homem desde o princípio, as ferramentas de tradução automática bem poderiam ter sido de grande ajuda em momentos cruciais da história. Durante a Batalha de Cajamarca pela conquista do Peru, em 1532, coube a um jovem nativo chamado Felipillo mediar o encontro entre os espanhóis, comandados por Francisco Pizarro, e os incas. Por má-fé ou não do tradutor, o rei Atahualpa foi levado a entender que os espanhóis queriam lhe impingir a condição de vassalo do rei espanhol. A negociação foi um fracasso e precipitou a guerra, ocaso inca. Quatro séculos depois, outro entrevero. Em 26 de julho de 1945, as forças aliadas apresentaram a Declaração de Potsdam, um ultimato que dava a Tóquio duas alternativas: rendição incondicional ou destruição total. Dois dias depois, o primeiro-ministro Suzuki Kantaro disse aos jornais de seu país que a declaração não tinha "nenhum valor", acrescentando à frase seguinte o termo mokusatsu – que pode assumir os significados distintos de "ignorar" ou "silêncio". O jornal The New York Times estampou em sua primeira página: "Japão rejeita ultimato aliado de rendição". Tradutores afirmariam mais tarde que melhor seria dizer que os japoneses "silenciaram". As bombas atômicas caíram sobre Hiroshima e Nagasaki sete e dez dias depois, respectivamente. Há dúvidas sobre o efeito que outras traduções poderiam exercer nos dois episódios. Mas o fantasma da diferença linguística perpassa a história. Agora, com os tradutores automáticos, o homem tem a chance de derrubar, com a ajuda da tecnologia, a barreira que Deus, segundo a tradição bíblica, ergueu com a Torre de Babel.


Nicholas Ostler

O especialista britânico em história das línguas enxerga no tradutor do Google um aprimoramento da globalização, com novas oportunidades para o indivíduo.

E sentencia: o inglês será a última língua franca.

"As pessoas se darão ao luxo de falar com outras culturas usando o próprio idioma"


Franz Josef Och

O alemão que chefia o time de tradução do Google, diante da Pedra de Roseta, que no século XIX ajudou a decifrar os hieróglifos egípcios e serve de modelo ao sistema automático do gigante de buscas. O tradutor moderno alia números e palavras, matemática e linguística para converter idiomas.

"No futuro, teremos muito mais. A máquina será capaz de quebrar barreiras, levando a informação aonde quer que as pessoas precisem dela"


David Yarowsky

O professor de ciência da computação da Universidade Johns Hopkins aposta no poder de aproximar pessoas da ferramenta de tradução. A cada língua colocada à disposição na internet, surgem chances de aumentar a troca de ideias e diminuir as diferenças culturais.

"Eu não sei o que um garoto de Bagdá pensa sobre os Estados Unidos, mas gostaria de saber"


Vinício Fornasari

Aos 52 anos, o empresário da construção civil usa o Google Tradutor a partir de Florianópolis para checar minúcias de contratos firmados com companhias da China, Japão e Turquia, além de prospectar oportunidades pela internet.

"A ferramenta tem ajudado muito nas negociações"

Fonte: Revista Veja - Edição 2163 / 5 de maio de 2010.
Matéria: Internet A língua do Google - Por Jadyr Pavão Júnior.
Reportagens: Daniel Jelin, Manuela Franceschini e Nathalia Goulart .
Imagens: Revista Veja - Editora Abril.
Fotografias: Laílson Santos(Laura Guzman), Bruno Magalhaes/Nitro(Felipe Carvalho Zulato), Ana Rojas(Nicholas Ostler), Peter da Silva/The New York Times(Franz Josef Och), Lia Lubambo(David Yarowsky), Suzete Sandin/Tempo Editorial(Vinício Fornasari).

Nenhum comentário: