DeepL dá uma aula a outros tradutores online com uma inteligente aprendizagem automática

Os gigantes da tecnologia Google, Microsoft e Facebook estão aplicando as lições da aprendizagem automática à tradução, mas uma pequena empresa chamada DeepL superou todos eles e elevou o campo a um novo patamar.  Essa ferramenta de tradução é tão rápida quando as das grandes concorrentes, só que mais precisa e com mais nuances do que qualquer outra que testamos.

Eu só falo um pouquinho de francês além de um inglês passável, mas, por sorte, meu colega Frederic é um homem de muitas línguas. Ambos concordamos que as traduções do DeepL são, no geral, superiores às do Google Tradutor e do Bing.

Tome como exemplo a seguinte passagem de um artigo alemão, traduzido pelo DeepL (acima) e Google:

Como Frederic colocaria: “Enquanto o Google Tradutor geralmente traz uma tradução muito literal, que perde algumas nuances e expressões idiomáticas (ou então traduz essas expressões completamente errado), o DeepL costuma apresentar uma tradução mais natural e que parece mais próxima de uma feita por um profissional da tradução.

A segunda frase é analisada de forma mais natural; a medida é “projetada para” alguma coisa, em vez de somente “para” essa coisa; a polícia está “na estrada em veículos blindados”, em vez de apenas nos carros; “aparência marcial” não está perfeito (apesar de inspirado), mas é muito melhor que o absurdo que é “a turbulência dos lutadores… veio à tona”.

Alguns testes feitos por mim mesmo com obras da literatura francesa que conheço o suficiente para julgar também mostraram o DeepL saindo à frente regularmente. Menos erros de tempo, intenção e concordância, junto a um melhor entendimento e aplicação de expressões idiomáticas facilitam a leitura do texto traduzido. Isso é o que nós, e os tradutores que participaram dos testes cegos do DeepL, achamos. Mas não precisa acreditar em nós— teste você mesmo.

Apesar de ser verdade que o significado pode ser transmitido mesmo com erros desse tipo, como evidenciado pela utilidade que encontramos até no tradutor online mais simples, está longe de se garantir que qualquer coisa além das informações mais básicas seja passada adiante.

O Linguee evoluiu

O DeepL nasceu do igualmente excepcional Linguee, uma ferramenta de tradução que existe há anos e, apesar de popular, nunca conseguiu alcançar o nível do Google Tradutor — afinal esse último tem uma grande vantagem em nome e posição no mercado.

Um dos co-fundadores do Linguee, GereonFrahling, trabalhava para o Google Research, mas abandonou o posto em 2007 para começar este novo projeto.

A equipe vem trabalhando com aprendizagem automática há anos, para tarefas ligadas à tradução em si, mas foi apenas no ano passado que começaram a trabalhar de maneira mais efetiva em um novo sistema e companhia, os quais viriam a se chamar DeepL.

Num e-mail, Frahling me disse que estava o momento era propício: “Nós construímos uma rede de tradução neural que incorpora a maior parte das atualizações recentes, às quais adicionamos nossas próprias ideias.”

Uma enorme base de dados de mais de 1 bilhão de traduções e perguntas mais um método de observação direta de traduções a partir de pesquisas por termos semelhantes na internet permitiram uma base sólida na formação do novo modelo. Eles também construíram o que afirmam ser o 23º supercomputador mais poderoso do mundo, convenientemente localizado na Islândia.

Os desenvolvimentos publicados por universidades, agências de pesquisa e, de fato, os concorrentes do Linguee mostraram que as redes neurais convolucionais eram o caminho a ser seguido, em vez das redes neurais recorrentes que a companhia vinha usando anteriormente. Aqui não é o lugar para se aprofundar nas diferenças entre as CNNs (do inglês Convolutional Neural Network) e as RNNs (Recurrent Neural Network), então é suficiente dizer que para traduções mais precisas de sequências longas e complexas de palavras relacionadas, a primeira é uma melhor opção, contanto que você possa controlar suas fraquezas.

Por exemplo, se poderia dizer que uma CNN se ocupa de uma palavra de cada vez na frase. Isso se torna um problema quando, por exemplo, como acontece frequentemente, uma palavra no final da frase determina como uma palavra do início dela deve se formar. É improdutivo passar por toda a frase só para descobrir que a primeira palavra que a rede escolheu está errada, e a partir dessa informação começar de novo, então o DeepL e outros do campo da aprendizagem automática aplicam “mecanismos de monitoramento” que identificam potenciais deslizes e os resolvem antes que o CNN siga para a próxima palavra ou frase.

Existem outras técnicas secretas em jogo, é claro, e o resultado delas é uma ferramenta de tradução que eu, pessoalmente, pretendo tornar a minha primeira opção. Estou ansioso para ver a aprimoração dos demais.

Créditos das imagens: H. Armstrong Roberts/Getty Images / Getty Images

Fonte: Tradução de Luciano Venceslau do artigo em inglês DeepL schools other online translators with clever machine learning

2 thoughts on “DeepL dá uma aula a outros tradutores online com uma inteligente aprendizagem automática”

  1. Um artigo, publicado na Folha de São Paulo nesta semana, por um Professor do Instituto de Matemática da USP, trouxe ao meu conhecimento o Tradutor DeepL, que está disponível para download no Brasil, de forma gratuita. Não o conhecia. Só tenho utilizado até aqui o Google Translator, que traduz bem a maioria dos idiomas inclusive latim. Não sei se o DeepL vai incluir o latim, que sem dúvida se beneficiaria muito das novas técnicas que ele utiliza. A versão Pro do Deepl ainda não está disponível no Brasil, mas a versão reduzida já inclui os principais idiomas da Europa e o japonês. Dado um texto qualquer, podemos traduzí-lo para um idioma alvo simplesmente selecionando-o e invocando o DeepL com a combinação de teclas CTRL+C+C . O resultado sai rápido e o programa reduzido traduz até 5000 caracteres. DARCY CARVALHO. FEA-USP SÃO PAULO. Selecionando o texto acima e traduzindo-o para o alemão obtemos:
    Durch einen Artikel, der diese Woche in der Folha de São Paulo von einem Professor des Instituts für Mathematik der USP veröffentlicht wurde, bin ich auf den Translator DeepL aufmerksam geworden, der in Brasilien zum kostenlosen Download zur Verfügung steht. Ich wusste es nicht. Ich habe nur Google Translator verwendet, der die meisten Sprachen, einschließlich Latein, gut übersetzt. Ich weiß nicht, ob DeepL die lateinische Sprache einbeziehen wird, die zweifellos sehr von den neuen Techniken profitieren würde, die es verwendet. Die Pro-Version von Deepl ist in Brasilien noch nicht verfügbar, aber die reduzierte Version enthält bereits die wichtigsten europäischen Sprachen. Wir können einen beliebigen Text in eine Zielsprache übersetzen, indem wir ihn markieren und DeepL mit der Tastenkombination CTRL+C+C aufrufen. Das Ergebnis ist schnell und das reduzierte Programm übersetzt bis zu 5000 Zeichen. DARCY CARVALHO. FEA-USP SÃO PAULO. Em inglês teríamos, traduzindo do alemão.
    Through an article published this week in the Folha de São Paulo by a professor at the Institute of Mathematics of the USP, I became aware of the Translator DeepL, which is available for free download in Brazil. I didn’t know it. I have only used Google Translator, which translates most languages well, including Latin. I don’t know if DeepL will include Latin, which would no doubt benefit greatly from the new techniques it uses. The Pro version of Deepl is not yet available in Brazil, but the reduced version already includes the main European languages and Japanese. We can translate any text into a target language by highlighting it and calling DeepL with the CTRL+C+C key combination. The result is fast and the reduced programme translates up to 5000 characters. DARCY CARVALHO. FEA-USP SÃO PAULO.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *