Traductions à la Google: power matters (October 24, 2007)Source: Transnets (http://pisani.blog.lemonde.fr)
| Google vient de changer de système de traduction . Elle utilise maintenant sa propre méthode pour les 25 langues accessibles sur son site: la seule puissance de ses machines et les milliards de données qu'elles traitent, sans traducteur ni logiciel de traduction.
Ce système consiste à mettre en parallèle des mots dans chacune des deux langues et des textes traduits par les humains puis à leur appliquer des techniques d'apprentissage statistique, comme l'a expliqué Franz Och , un des chercheurs de l'équipe.
"Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars. Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply ... |