Liens connexes

Dépêche modérée par

Dépêche éditée par

: Apertium français-espagnol 0.8.0 vient de sortir

Posté par Youssef Oualmakran (page perso, ). Modéré le 07 mars 2008.
0
Le monde du logiciel libre ne compte que très peu de solutions de traduction automatique :
  • OpenLogos, projet peu actif ;
  • Moses, qui réalise des traductions automatiques basées sur des statistiques ;
  • Apertium, projet en GPL reposant sur une communauté active.
Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.

> Lire la suite (9 commentaires, moyenne: 2,6).   [dépêche : 1317 caractères]

Apertium est soutenu financièrement par le ministère espagnol de l'industrie,du tourisme et du commerce, du gouvernement de la communauté autonome de Catalagone, et l'université d'Alicante, le ministère des affaires étrangères de Roumanie et par Prompsit et Eleka, deux entreprises. Plusieurs universités contribuent activement au code et outils linguistiques :
l'université d'Alicante (Valence), de Vigo (Galice), de Pompeu Fabra (Barcelone en Catalogne).

Apertium recherche des développeurs tant pour le moteur écrit en C++, que des non informaticiens pour les données linguistiques stockés dans de simples fichiers XML, ou des personnes pour réaliser des interfaces.

Vous pouvez télécharger une archive, la dernière version via svn, ou tester via l'interface web.

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

pratique

Posté par baud123 (Jabber id, page perso, ) le 08/03/2008 à 13:39. (lien). Évalué à 4.

La traduction français espagnol me semble de bonne facture
http://xixona.dlsi.ua.es/apertium-unstable/navegador.php?mar(...)
Dommage que linuxes.org soit parqué cela aurait été l'occasion de diffuser notre site francophone préféré en une autre langue que le 1337 :-)

Pour ceux qui se disent, tiens c'est dommage pour un outil de traduction qu'il ne soit pas en français par défaut, il est bien disponible : http://xixona.dlsi.ua.es/apertium-unstable/fr
(tenir compte de la langue du navigateur et d'un cookie de la dernière langue sélectionnée par l'utilisateur pourrait être une amélioration sympathique ; par ailleurs toutes les paires n'apparaissent pas, bizarre :/ et il y a une petite typo dans le titre).

Je n'ai pas encore essayé le client, mais la traduction en ligne est d'ores et déjà dans mes signets http://wiki.eagle-usb.org/wakka.php?wiki=SemantiqueEtLangue (aux côtés de sensmotdire et shtooka, projets libres pour la conjugaison et la prononciation des verbes irréguliers).

Il est possible de suivre l'avancement avec le nombre de lemmes[1] par langue http://xixona.dlsi.ua.es/wiki/index.php/List_of_language_pai(...)
Il y a même l'esperanto : une idée pourrait être de systématiquement proposer l'esperanto comme langue cible, ce qui permettrait de toujours disposer d'une traduction lisible pour les sites web (bon faut se mettre à l'esperanto aussi...).

[1] http://fr.wikipedia.org/wiki/Lemme_(linguistique)

Synergies avec d'autres projets libres?

Posté par djano () le 10/03/2008 à 18:30. (lien). Évalué à 3.

Dites mois si je me trompe, mais en regardant cette page [1], ainsi que son équivalent anglais, il me semble que contribuer à une paire de langues existante revient a refaire une partie du travail réalisé dans un dictionnaire orthographique (notamment celui qui consiste a éliminer les doublons) en l'enrichissant des correspondances qui existent entre les termes des deux langues.

Si vous ne voyez pas de quoi je parle avec le dictionnaire d'orthographe, vous pouvez regarder cette discussion très intéressante qui explique comment c'est fait [2].
Vous pouvez aussi aller jeter un coup d'oeil sur le projet Dicollecte[1] qui vise à améliorer les dictionnaires orthographiques français pour OpenOffice.org et pour Firefox, Thunderbird et Seamonkey.

Donc je me demandais s'il ne serait pas possible pour ces projets de réutiliser des données?

Par ailleurs, je pense qu'Apertium doit disposer d'une compréhension de la grammaire de chaque langue, il semble naturel de penser qu'il soit possible de travailler de concert avec Language Tool pour construire des données ensemble et essayer de s'améliorer mutuellement?

[1] http://xixona.dlsi.ua.es/wiki/index.php/Comment_contribuer_%(...)
[2] https://linuxfr.org//comments/903125.html#903125
[3] http://dico.savant.free.fr

Revenir en haut de page