Blog

Vérifier la légitimité d’une entreprise, d’un client

Dans un monde parfait, de nombreuses questions n’auraient pas lieu d’être. Notre esprit ne serait pas embrumé par des préoccupations diverses et variées et nous n’aurions aucune difficulté à remettre, entre les mains de parfaits inconnus, le fruit d’un travail de longue haleine qui ne demande qu’à être rémunéré.

Seulement voilà, le filtre rose semble désactivé.

Chacun voit la vie de sa propre façon, colorée par ses valeurs, son expérience et ses attentes. Le traducteur, comme bien d’autres prestataires de service, n’a aucune envie de voir son travail disparaître dans les limbes d’Internet sans qu’un paiement lui soit versé en retour. Bien entendu, il est tout à fait possible qu’un client « oublie » malencontreusement de vous envoyer la somme correspondant au montant du devis, mais dans de rares cas… vous ne recevrez rien. Vous n’entendrez pas le moindre cliquetis de pièces sonnantes et trébuchantes et ne sentirez pas la moindre odeur (vous savez, ce doux parfum qui accompagne le virement bancaire). Dans ce genre de moments, caractérisés par la tristesse et la solitude, une question risque de s’inscrire dans vos pensées.

« Euh… je viens de travailler pour qui, exactement ? »

Excellente réflexion. Remplacez maintenant le verbe « venir » par « aller » et posez-vous la question en amont, dès que vous apprenez l’existence d’un potentiel nouveau client. Si vous avez ne serait-ce que l’ombre d’un doute sur son identité et sa légitimité, mettez de côté votre assurance et votre ingénuité. Non, tous les individus ne sont pas honnêtes et oui, un traducteur averti en vaut deux. Sans plus tarder, appliquons le filtre « méfiance élémentaire » et voyons où cela peut nous amener.

1re étape : « Bonjour, j’aimerais obtenir un renseignement. »

Si l’on peut ici parler de processus de recherche, je vous conseillerais, dans un premier temps, de vérifier l’existence du client/de l’entreprise par le biais de différents sites. Ceux-ci regroupent bon nombre d’informations relatives à l’identité d’une personne morale/physique et vous permettront, en quelques instants, de savoir à qui vous avez à faire.

  1. https://www.societe.com/

Vous n’avez qu’à préciser le nom de l’entreprise pour obtenir une multitude de renseignements, de l’adresse au chiffre d’affaires en passant par le numéro SIREN, la date d’immatriculation au Registre du Commerce et des Sociétés (RCS) et parfois même une analyse de la société. Connaître la situation financière de votre client vous donnera une estimation de ses capacités de paiement et un aperçu de sa rentabilité pour les années à venir.

  1. https://www.whois.com

Vous serez peut-être étonné(e), comme j’ai pu l’être, d’apprendre qu’un nom de domaine peut faire l’objet d’une enquête et vous donner des précisions sur l’identité du webmaster. Il est tout à fait possible que la plupart de vos recherches restent infructueuses, puisque la création de sites Internet a été simplifiée et passe désormais par des hébergeurs disséminés aux quatre coins du monde, mais vous découvrirez toujours au moins deux ou trois éléments (pays du webmaster, adresse, numéro de téléphone, courriel, etc.) pour vous rassurer… ou vous mettre la puce à l’oreille.

TVA et Infogreffe

En complément des deux précédents sites, je vous recommande également de vérifier la validité du numéro de TVA de votre client en vous rendant sur http://ec.europa.eu/taxation_customs/vies/ et de demander un extrait d’immatriculation au RCS (extrait Kbis) récent ainsi qu’un état d’endettement au greffe du Tribunal de commerce.

Grâce au Kbis, vous obtiendrez les éléments suivants :

  • le nom du greffe d’immatriculation ;
  • la raison sociale, le sigle, l’enseigne ;
  • le numéro d’identification (ancien numéro SIREN) ;
  • la forme juridique ;
  • la devise et le montant du capital social ;
  • l’adresse du siège ;
  • la durée de la société ;
  • la date de constitution ;
  • le code NAF ;
  • l’activité détaillée ;
  • l’adresse du principal établissement ;
  • la fonction, les nom, prénom, date de naissance, commune de naissance, nationalité et adresse du dirigeant principal, des administrateurs et des commissaires aux comptes.

(Source : Infogreffe.fr)

2e étape : « De bons contacts pour de bons conseils »

Comment décririez-vous Internet si l’on vous posait la question ? Une véritable mine d’or ? Un repaire d’arnaqueurs ? Dans les deux cas, vous n’avez pas tout à fait tort. Beaucoup considèrent que la plateforme web est à l’image de l’Homme, capable du pire comme du meilleur. D’un côté, vous avez les pirates, les sites frauduleux et le deep-web, tandis que de l’autre, vous avez des bons samaritains, des traducteurs adorables et le royaume des chats. Quel contraste !

Le « Blue Board » de ProZ ne contient pas de félins (au grand dam des utilisateurs, à ne pas en douter) mais il vous donnera un indice sur la fiabilité des agences de traduction et leur sérieux. Celles-ci sont notées sur 5 par la communauté de freelancers qui peuvent ensuite ajouter un commentaire pour recommander ou non ladite agence. N’oubliez pas : les chiffres demeurent des statistiques, ils ne sont pas toujours le reflet de la réalité. Recoupez sans cesse les informations de façon à vous faire une idée bien précise et cohérente de l’entreprise.

Pour éviter de vous faire arnaquer, vérifiez que le nom de votre client n’apparaît pas dans des listes de « scammers ». Le site http://www.translator-scammers.com recense plusieurs milliers d’acteurs malveillants à éviter, triés de manière alphabétique juste en dessous des avertissements et des consignes de base. Un petit Ctrl+F (Chercher) contenant le nom ou l’adresse e-mail de votre contact suffit. N’hésitez pas à repasser régulièrement sur le site pour prendre connaissance des dernières techniques employées par les arnaqueurs et pour vous remémorer les précautions à prendre.

Enfin, utilisez le potentiel communautaire des réseaux sociaux pour poser des questions à vos confrères traducteurs, à vos collègues ou encore à votre entourage. Le monde n’est pas si grand qu’il en a l’air, vous rencontrerez sans doute un autre professionnel qui a déjà été en contact avec votre client et qui pourra vous conseiller sur la suite des évènements.

Le cas échéant, redoublez de méfiance. Des individus malveillants ou malhonnêtes peuvent se dissimuler derrière un nom d’emprunt ou une ancienne dénomination sociale.

3e étape : « Le petit enquêteur en herbe »

Ne nous méprenons pas, je ne vous suggère pas d’enfiler un long manteau beige, d’enfoncer un chapeau sur votre tête et de compléter votre tenue clichée de stalker amateur par une paire de lunettes de soleil. Non, il n’en est pas question. En revanche, vous êtes parfaitement libre de mener votre petite enquête sur Internet, et par téléphone notamment.

Les services de cartographie en ligne, à l’image de Google Maps, vous renseigneront sur le sérieux et la légitimité d’un client/d’une entreprise. Interrogez-vous sur la situation géographique mais ne menez pas de déductions hâtives pour autant : assurez-vous que l’adresse mentionnée sur le site correspond bien à celle du moteur de recherche et utilisez la fonctionnalité « Street View » pour vérifier le nom des enseignes. Faites attention à la date des captures d’images ! Un local commercial peut changer de propriétaire d’une année à l’autre.

Et si vous consultiez les Pages jaunes pour obtenir des coordonnées ? Vous pourriez en profiter pour appeler le client au numéro de téléphone indiqué, voire vous rendre à l’adresse postale mentionnée dans l’annuaire pour évaluer l’entreprise avec qui vous allez peut-être traiter.

Le mot de la fin :

Dans la mesure du possible, ne faites confiance aux nouveaux clients qu’après une évaluation minutieuse de leur bienveillance. À l’instar des méthodes de phishing, les fraudeurs sont particulièrement rusés et les contrefaçons sont de plus en plus crédibles. Faites systématiquement des recherches pour ne pas tomber dans le piège : il ne faut pas plus de trois minutes pour prendre toutes les précautions citées ci-dessus et s’assurer à 99,9 % que votre client est tout aussi professionnel que vous.

Vous possédez un compte Yahoo ? Abonnez-vous aux groupes suivants et vérifiez leur contenu (mises à jour irrégulières) :

http://groups.yahoo.com/group/WPPF/

http://groups.yahoo.com/group/tradpayeur/

http://groups.yahoo.com/group/TranslationPaymentsWhoWhenWhat/

 

Clément Pruvot

Sous la supervision de Gabriel Lang



Didacticiel : extraction terminologique avec memoQ 2015

A.     Introduction

a.      Objectif

L’objectif de cette présentation est de permettre aux traducteurs de compiler rapidement un glossaire bilingue grâce à l’outil d’extraction terminologique intégré de l’environnement memoQ.
Face à un projet de grande envergure, > 5 000 mots, avec plusieurs intervenants et un corpus ou une TM volumineuse, il peut être intéressant de créer un glossaire spécifique au domaine de travail. Ce glossaire permettra : d’accélérer le travail des traducteurs (réduction du temps de recherche, assurance du contexte) et d’assurer la cohésion et la qualité du travail fourni (particulièrement lorsque plusieurs traducteurs sont impliqués). L’élaboration d’un glossaire est également un gage de professionnalisme vis à vis d’un client. Celui-ci peut, dès le début du projet, veiller à ce que la terminologie métier usuelle soit correctement utilisée. Malheureusement, face à la taille du corpus ou des documents de travail, cette tâche peut s’avérer longue et fastidieuse. Un outil d’extraction automatique de terminologie vous permet d’obtenir un résultat rapide, tout en apportant un gage de qualité. MemoQ propose une fonction d’extraction, intégrée à son environnement de traduction. Vous pouvez obtenir un gain de temps de 50 à 66 % par rapport à un processus manuel.

Pourquoi memoQ ? Son coût est faible par rapport à d’autres solutions basées sur la même technologie.

Je vais aujourd’hui vous présenter les bases de l’utilisation de cet outil très utile et souvent négligé par les traducteurs.

b.      Généralités

1.      Fonctionnement

La fonction d’extraction automatique de termes de memoQ fonctionne sur des principes statistiques. Les termes, ou suites de termes, les plus représentatifs par fréquence d’apparition, sont « extraits » et répertoriés dans une liste de termes « candidats ». Les termes non pertinents tels que les articles, pronoms, prépositions, conjonctions, éléments de langage courants, sont filtrés en les indiquant à memoQ sous forme d’une liste (stop word list ou liste de mots vides*). Il convient ensuite de parcourir cette liste et de renseigner la traduction de chaque terme manuellement. La traduction du terme peut-être recherchée soit dans une base terminologique existante, soit dans le corpus bilingue existant (livedocs), soit dans la TM fournie par le client, soit par une recherche classique (dictionnaires, Web,…). Chaque mot peut être immédiatement visualisé dans son contexte source pour que sa traduction reste précise. Une fois tous les termes pertinents traduits, et le « bruit » éliminé, le glossaire peut être exporté dans une base terminologique memoQ puis dans un fichier texte de champs séparés par un délimiteur (CSV).

2.      Méthode

Certains aspects théoriques seront évoqués avec, cependant, priorité aux aspects pratiques. La majorité des étapes de l’extraction terminologique seront présentées dans un exemple concret.

Lors d’un cas concret, nous allons :

  • Configurer l’extracteur terminologique
  • Extraire les termes sources
  • Filtrer les termes non pertinents
  • Traduire les termes pertinents
  • Exporter ce glossaire pour une vérification expert
  • Importer les modifications dans Base Terminologique finale

B.     Présentation

a.      Prérequis

L’intégralité de la présentation est basée sur la version 7.8.54 de memoQ.

Posséder memoQ, être familier avec son usage basique.
Projet créé : en-us –> fr-fr

Domaine : administration réseau, gestion de réseau, protocoles

Documents de travail : fichiers html en langue anglaise

Ressources :

  • TM Microsoft
  • Pages Wikipédia équivalentes en langue française
  • Base terminologique Microsoft générique

b.      Extraction Terminologique

  • Lancer la fonction.
    1. Ouvrez le projet. Dans l’onglet de ruban « Préparation», sélectionnez le bouton « Extraire la terminologie ». Le menu déroulant correspondant se déploie, sélectionnez « Extraire la terminologie ».
      MemoQExtraction-ExtraireLaTerminologie
    2. Si aucune session n’est en cours, vous arrivez sur la fenêtre « Extraire de candidats ». Vous y trouverez trois zones :
      • La zone « Source», où vous pouvez choisir les différents ressources qui seront examinées par l’outil d’extraction.
      • La zone « Options», qui permet de régler finement le moteur statistique.
      • La zone « Mots vides», où l’ont défini la liste des mots non pertinents pour la recherche. Cette liste est essentielle. Sans elle, l’opération renverra un maximum de « bruit ».
    3. Si des sessions précédentes existent, vous verrez la fenêtre Extraire la terminologie.
      MemoQExtraction-ExtraireLaTerminologieDialog

Cette boîte de dialogue vous indique les sessions en cours et permet de continuer une session, d’en supprimer une ou de créer une nouvelle session.

  • Créer la session :

MemoQExtraction-ExtraireDesCandidats

Examinons en détail chaque zone et chaque champ de définition de la session d’extraction.

      1. Nom: optez pour un nom significatif et qui reflète l’approche que vous aurez choisie. Selon les sources choisies et les réglages à votre disposition, vous obtiendrez des résultats très différents. Pour un même projet, vous pouvez essayer plusieurs approches et intégrer les termes qui vous semblent pertinents. Chaque session est conservée pour pouvoir la reprendre là où vous l’aurez laissée.
      2. Choisir les sources: ici, vous pouvez choisir les sources qui seront analysées et dans lesquelles seront choisis les candidats. Cela peut être les documents sources de votre projet, la ou les TM existantes ou les corpus, bilingues ou monolingues, fournis par le client ou collectés par vos soins.
        • Documents: en activant cette case, memoQ extrait les candidats dans les documents présents dans le projet actuel (tous ou les documents sélectionnés) en se basant sur la langue source du projet.
        • Mémoires de traduction: memoQ extrait les candidats en langue source du projet dans la ou les TM existantes (selon l’option).
        • Bases LiveDocs: memoQ extrait les candidats en langue source dans le corpus associé au projet (LiveDocs = fonctionnalité de corpus, bilingue ou monolingue, spécialisé).
      3. Régler les options :
        • Général
          1. Longueur maximale (mots): définit le nombre de mots maximum d’une expression choisie comme candidat.
          2. Nombre d’occurrences minimum : définit la fréquence d’apparition d’un candidat potentiel dans les documents sources. Pour être candidat, une expression doit se répéter au moins x fois.
          3. Séparateurs d’expressions: délimiteurs, memoQ ne traite pas les expressions contenant un de ces caractères.
          4. Rapport de longueur: un nombre, compris entre 0,5 et 3, définissant la priorité des expressions les plus longues. Plus cette valeur est élevée, plus un candidat « long » sera prioritaire.
          5. Ignorer les mots contenant des nombres: parle de lui-même, utile pour éliminer les mots parasites.
        • Mots seuls
          1. Longueur minimum (caractères): memoQ ignorera les mots de longueur inférieure à la valeur de ce champ.
          2. Nombre d’occurrences minimum: fréquence minimale d’un mot pour être choisi comme candidat.
        • Interrogation des bases terminologiques
          1. Rechercher la traduction des candidats: recherche des correspondances dans la BT (Base terminologique de premier rang seulement*) ou les BT (Toutes les bases terminologiques du projet) du projet, le cas échéant. Les correspondances sont automatiquement insérées comme mot cible des candidats correspondants présents dans la BT.

Les valeurs par défaut de la plupart des options constituent un bon début pour l’utilisateur inexpérimenté.

*Dans memoQ, il est possible d’affecter un rang de priorité aux BT du projet. Ceci tant pour la recherche que pour l’ajout de nouveaux mots. Dans le cas de Bases de domaines différents.

  1. Gérer les listes de mots vides (ou mots non significatifs) : cette partie est très importante. En effet, cette liste répertorie les mots qui doivent être ignorés par le moteur d’extraction statistique, comme les déterminants, conjonctions, etc. Sans cette liste, des mots sans aucun intérêt risquent d’être candidats avec un score très élevé. Il est possible de choisir l’emplacement de ces mots dans une expression potentiellement candidate. Exemple : « another » ne doit se trouver ni au début, ni à l’intérieur, ni à la fin d’une expression candidate. Le champ « Mot » permet d’ajouter ses propres mots à exclure.

MemoQExtraction-MotsVides2

  1. Exécution : une fois tous les paramètres définis, cliquez sur « Ok ».
  • Tri des termes

Après traitement des informations, la liste des candidats s’affiche. Vous devez examiner chaque expression candidate pour décide si oui ou non il convient de l’ajouter à une base terminologique pertinente pour votre projet.

MemoQExtraction-ListeDeTravail

  1. La grille de travail, liste des candidats : la fenêtre de travail présente les candidats sur six colonnes :
    • Score : indique le degré de confiance de memoQ dans la validité de ce terme. Ce score est déterminé par la fréquence et la longueur du candidat. Plus le nombre est élevé, plus il apparaît comme pertinent. Les termes présents dans les bases terminologiques affichent des scores plus élevés.
    • N° : indique la position du candidat dans la liste
    • Masquer : permet de masquer/afficher un terme, les termes masqués sont toujours visibles mais si vous actualisez la liste (Ctrl+R ou Trier) ces expressions sont placées en fin de liste.
    • État :
      1. Candidat : à ce stade le terme est candidat, ni masqué, ni accepté, ni ignoré. L’état initial d’un candidat.
      2. Accepté : le candidat à été validé par la commande « Accepter/Ctrl+Entrée». Il sera présent dans la base terminologique définitive.
      3. Rejeté (Ignoré) : le candidat a été rejeté, par la commande « Ignorer ce terme/Ctrl+D». Il sera absent de la base terminologique définitive, se retrouve en fin de liste si vous actualisez celle-ci (Ctrl+R ou quitter et reprendre la session).
    • Source : l’expression source trouvée dans les documents/la TM/les LiveDocs.
    • Cible : la cible. Vous devez vous-même renseigner ce champ. Les seuls termes renseignés automatiquement sont ceux présents dans la ou les bases terminologiques du projet. Si vous avez choisi de les inclure dans cette session.
  2. Sélection des termes

Parcourez chaque terme pour déterminer si oui ou non ils doivent être présents dans votre base finale. La zone « Occurrences » vous affiche le mot dans son contexte, soit dans les documents source soit dans la ou les TM soit dans les LiveDocs.

La liste se parcourt comme un tableau ordinaire.

Commencez par filtrer la liste pour réduire le nombre de candidats. Recherchez les synonymes, les mots en double, les flexions en genre et nombre. Utilisez pour cela la zone de texte « Filtrer ». Par exemple tapez « domain », vous aurez la liste suivante :

MemoQExtraction-ListeDeTravail-Domain

« domain name » correspond à « nom de domaine » dans la base terminologique et « domain names » est son pluriel. Vous pouvez fusionner les candidats. Une seule entrée est créée pour ces deux mots. Après fusion, sous « Domain names » « Également : domain name » s’affiche pour indiquer le lien entre ces deux termes.

MemoQExtraction-ListeDeTravail-Fusionner
Vous pouvez également activer « Recherche uniquement dans les BT » pour afficher uniquement les candidats présents dans les BT sélectionnées.

Lors du parcours de la liste, vous pouvez constater qu’un mot devrait être dans la liste des mots vides, il suffit de le sélectionner et de cliquer sur « Ajouter aux mots vides ». La liste de mots vides ainsi modifiée ne sera utilisée qu’à la prochaine session, ou si vous relancez la session en cours.

Une dernière fonction intéressante est la commande « Fusionner préfixes & masquer ». Sélectionnez un terme et cliquez sur « Fusionner préfixes & masquer », le terme en question est alors considéré par memoQ comme préfixe d’autres termes (child/children,…) et toutes les expressions commençant par ce mot sont fusionnées sous une même entrée de BT et masquées. Généralement, pour être considéré comme un préfixe, le terme doit comporter un indicateur de préfixe (* ou |), s’il est absent, memoQ vous avertit par la boîte de dialogue « Aucun indicateur de préfixe pour le terme » et ajoute un ‘*’ à la fin de celui-ci.

MemoQExtraction-AucunIndicateurDePréfixe

Ensuite, pour chaque expression ou terme vous pouvez :

  • Ignorer le terme (Ctrl+D), son état passe à « Rejeté », il sera absent de la base finale.
  • Traduire et Accepter le terme (Ctrl+entrée), son état passe à « Accepté », il sera présent dans la base finale.

MemoQExtraction-ListeDeTravail-Accepter2

Pour vous aider dans votre recherche :

  • Dans le coin inférieur droit, la zone « Résultats des recherches terminologiques» affiche les termes présents dans la ou les bases terminologiques définies au début de votre session. Si vous n’avez pas choisi de base au début de la session, il suffit de cliquer sur « Rechercher termes maintenant » pour relancer la session en incluant toutes les bases ou uniquement celles qui sont prioritaires. Vous pouvez glisser-déposer un terme s’il vous parait pertinent.
  • Dans le coin inférieur gauche, la fenêtre « Occurrences» indique le terme, dans les documents source, dans son contexte. Ceci vous permet de le traduire correctement. Si vous avez choisi des bases terminologiques du projet, les mots provenant de celles-ci s’affichent également ici avec un fond bleu.
  • Si vous sélectionnez un terme source, cliquez sur « Recherche de concordances…» dans le menu contextuel, ou « Ctrl+K », pour lancer une recherche contextuel de ce mot dans les TM et/ou LiveDocs associés au projet.

Une fois tous vos termes acceptés ou rejetés, cliquez sur « Exporter vers une base de terminologie ». La fenêtre suivante s’affiche.

MemoQExtraction-Exporter vers une base de terminologie

Il vous faut exporter vos termes dans une des bases terminologiques de votre projet, créez donc une base vide à cet effet. Vous pouvez à tout moment revenir à l’accueil du projet et créer une base. Seuls les termes « Acceptés » seront inclus.

  • Exportation pour relecture expert

Vous pouvez exporter le contenu de la base terminologique ainsi crée sous forme de tableau Excel, champs délimités.

Rendez-vous sur l’onglet « Accueil » puis dans « Bases terminologiques » sélectionnez votre TM. Par un clic droit, ouvrez le menu contextuel et cliquez sur « Exporter des termes ».

Choisissez « Exporter comme CSV » puis le délimiteur « ; ». Après expérimentation, ce délimiteur est le plus fiable et ne provoque pas de fusion/coupure accidentelle d’une expression (réf. Csaba Ban, https://csabahungariantranslations.wordpress.com/2011/11/10/term-extraction-in-memoq/, ou Kevin Lossner pour Multiterm, https://www.youtube.com/watch?v=nSZVfkp_lwQ). Désélectionnez la totalité des champs à l’exception de « Texte (avec caractères génériques) ». Vous obtenez le tableau suivant :

English_United_States French_France
Internet Protocol protocole Internet
Protocol protocole
layer couche
DNS DNS
domain domaine
domain names nom de domaine
name server serveurs de noms
System système
TCP/IP TCP/IP
Software logiciel
top-level domain domaine de premier niveau
network management administration réseau

Il suffit alors d’envoyer ce glossaire au client ou à un traducteur expert pour validation.

  • Création de la base terminologique définitive

Une fois les corrections reçues.

English_United_States French_France
Internet Protocol protocole Internet
Protocol protocole
layer couche
DNS DNS
domain domaine
domain names nom de domaine
name server serveurs de noms
System système
TCP/IP TCP/IP
Software logiciel
top-level domain domaine de premier niveau
network management gestion de administration réseaux

Vous pouvez recréer une base terminologique définitive et réimporter ce fichier CSV. Pour les bases terminologiques, memoQ peut utiliser les formats d’importation suivants :

  • Excel
  • Fichiers texte avec tabulation (TXT, CSV)
  • TBX
  • MultiTerm XML
  • TMX

MemoQExtraction-ImporterDesTermes

Voilà, vous êtes maintenant prêt à attaquer votre projet.

c.       QA

MemoQExtraction-QA

  • Création d’un profil spécifique avec la fonction QA de memoQ
  • Exécution et résolution des erreurs
  • Les « non translatables » : émettre une alerte lorsque certains mots ont été traduits alors qu’ils ne le devraient pas
  • Dans la base terminologique, vous pouvez définir un terme comme « Interdit ». Dans l’éditeur de base terminologique, activez la case « Interdit » de l’onglet « Utilisation » des propriétés du terme. Choisissez la cible du terme concerné. Il suffit ensuite dans les paramètres QA de cocher la case « Avertir en cas d’utilisation de terme interdit ».

d.      Autres outils de gestion de la terminologie

  • Extraction terminologique
    • Okapi Term Extractor – Suite logicielle Okapi dédiée à la TAO et à la localisation :
      • Rainbow — L’interface utilisateur des composants d’Okapi, permet de paramétrer et d’exécuter un grand nombre d’utilitaires proposés par Okapi.
      • Text Extraction
      • Tikal
      • Properties Filter
      • Olifant
      • Quality Check
    • Araya Bilingual Terminology Extraction – 800 €
    • SDL MultiTerm Extract – payant 400 € http://www.translationzone.com/fr/products/sdl-multiterm/extract/
  • Gestion de la terminologie
    • SDL MultiTerm Desktop 2015 (250 €)
    • Xbench – Gratuit en évaluation
    • MemoQ


Extraction terminologique avec memoQ (TriKonf 2015)

Après un excellent week-end au TriKonf 2015, Fribourg-en-Brisgau, où j’ai présenté l’extraction terminologique avec memoQ, je vous mets à disposition le PDF des diapositives Powerpoint : TriKonf-ExtractionTerminoMemoq.

Dès que possible, je mettrai en ligne un didacticiel complet, d’ici là, bonne lecture.



Système de traduction automatique statistique (SMT)

coin-tinyÇa y est, je me suis lancé, après moult incantations, et probablement la malédiction des quatre prochaines générations de traducteurs, j’ai laissé la machine traduire. En effet, lors  de la très intéressante conférence « Machine Translation and Human Translation » de Philipp Koehn, le dimanche 20 octobre 2013, à Freiburg im Breisgau, au Trikonf 2013, ce dernier présentait le moteur de traduction automatique statistique « moses ». Malgré les difficultés à suivre cet universitaire, chercheur en traduction automatique, en raison d’une soirée conviviale et très tardive, je ne pus qu’être interpellé par deux choses. Tout d’abord le nom à consonance biblique du logiciel, essentiellement par intérêt culturel, je trouve généralement l’histoire biblique passionnante. Ensuite, la possibilité de revenir à mes premières amours, l’informatique.

Deux mois après, le nom et la théorie sous-jacente m’étaient restés en tête. Étant moins occupé, un peu de veille technologique me semblait être une idée constructive pour passer le temps. Perplexe face aux différents discours entendus de ci et de là, passant du « La traduction automatique est l’avenir, adoptez-la ou périssez » à « Cette technologie n’est que l’oeuvre du démon et fera plonger les traducteurs dans les tréfonds du Tartare où ils passeront leur temps à postéditer, pendant que leurs pieds seront dévorés par des hyènes », j’ai voulu en avoir le cœur net.

Échaudé par les offres Cloud telles que GoogleMT, Systran et MicrosoftMT, pour des raisons à la fois financières et qualitatives, mais essentiellement pour des questions de confidentialité, l’idée de faire tourner mon propre moteur a germé.  L’outil est sous Licence publique générale limitée GNU, soit d’utilisation gratuite. Avantage notoire pour un indépendant. Je me suis donc rendu sur le site de moses. Là, il m’a fallu me replonger dans la technique. La technique « hardcore », pas d’installateur, pas de menus ou d’assistants, tout en ligne de commandes, sous Linux. Après avoir parcouru le site et tâté des probabilités, pivot de cette technique statistique, je me suis dit que cette théorie était maintenant trop lointaine dans mes souvenirs de fac. Tout se trouve dans le « User Manual and Code Guide », moyen le plus simple d’installer, d’entraîner et d’exercer, puis de tester le logiciel. Je trouve donc un PC, pas trop ancien, j’installe Linux, me rend compte des difficultés à retrouver de vieux réflexes sur un système d’exploitation bien plus restrictif que Windows, et parviens à compiler correctement l’intégralité du code source de moses. Je passe ensuite à la phase de test.

Pour fonctionner, l’outil doit être alimenté en corpus bilingue dans un domaine bien défini, le plus volumineux possible. Le moteur peut alors « apprendre » à traduire de nouveaux documents. La première phase consiste à « mettre en forme » le corpus pour qu’il soit manipulable par le moteur : segmentation (tokenization), harmonisation des majuscules, limitation aux segments de moins de 80 caractères. Le moteur doit ensuite produire un « Modèle de langage probabiliste » de la langue cible à partir du corpus, modèle qui établit la probabilité d’une phrase à partir des probabilités conditionnelles d’apparition d’un mot ou d’une classe de mots (utilisé dans la reconnaissance vocale). Lors de la phase suivante, le moteur procède à l’alignement mot à mot du corpus bilingue, à l’aide de Giza++, extrait les phrases bilingues du corpus et leur affecte une probabilité de traduction puis établit des tables de réordonnancement lexical. La dernière phase est une opération de réglage, ou « tuning« , consistant à perfectionner la traduction automatique en travaillant sur un corpus supplémentaire du même sujet.

Et voilà.

Après toutes ces opérations, seulement quelques jours d’installation et plusieurs heures de calcul, je suis fin prêt. J’ouvre une fenêtre de commande et lance moses. Je tape quelques termes qui sont immédiatement affichés dans la langue cible. Jusque-là, ça va.

J’essaie une phrase simple, le résultat est médiocre. Je finis par copier un segment de la TM qui a servi à entraîner le moteur, « XXX equipment sets the standard for our industry. The XXX product line of more than 300 machines reflects our increased focus on customer success. We will remain the leader by continuing to help our customers meet their needs with durable and reliable equipment. XXX has the best distribution and product support system in any capital goods industry. »

J’obtiens : « la régénération permet à l’équipement standard , le produit industry. rendement de la machine de la benne , branches qui sur le client , XXX success. le leader de poursuivre l’ introduction et de leur position maximum , durable et XXX equipment. il est important de maintenir le système de distribution du produit ou capital RESPONSABLES industry. »

Pour conclure, comme message à mes collègues, je dirais « Don’t panic! » (phrase bien connue sur la première page du « Hitchhiker’s Guide to the Galaxy »), notre métier a encore de beaux jours. Les technologies sont loin d’être parfaites et l’intervention humaine restera encore longtemps nécessaire et tous les textes à caractère rédactionnel, marketing, publicité, littérature, ne peuvent s’appliquer à ce genre de techniques. Seules applications : certains manuels, des catalogues, des aides en ligne à dégrossir rapidement pour répondre à la croissance exponentielle des volumes à traduire.



Vous souhaitez un chef de projets de services linguistiques ?

Avec plus de 10 ans d’expérience, je peux mener à bien vos projets linguistiques et répondre à vos besoins techniques, linguistiques et qualitatifs.

Processus, normes et technologies de traduction :

Gestion de projet
Documentation
Terminologie
PAO
TAO
Assurance qualité
Post-édition
Normes
Veille technologique



Vous souhaitez localiser un logiciel, un site Internet, une App ?

Localisation :  Le fait d’adapter un programme à un contexte culturel et linguistique local. On traduira par exemple ses messages de l’anglais vers le français, on lui fera manipuler des dates à l’européenne, des formats de papier européens, des euros, etc.

Exemples :

  • Tous types de logiciels
  • Aides en ligne
  • Sites Web complets


Vous souhaitez traduire des documents techniques depuis et vers l’anglais ?

Je vous propose les services suivants :

Traduction technique : « La traduction technique est un métier spécialisé, faisant appel à la fois à des compétences linguistiques et à une connaissance approfondie du domaine à traduire. »

Exemples de document :

  • Documents techniques (spécifications, cahiers des charges, appels d’offre…)
  • Sites Web complets
  • Manuels et notices techniques, fiches de données de sécurité, guides
  • Plaquettes commerciales, catalogues, brochures
  • Normes, articles scientifiques