The Project Gutenberg EBook of Les langues sur le web, by Marie Lebert

This eBook is for the use of anyone anywhere at no cost and with
almost no restrictions whatsoever.  You may copy it, give it away or
re-use it under the terms of the Project Gutenberg License included
with this eBook or online at www.gutenberg.org

** This is a COPYRIGHTED Project Gutenberg eBook, Details Below **
**     Please follow the copyright guidelines in this file.     **

Title: Les langues sur le web

Author: Marie Lebert

Release Date: April 19, 2010 [EBook #32065]

Language: French

Character set encoding: ISO-8859-1

*** START OF THIS PROJECT GUTENBERG EBOOK LES LANGUES SUR LE WEB ***




Produced by Al Haines







LES LANGUES SUR LE WEB

MARIE LEBERT

NEF, Universit de Toronto, 2010

Copyright  2010 Marie Lebert. Tous droits rservs.



Ce livre est ddi  toutes les personnes
interviewes de par le monde
sur ce vaste sujet.

On dit souvent que l'internet abolit le temps, les distances et les
frontires, mais qu'en est-il des langues? Comme l'crit si bien Maria
Victoria Marinetti, professeure d'espagnol en entreprise et
traductrice, il est trs important de pouvoir communiquer en
diffrentes langues. Je dirais mme que c'est obligatoire, car
l'information donne sur l'internet est  destination du monde entier,
alors pourquoi ne l'aurions-nous pas dans notre propre langue ou dans
la langue que nous souhaitons utiliser? Information mondiale, mais pas
de vaste choix dans les langues, ce serait contradictoire, pas vrai?
Tel est le sujet de ce livre. Il s'agit de la version revue et
actualise de L'internet et les langues, publi en 2009.

Marie Lebert, chercheuse et journaliste, s'intresse aux technologies
dans le monde des mdias et des langues. Elle est l'auteure des livres
suivants: Le livre, de l'imprim au numrique (NEF, 2010), L'internet
et les langues (NEF, 2009) et Le multilinguisme sur le web (NEF, 1999).
Ses livres sont publis par le NEF (Net des tudes franaises),
Universit de Toronto, et sont librement disponibles sur le site du NEF
<www.etudes-francaises.net> et dans le Projet Gutenberg
<www.gutenberg.org>, dans divers formats permettant leur lecture sur
tout appareil lectronique.



TABLE


Introduction

L'Ethnologue
  * Un catalogue exhaustif des langues
  * Une oeuvre de longue haleine
  * La codification des langues

De l'ASCII a l'Unicode
  * L'ASCII
  * L'Unicode
  * ASCII et/ou Unicode

Des nations de langues

Vers un web multilingue
  * Premiers pas
  * La Kotoba Home Page
  * OneLook Dictionaries
  * Autres expriences
  * L'affaire de tous

L'anglais reste prdominant
  * Une ralit statistique
  * Commentaires francophones
  * Des solutions logicielles

Le franais sur le web
  * Une nation de langue francophone
  * Le patrimoine linguistique en ligne

Premiers projets multilingues
  * Travlang
  * Les projets de Tyler
  * NetGlos
  * Logos

Dictionnaires de langues
  * Dictionnaires imprims en ligne
  * Rpertoires de dictionnaires
  * yourDictionary.com
  * Le Grand dictionnaire terminologique
  * Eurodicautom et IATE
  * WordReference.com

L'apprentissage des langues
  * Quelques expriences
  * Des outils pour les enseignants
  * La LINGUIST List

Les langues minoritaires
  * La liste de Caoimhn
  * Le site Windows on Haiti

Des encyclopdies multilingues
  * Des projets prcurseurs
  * Wikipdia

Localisation et internationalisation

La traduction assiste par ordinateur

La traduction automatique
  * Dfinition
  * Historique
  * Quelques avis
  * Un march en 2000
  * L'UNL, mtalangage numrique

Chronologie

Remerciements



INTRODUCTION


On dit souvent que l'internet abolit le temps, les distances et les
frontires, mais qu'en est-il des langues?

# Des nations de langues

Comme l'internet n'a pas de frontires nationales, les internautes
s'organisent selon d'autres critres propres au mdium. En termes de
multilinguisme, vous avez des communauts virtuelles, par exemple ce
que j'appelle les "nations de langues", tous ces internautes qu'on peut
regrouper selon leur langue maternelle quel que soit leur lieu
gographique. Ainsi la nation de la langue espagnole inclut non
seulement les internautes d'Espagne et d'Amrique latine, mais aussi
tous les Hispanophones vivant aux tats-Unis, ou encore ceux qui
parlent espagnol au Maroc. (Randy Hobler, consultant en marketing
internet chez Globalink, socit de produits et services de traduction,
septembre 1998)

# La dmocratie linguistique

Dans un rapport de l'UNESCO du dbut des annes 1950, l'enseignement
dispens dans sa langue maternelle tait considr comme un droit
fondamental de l'enfant. La possibilit de naviguer sur l'internet dans
sa langue maternelle pourrait bien tre son quivalent  l'ge de
l'Information. Si l'internet doit vraiment devenir le rseau mondial
qu'on nous promet, tous les usagers devraient y avoir accs sans
problme de langue. Considrer l'internet comme la chasse garde de
ceux qui, par accident historique, ncessit pratique ou privilge
politique, connaissent l'anglais, est injuste  l'gard de ceux qui ne
connaissent pas cette langue. (Brian King, directeur du WorldWide
Language Institute, septembre 1998)

# Un mdium pour le monde

Il est trs important de pouvoir communiquer en diffrentes langues.
Je dirais mme que c'est obligatoire, car l'information donne sur
l'internet est  destination du monde entier, alors pourquoi ne
l'aurions-nous pas dans notre propre langue ou dans la langue que nous
souhaitons utiliser? Information mondiale, mais pas de vaste choix dans
les langues, ce serait contradictoire, pas vrai? (Maria Victoria
Marinetti, professeure d'espagnol en entreprise et traductrice, aot
1999)

# De bons logiciels...

Quand la qualit des logiciels sera suffisante pour que les gens
puissent converser par crit et par oral sur le web en temps rel dans
diffrentes langues, nous verrons tout un monde s'ouvrir  nous. Les
scientifiques, les hommes politiques, les hommes d'affaires et bien
d'autres groupes seront  mme de communiquer immdiatement entre eux
sans l'intermdiaire de mdiateurs ou traducteurs. (Tim McKenna,
crivain et philosophe, octobre 2000)

# ...dans toutes les langues

Les recherches sur la traduction automatique devraient permettre une
traduction automatique dans les langues souhaites, mais avec des
applications pour toutes les langues et non les seules dominantes (ex.:
diffusion de documents en japonais, si l'metteur est de langue
japonaise, et lecture en breton, si le rcepteur est de langue
bretonne). Il y a donc beaucoup de travaux  faire dans le domaine de
la traduction automatique et crite de toutes les langues. (Pierre-
Nol Favennec, expert  la direction scientifique de France Tlcom
R&D, fvrier 2001)

# Des dictionnaires de langues en ligne

J'ai dbut WordReference.com en 1999 pour procurer des dictionnaires
bilingues gratuits en ligne et d'autres outils pour tous sur
l'internet. Depuis, le site s'est progressivement dvelopp pour
devenir l'un des sites de dictionnaires en ligne les plus utiliss, et
le principal dictionnaire en ligne pour les paires de langues anglais-
espagnol, anglais-franais, anglais-italien, espagnol-franais et
espagnol-portugais. Ce site est toujours class sans interruption parmi
les 500 sites les plus visits du web. Aujourd'hui, je suis heureux de
continuer  amliorer ces dictionnaires, les autres outils
linguistiques du site et les forums de langues. J'ai vraiment plaisir 
crer de nouvelles fonctionnalits pour rendre ce site de plus en plus
utile. (Michael Kellogg, fondateur de WordReference.com, mars 2010)

***

Ce livre est issu des multiples liens tisss sur le Net des tudes
franaises (NEF), fond en mai 2000 par Russon Wooldridge, professeur 
l'Universit de Toronto (Canada). Sauf indication contraire, les
citations sont des extraits des Entretiens du NEF <http://www.etudes-
francaises.net/entretiens/> et des entretiens qui ont suivi pour les
actualiser et les complter.



L'ETHNOLOGUE


= Un catalogue exhaustif des langues

Le nombre de langues vivantes parles sur notre plante s'lve trs
exactement  6.909, un dcompte datant de 2009. Ces langues vivantes
sont toutes recenses dans L'Ethnologue: Languages of the World,
catalogue exhaustif  la fois par la masse d'informations glanes et
par la qualit de ces informations, vrifies une  une sur le terrain
dans le monde entier par un rseau compos de milliers de linguistes.

Travaillant au sein de l'organisme SIL International (SIL signifiant:
Summer Institute of Linguistics), l'quipe de l'Ethnologue insiste 
juste titre sur la minutie avec laquelle les informations sont
collectes puis vrifies. Une petite quipe de chercheurs base 
Dallas, dans le Texas, est elle-mme relaye par des quipes nationales
et linguistiques prsentes sur tous les continents.

Barbara Grimes, directrice de publication entre 1971 et 2000 (8e-14e
ditions), relate en janvier 2000 :  Il s'agit d'un catalogue des
langues dans le monde, avec des informations sur les pays o elles sont
parles, une estimation du nombre de personnes qui les parlent, la
famille linguistique  laquelle elles appartiennent, les autres termes
utiliss pour ces langues, les noms de dialectes, diverses informations
socio-linguistiques et dmographiques, les dates des Bibles publies,
un index des noms de langues, un index des familles linguistiques et
enfin des cartes gographiques pour les langues.

L'index des noms de langues (Ethnologue Name Index) donne la liste des
noms de langues et de dialectes ainsi que leurs synonymes, et l'index
des familles linguistiques (Ethnologue Language Family Index) organise
les langues selon leurs familles linguistiques.

Lors d'un entretien prcdent, en aot 1998, Barbara Grimes explique
aussi que, si la version web est utile, la version imprime l'est
encore plus, en langue anglaise pour toucher un large public: Nous
avons eu des demandes nous demandant l'accs  l'Ethnologue dans
plusieurs autres langues, mais nous n'avons pas le personnel ni les
fonds pour la traduction ou l'actualisation, indispensable puisque
notre site est constamment mis  jour. L'internet est (...) un moyen
commode pour mettre notre documentation  la disposition d'une audience
plus large que celle de l'Ethnologue imprim. D'un autre ct,
l'Ethnologue sur l'internet n'atteint en fait qu'une audience limite
disposant d'ordinateurs. Or, dans les personnes que nous souhaitons
atteindre, nombreuses sont celles qui ne disposent pas d'ordinateurs.
Je pense particulirement aux habitants du dit "Tiers-monde".

Une nouvelle dition de l'Ethnologue est publie environ tous les
quatre ans. L'dition la plus rcente, la 16e, date de 2009, avec une
version imprime payante et une version web gratuite... comme
d'habitude depuis que le web existe. Les ditions prcdentes
proposaient aussi une version CD-ROM payante, pendant quelques annes,
avant que l'internet  dbit rapide ne devienne monnaie courante.


= Une oeuvre de longue haleine

Contrairement  ce que certains croient, cette vaste entreprise n'est
ne ni avec l'internet (1974) ni avec le web (1993), mme si sa version
web a beaucoup contribu  la faire connatre. Il s'agit d'un projet de
recherche actif depuis plus de cinquante ans.

L'Ethnologue est fond en 1951 par Richard Pittman, qui est le
directeur de publication des sept premires ditions, de 1951  1969. 
l'origine, son but est de partager les informations glanes sur les
langues minoritaires avec ses collgues de SIL International et
d'autres linguistes. L'Ethnologue dbute comme un catalogue de langues
minoritaires avant de prendre de l'ampleur au fil des ans.

Barbara Grimes est la directrice de publication des sept ditions
suivantes, de la 8e  la 14e, entre 1971  2000.  partir de 1971, le
champ des informations s'largit pour ne plus concerner seulement les
langues minoritaires, mais pour englober aussi peu  peu toutes les
langues vivantes connues dans le monde. Entre 1967 et 1973, Barbara
Grimes rvise d'abord en profondeur toutes les informations disponibles
sur les langues d'Afrique, des Amriques, du Pacifique et de quelques
pays d'Asie. Pendant ses annes comme directrice de publication, entre
1971 et 2000, le nombre de langues recenses passe de 4.493  6.809, et
les informations disponibles pour chaque langue sont elles-mmes plus
compltes, si bien que l'encyclopdie triple de taille.

En 2000, Raymond Gordon Jr. devient le troisime directeur de
publication de l'Ethnologue et produit la 15e dition (2005). Il cde
ensuite la place  Paul Lewis, aid de Conrad Hurd pour la gestion de
la base de donnes et de Raymond Gordon pour la direction des quipes
nationales et linguistiques sur le terrain.

Dans l'introduction de la 16e dition (2009), on peut lire ceci : La
manire dont chacun choisit de dfinir une langue dpend des motifs
qu'on a d'identifier cette langue comme tant distincte d'une autre.
Certains basent la dfinition d'une langue sur des raisons purement
linguistiques. D'autres reconnaissent la ncessit de prendre galement
en compte des facteurs sociaux, culturels ou politiques. En outre, les
locuteurs d'une langue donne ont souvent leurs propres critres sur
l'appropriation d'une langue comme tant la leur. Ces critres sont
souvent bien davantage lis  des questions de patrimoine et d'identit
qu'aux traits linguistiques de la langue ou des langues en question.


= La codification des langues

Comme expliqu dans l'introduction de la 16e dition (2009), une
caractristique de la base de donnes de l'Ethnologue est un systme de
codification des langues au moyen de trois lettres (par exemple FRA
pour la France), ce depuis sa cration. Cette codification est incluse
dans l'encyclopdie elle-mme  partir de la 10e dition (1984).

L'Organisation internationale de normalisation (ISO) adopte pour sa
part la norme ISO 639-2 en 1998. Cette norme, qui codifie galement
chaque langue au moyen de trois lettres, est une convergence de la
norme ISO 639-1 (un ancien standard de deux lettres pour chaque langue,
adopt en 1988) et de la norme ANSI Z39.53 (les codes de langues MARC,
trois lettres pour chaque langue, dvelopps par les bibliothques
amricaines et adopts en tant que norme nationale en 1987).

La norme ISO 639-2 (1998) devient vite insuffisante puisqu'elle codifie
moins de 400 langues individuelles. En 2002, l'ISO invite donc SIL
International  tablir une nouvelle norme permettant d'harmoniser les
codes utiliss dans l'Ethnologue avec les codes de la norme ISO, en y
intgrant aussi les codes des langues mortes utiliss par la Linguist
List, une grande liste de diffusion  destination des linguistes.

Le rsultat, officiellement approuv en 2006 et publi en 2007, est la
nouvelle norme ISO 639-3, qui attribue un code de trois lettres  prs
de 7.500 langues. SIL International est galement dsign comme
l'organisme responsable de l'enregistrement de nouvelles langues pour
l'ISO 639-3, et gre donc le cycle annuel des modifications et des
mises  jour sur une page de son propre site.



DE L'ASCII  L'UNICODE


= L'ASCII

Communiquer dans plusieurs langues implique d'avoir des systmes
d'encodage adapts  nos alphabets ou idogrammes respectifs.

Le premier systme d'encodage informatique est l'ASCII (American
standard code for information interchange). Publi en 1968 aux tats-
Unis par l'American National Standards Institute (ANSI), avec
actualisation en 1977 et 1986, l'ASCII est un code standard de 128
caractres traduits en langage binaire sur sept bits (A est traduit par
1000001, B est traduit par 1000010, etc.). Les 128 caractres
comprennent 33 caractres de contrle (qui ne reprsentent donc pas de
symbole crit) et 95 caractres imprimables: les 26 lettres sans accent
en majuscules (A-Z) et minuscules (a-z), les chiffres, les signes de
ponctuation et quelques caractres spciaux, le tout correspondant aux
touches du clavier anglophone.

L'ASCII permet uniquement la lecture de l'anglais et du latin. Il ne
permet pas de prendre en compte les lettres accentues prsentes dans
bon nombre de langues europennes, et  plus forte raison les langues
non alphabtiques (chinois, japonais, coren, etc.). Ceci ne pose pas
de problme majeur les premires annes, tant que l'change de fichiers
lectroniques se limite essentiellement  l'Amrique du Nord. Mais le
multilinguisme devient bientt une ncessit vitale. Des variantes de
l'ASCII (norme ISO-8859 ou ISO-Latin) prennent en compte les caractres
accentus de quelques langues europennes. La variante pour le
franais, par exemple, est dfinie par la norme ISO-8859-1 (ISO-Latin-
1).


= L'Unicode

Avec le dveloppement du web, l'change des donnes s'internationalise
de plus en plus. On ne peut plus se limiter  l'utilisation de
l'anglais et de quelques langues europennes, traduites par un systme
d'encodage datant de 1968. De plus, le passage de l'ASCII original 
ses diffrentes extensions devient vite un vritable casse-tte, y
compris au sein de l'Union europenne, les problmes tant entre autres
la multiplication des variantes, la corruption des donnes dans les
changes informatiques ou encore l'incompatibilit des systmes, les
pages ne pouvant tre affiches que dans une seule langue  la fois.

Olivier Gainon, fondateur de CyLibris et pionnier de l'dition
lectronique littraire, crit en dcembre 2000: Il faut que le rseau
respecte les lettres accentues, les lettres spcifiques, etc. Je crois
trs important que les futurs protocoles permettent une transmission
parfaite de ces aspects - ce qui n'est pas forcment simple (dans les
futures volutions de l'HTML ou des protocoles IP, etc.). Donc il faut
que chacun puisse se sentir  l'aise avec l'internet et que ce ne soit
pas simplement rserv  des (plus ou moins) anglophones. Il est
anormal aujourd'hui que la transmission d'accents puisse poser problme
dans les courriers lectroniques. La premire dmarche me semble donc
une dmarche technique. Si on arrive  faire cela, le reste en dcoule:
la reprsentation des langues se fera en fonction du nombre de
connects, et il faudra envisager  terme des moteurs de recherche
multilingues.

Publi pour la premire fois en janvier 1991, l'Unicode est un systme
d'encodage universel sur 16 bits spcifiant un nombre unique pour
chaque caractre. Ce nombre est lisible quels que soient la plateforme,
le logiciel et la langue utiliss. L'Unicode peut traiter 65.000
caractres uniques et prendre en compte tous les systmes d'criture de
la plante. A la grande satisfaction des linguistes, il remplace
progressivement l'ASCII, avec des variantes UTF-8, UTF-16 et UTF-32
(UTF: Unicode transformation format) en fonction du nombre de bits
utiliss. Il devient une composante des spcifications du World Wide
Web Consortium (W3C), l'organisme international charg du dveloppement
du web.

L'utilisation de l'Unicode se gnralise  partir de 1998, par exemple
pour les fichiers texte sous plateforme Windows (Windows NT, Windows
2000, Windows XP et versions suivantes), qui taient jusque-l en
ASCII.

Mais l'Unicode ne peut rsoudre tous les problmes, comme le souligne
en juin 2000 Luc Dall'Armellina, co-auteur et webmestre d'oVosite, un
espace d'criture hypermdia: Les systmes d'exploitation se dotent
peu  peu des kits de langues et bientt peut-tre de polices de
caractres Unicode  mme de reprsenter toutes les langues du monde;
reste que chaque application, du traitement de texte au navigateur web,
embote ce pas. Les difficults sont immenses: notre clavier avec ses 
250 touches avoue ses manques ds lors qu'il faille saisir des Katakana
ou Hiragana japonais, pire encore avec la langue chinoise. La grande
varit des systmes d'criture de par le monde et le nombre de leurs
signes font barrage. Mais les cueils culturels ne sont pas moins
importants, lis aux codes et modalits de reprsentation propres 
chaque culture ou ethnie.

Patrick Rebollar, professeur de littrature franaise au Japon et
modrateur de la liste de diffusion LITOR (littrature et ordinateur),
donne son sentiment en janvier 2000: Il s'agit d'abord d'un problme
logiciel. Comme on le voit avec Netscape ou Internet Explorer, la
possibilit d'affichage multilingue existe. La compatibilit entre ces
logiciels et les autres (de la suite Office de Microsoft, par exemple)
n'est cependant pas acquise. L'adoption de la table Unicode devrait
rsoudre une grande partie des problmes, mais il faut pour cela
rcrire la plupart des logiciels, ce  quoi les producteurs de
logiciels rechignent du fait de la dpense, pour une rentabilit qui
n'est pas vidente car ces logiciels entirement multilingues
intressent moins de clients que les logiciels de navigation.


= ASCII et/ou Unicode

Le Projet Gutenberg est fond ds 1971 par Michael Hart pour numriser
les oeuvres littraires et les mettre gratuitement  la disposition de
tous.

Les oeuvres sont numrises en mode texte, en utilisant l'ASCII original
sur sept bits ou, pour les langues avec accents, l'ASCII sur huit bits
pour une prise en compte des caractres accentus. Mais, mme dans ce
cas, le Projet Gutenberg propose  systmatiquement en complment une
version ASCII sur sept bits sans accents. Sauf, bien entendu, dans le
cas de langues non encodables en ASCII, comme le chinois, qui est
encod au format Big-5 pour le chinois traditionnel.

Surnomm  juste raison le plus petit dnominateur commun, l'ASCII
sur sept bits est le seul format compatible avec 99% des machines et
des logiciels, et pouvant tre converti dans de nombreux autres
formats. Il sera toujours utilis quand d'autres formats auront
disparu. Il est l'assurance que les collections ne deviendront jamais
obsoltes, et survivront aux changements technologiques des prochaines
dcennies ou mme des prochains sicles. Il n'existe pas d'autre
standard aussi largement utilis, y compris l'Unicode, systme
d'encodage universel cr en 1991. Ce jusqu'en 2008, date  laquelle
les deux systmes d'encodage sont galement reprsents sur le web.

Le Projet Gutenberg propose certains livres dans d'autres formats que
l'ASCII, notamment dans les trois formats rpandus que sont les formats
HTML, XML et RTF. Des fichiers Unicode sont galement prsents et
remplacent peu  peu les fichiers ASCII sur huit bits pour les langues
avec accents comme le franais. De plus, tout format propos par tel ou
tel volontaire est gnralement accept (PDF, LIT, TeX et beaucoup
d'autres), dans la mesure o un fichier ASCII est galement prsent.

Les collections du Projet Gutenberg sont d'abord essentiellement
anglophones, puisque ce projet est bas aux tats-Unis et qu'il sert en
priorit la communaut anglophone nationale et internationale. En
octobre 1997, Michael Hart annonce son intention d'intensifier la
production de livres dans des langues autres que l'anglais. Dbut 1998,
le catalogue comprend quelques oeuvres en allemand, en espagnol, en
franais (dix titres), en italien et en latin. En juillet 1999, Michael
crit: J'introduis une nouvelle langue par mois maintenant, et je vais
poursuivre cette politique aussi longtemps que possible.

Le multilinguisme devient ensuite l'une des priorits du Projet
Gutenberg, tout comme l'internationalisation, avec le Project Gutenberg
Australia (cr en aot 2001), le Projet Gutenberg Europe (cr en
janvier 2004), le Project Gutenberg Canada (cr en juillet 2007), et
d'autres Projets Gutenberg  venir dans divers pays, notamment au
Portugal.

Dans le Projet Gutenberg original, 25 langues sont reprsentes en
janvier 2004, 42 langues en juillet 2005, dont le sanscrit et les
langues mayas, et 50 langues en dcembre 2006.  cette date, les
langues principales sont l'anglais, le franais, l'allemand, le
finnois, le hollandais, l'espagnol, l'italien, le chinois, le portugais
et le tagalog.

Ds ses dbuts en janvier 2004, le Projet Gutenberg Europe propose un
site multilingue pour grer la relecture partage entre les
volontaires, afin de prendre en compte les principales langues
nationales. En avril 2004, grce  des traducteurs volontaires, le site
est disponible en douze langues. L'objectif  moyen terme est un site
en soixante langues, et donc soixante quipes linguistiques, avec prise
en compte de toutes les langues europennes. Le Projet Gutenberg Europe
utilise l'Unicode et non l'ASCII, pour pouvoir traiter des livres dans
un grand nombre de langues.



DES NATIONS DE LANGUES


Consultant en marketing internet chez Globalink, une socit de
produits et services de traduction, Randy Hobler crit en septembre
1998: Comme l'internet n'a pas de frontires nationales, les
internautes s'organisent selon d'autres critres propres au mdium. En
termes de multilinguisme, vous avez des communauts virtuelles, par
exemple ce que j'appelle les "nations de langues", tous ces internautes
qu'on peut regrouper selon leur langue maternelle quel que soit leur
lieu gographique. Ainsi la nation de la langue espagnole inclut non
seulement les internautes d'Espagne et d'Amrique latine, mais aussi
tous les Hispanophones vivant aux tats-Unis, ou encore ceux qui
parlent espagnol au Maroc.

Si Randy donne l'exemple d'une nation de langue hispanophone rpartie
sur trois continents, la mme remarque vaut pour la Francophonie, une
communaut de langue franaise prsente sur cinq continents, ou encore
la Crolophonie, puisque le crole est parl non seulement dans les
Carabes mais aussi  Paris, Montral et New York.

 ses dbuts, l'internet est anglophone  pratiquement 100%, ce qui
s'explique par le fait qu'il dbute aux tats-Unis en tant que rseau
reliant les agences gouvernementales et les universits, suite  la
cration du protocole TCP/IP en 1974 par Vinton Cerf et Robert Kahn.
Aprs la cration du World Wide Web en 1990 par Tim Berners-Lee au
Centre europen pour la recherche nuclaire (CERN)  Genve (Suisse) et
le lancement en novembre 1993 du premier navigateur Mosaic, anctre de
Netscape, l'internet se dveloppe rapidement, d'abord aux tats-Unis
grce aux investissements considrables du gouvernement, puis au
Canada, puis dans le monde entier.

Aprs avoir t anglophone  pratiquement 100%, l'internet est encore
anglophone  plus de 80% en 1998, un pourcentage qui s'explique par
trois facteurs: (a) la cration d'un grand nombre de sites web manant
des tats-Unis, du Canada et du Royaume-Uni; (b) une proportion
d'usagers particulirement forte en Amrique du Nord par rapport au
reste du monde, les ordinateurs tant bien meilleur march qu'ailleurs,
tout comme la connexion  l'internet sous forme de forfait mensuel 
prix modique; (c) l'usage de l'anglais en tant que principale langue
d'change internationale.

Dans plusieurs pays d'Europe, par exemple, cette connexion est d'abord
tarife  la dure, avec un tarif de jour et un tarif de nuit moins
lev. Les usagers passent donc beaucoup moins de temps sur l'internet
qu'ils ne le souhaiteraient, et choisissent souvent de surfer la nuit
pour viter les factures trop leves. Fin 1998 et dbut 1999, des
mouvements de grve sont lancs en France, en Italie et en Allemagne
pour faire pression sur les socits prestataires afin qu'elles
baissent leurs prix et qu'elles proposent des forfaits internet, avec
gain de cause dans les mois qui suivent.

En 1997, Babel, initiative conjointe d'Alis Technologies et de
l'Internet Society, mne la premire tude sur la rpartition des
langues sur l'internet. Date de juin 1997, le Palmars des langues de
la toile donne les pourcentages de 82,3% pour l'anglais, 4% pour
l'allemand, 1,6% pour le japonais, 1,5% pour le franais, 1,1% pour
l'espagnol, 1,1% pour le sudois et 1% pour l'italien.

Dans un article publi le 21 juillet 1998 par ZDNN (ZDNetwork News),
Martha Stone, journaliste, prcise: Cette anne, le nombre de nouveaux
sites non anglophones va probablement dpasser celui de nouveaux sites
anglophones, et le monde cyber est en train de vritablement devenir
une toile  l'chelle mondiale. (...) Selon Global Reach [une socit
promouvant la localisation des sites web], les groupes linguistiques se
dveloppant le plus vite sont les groupes non anglophones: on note une
progression de 22,4% pour les sites web hispanophones, 12,3% pour les
sites nippons, 14% pour les sites germanophones et 10% pour les sites
francophones. On estime  55,7 millions le nombre de personnes non
anglophones ayant accs au web. (...) Alors que 6% seulement de la
population mondiale est de langue maternelle anglaise (et 16% de langue
maternelle espagnole), 80% des pages web sont en anglais. Toujours
selon Global Reach, 15% seulement des 500 millions d'habitants que
compte l'Europe sont de langue maternelle anglaise, 28% matrisent bien
l'anglais, et 32% consultent le web anglophone.

Le concept de dmocratie linguistique est dvelopp par Brian King,
directeur du WorldWide Language Institute (WWLI), dans un entretien
dat de septembre 1998: Dans un rapport de l'UNESCO du dbut des
annes 1950, l'enseignement dispens dans sa langue maternelle tait
considr comme un droit fondamental de l'enfant. La possibilit de
naviguer sur l'internet dans sa langue maternelle pourrait bien tre
son quivalent  l'ge de l'Information. Si l'internet doit vraiment
devenir le rseau mondial qu'on nous promet, tous les usagers devraient
y avoir accs sans problme de langue. Considrer l'internet comme la
chasse garde de ceux qui, par accident historique, ncessit pratique
ou privilge politique, connaissent l'anglais, est injuste  l'gard de
ceux qui ne connaissent pas cette langue.

Jean-Pierre Cloutier est l'auteur des Chroniques de Cybrie, une lettre
d'information lectronique sur l'actualit de l'internet. Il crit en
aot 1999: Cet t, le cap a t franchi. Plus de 50% des utilisateurs
et utilisatrices du rseau sont hors des tats-Unis. L'an prochain,
plus de 50% des utilisateurs seront non anglophones. Il y a seulement
cinq ans, c'tait 5%. Formidable, non?

Les usagers non anglophones atteignent en effet la barre des 50% au
cours de l't 2000. Selon Global Reach, ce pourcentage est de 52,5% en
t 2001, 57% en dcembre 2001, 59,8% en avril 2002, 64,4% en septembre
2003 (dont 34,9% d'Europens non anglophones et 29,4% d'Asiatiques) et
64,2% en mars 2004 (dont 37,9% d'Europens non anglophones et 33%
d'Asiatiques).

De plus, nombre de communauts pratiquent le bilinguisme au quotidien,
par exemple  Genve pour le franais et l'allemand ou San Francisco
pour l'anglais et l'espagnol, avec l'exigence de proposer toutes les
informations en deux langues, le cas extrme tant la Communaut
europenne avec ses 11 langues officielles en 2003, puis ses 24 langues
officielles en 2007 aprs son largissement progressif vers l'Europe de
l'Est.



VERS UN WEB MULTILINGUE


= Premiers pas

Professeure d'espagnol en entreprise et traductrice, Maria Victoria
Marinetti crit en aot 1999: Il est trs important de pouvoir
communiquer en diffrentes langues. Je dirais mme que c'est
obligatoire, car l'information donne sur l'internet est  destination
du monde entier, alors pourquoi ne l'aurions-nous pas dans notre propre
langue ou dans la langue que nous souhaitons utiliser? Information
mondiale, mais pas de vaste choix dans les langues, ce serait
contradictoire, pas vrai?

Yahoo! est prcurseur dans ce domaine. En Californie, deux tudiants de
l'Universit de Stanford, Jerry Lang et David Filo, lancent en janvier
1994 l'annuaire Yahoo! pour recenser les sites web et les classer par
thmes. L'annuaire est un succs, avec un classement plus pointu que
celui de moteurs de recherche comme AltaVista, o ces tches sont
entirement automatises. Mais, si une recherche ne donne pas de
rsultat dans Yahoo!, elle est automatiquement aiguille vers
AltaVista, et rciproquement.

Trois ans plus tard, Yahoo! propose un classement en 63 grandes
catgories thmatiques, tout comme une interface en plusieurs langues:
anglais, allemand, coren, franais, japonais, norvgien et sudois.

En dcembre 1997, AltaVista est le premier moteur de recherche  lancer
un service gratuit de traduction automatise de l'anglais vers cinq
autres langues (allemand, espagnol, franais, italien et portugais) et
vice versa, la page originale et la traduction apparaissant en vis--
vis  l'cran. AltaVista Translation, surnomm aussi Babel Fish, est
l'oeuvre de SYSTRAN, une socit franco-amricaine pionnire dans le
traitement automatique des langues. Babel Fish est aliment par des
dictionnaires multilingues comprenant 2,5 millions de termes.

Bien qu'ayant ses limites, avec une traduction de trois pages maximum
et un texte traduit trs approximatif, ce service est immdiatement
trs apprci des douze millions d'usagers que compte l'internet de
l'poque, dont un nombre croissant d'usagers non anglophones. Babel
Fish ouvre aussi la voie  d'autres services du mme genre - dvelopps
entre autres par Alis Technologies, Lernout & Hauspie, Globalink ou
Softissimo - et contribue grandement au plurilinguisme du web.


= La Kotoba Home Page

Yoshi Mikami, informaticien  Tokyo (Japon), lance en dcembre 1995 le
site bilingue anglais-japonais The Languages of the World by Computers
and the Internet, plus  connu sous le nom de Logos Home Page ou Kotoba
Home Page. Le site donne un bref historique de chaque langue, ses
caractristiques, son systme d'criture, son jeu de caractres et
enfin la configuration du clavier dans la langue donne. Yoshi Mikami
est galement co-auteur (avec Kenji Sekine et Nobutoshi Kohara) de Pour
un web multilingue, publi en aot 1997 en japonais par les ditions
O'Reilly avant d'tre traduit en anglais, en allemand et en franais
(version franaise parue en septembre 1998).

Yoshi crit en dcembre 1998: Ma langue maternelle est le japonais.
Comme j'ai suivi mes tudes de troisime cycle aux tats-Unis et que
j'ai travaill dans l'informatique, je suis devenu bilingue
japonais/anglais amricain. J'ai toujours t intress par diffrentes
langues et cultures, aussi j'ai appris le russe, le franais et le
chinois dans la foule. A la fin de 1995, j'ai cr sur le web The
Languages of the World by Computers and the Internet et j'ai tent de
donner - en anglais et en japonais - un bref historique de toutes ces
langues, ainsi que les caractristiques propres  chaque langue et  sa
phontique. Suite  l'exprience acquise, j'ai invit mes deux associs
 crire un livre sur la conception, la cration et la prsentation de
pages web multilingues, livre qui fut publi en aot 1997 dans son
dition japonaise, le premier livre au monde sur un tel sujet.

Comment voit-il l'volution vers un web multilingue? Il y a des
milliers d'annes de cela, en gypte, en Chine et ailleurs, les gens
taient plus sensibles au fait de communiquer leurs lois et leurs
rflexions non seulement dans une langue mais dans plusieurs. Dans
notre monde moderne, chaque tat a le plus souvent adopt une seule
langue de communication. A mon avis, l'internet verra l'utilisation
plus grande de langues diffrentes et de pages multilingues - et pas
seulement une gravitation autour de l'anglais amricain - et un usage
plus cratif de la traduction informatique multilingue. 99% des sites
web crs au Japon sont en japonais!


= OneLook Dictionaries

Robert Ware, enseignant, lance en avril 1996 le site OneLook
Dictionaries pour permettre une recherche rapide dans des centaines de
dictionnaires couvrant divers domaines: affaires, informatique et
internet, mdecine, religion, sciences et techniques, sports,
gnralits et argot.

Il explique en septembre 1998:  titre personnel, je suis presque
uniquement en contact avec des gens qui ne pratiquent qu'une langue et
qui n'ont pas beaucoup de motivation pour dvelopper leurs aptitudes
linguistiques. tre en contact avec le monde entier change cette
approche des choses. Et la change en mieux! (...) J'ai t long 
inclure des dictionnaires non anglophones (en partie parce que je suis
monolingue). Mais vous en trouverez maintenant quelques-uns.

OneLook Dictionaries compte 2 millions de termes provenant de 425
dictionnaires en 1998, 2,5 millions de termes provenant de 530
dictionnaires en 2000, et 5 millions de termes provenant de 910
dictionnaires en 2003.

Robert Ware raconte aussi dans le mme entretien: Un fait intressant
s'est produit par le pass qui a t trs instructif pour moi. En 1994,
je travaillais pour un tablissement scolaire et j'essayais d'installer
un logiciel sur un modle d'ordinateur particulier. J'ai trouv une
personne qui tait en train de travailler sur le mme problme, et nous
avons commenc  changer des courriels. Soudain, cela m'a frapp... Le
logiciel avait t crit  40 kilomtres de l, mais c'tait une
personne situe  l'autre bout du monde qui m'aidait. Les distances et
l'loignement gographique n'importaient plus! Et bien, ceci est
formidable, mais  quoi cela nous mne-t-il? Je ne puis communiquer
qu'en anglais mais, heureusement, mon correspondant pouvait utiliser
aussi bien l'anglais que l'allemand qui tait sa langue maternelle.
L'internet a supprim une barrire, celle de la distance, mais il
subsiste la barrire de la langue, bien relle.

Il semble que l'internet propulse simultanment les gens dans deux
directions diffrentes. L'internet, anglophone  l'origine, relie les
gens dans le monde entier. Par l mme, il favorise une langue commune
pour communiquer. Mais il suscite aussi des contacts entre des
personnes de langue diffrente et permet ainsi de dvelopper un intrt
plus grand pour le multilinguisme. Si une langue commune est
apprciable, elle ne remplace en aucun cas la ncessit de plusieurs
langues. L'internet favorise ainsi  la fois une langue commune et le
multilinguisme, et ceci est un facteur qui aide  trouver des
solutions. L'intrt croissant pour les langues et le besoin qu'on en a
stimulent de par le monde la cration de cours de langues et
d'instruments d'aide linguistique, et l'internet fournit la possibilit
de les rendre disponibles rapidement et  bon march.


= Autres expriences

Mme si l'anglais est encore prdominant  la fin des annes 1990, les
sites bilingues ou plurilingues sont de plus en plus nombreux, ce pour
des raisons aussi bien commerciales que culturelles, qui prennent en
compte le fait que tout le monde ne comprend pas l'anglais.

Brian King, directeur du WorldWide Language Institute (WWLI), crit en
septembre 1998: De mme que l'utilisateur non anglophone peut
maintenant avoir accs aux nouvelles technologies dans sa propre
langue, l'impact du commerce lectronique peut constituer une force
majeure qui fasse du multilinguisme la voie la plus naturelle vers le
cyberespace. Les vendeurs de produits et services dans le march
virtuel mondial que devient l'internet doivent tre prpars 
desservir un monde virtuel qui soit aussi multilingue que le monde
physique. S'ils veulent russir, ils doivent s'assurer qu'ils parlent
bien la langue de leurs clients!

Le rseau ELSNET (European Network in Language and Speech) regroupe une
centaine de partenaires acadmiques et commerciaux, l'objectif tant de
mettre sur pied des systmes multilingues pour la langue parle et la
langue crite.

Steven Krauwer, coordinateur d'ELSNET, explique en septembre 1998: En
tant que citoyen europen, je pense que le multilinguisme sur le web
est absolument essentiel.   mon avis, ce n'est pas une situation saine
 long terme que seuls ceux qui ont une bonne matrise de l'anglais
puissent pleinement exploiter les bnfices du web. En tant que
chercheur (spcialis dans la traduction automatique), je vois le
multilinguisme comme un dfi majeur: pouvoir garantir que l'information
sur le web soit accessible  tous, indpendamment des diffrences de
langue. (...) Je compte passer le reste de ma vie professionnelle 
utiliser les technologies de l'information pour supprimer ou au moins
rduire la barrire des langues.

Il ajoute en aot 1999: Je suis de plus en plus convaincu que nous
devons veiller  ne pas aborder le problme du multilinguisme en
l'isolant du reste. Je reviens de France, o j'ai pass de trs bonnes
vacances d't. Mme si ma connaissance du franais est sommaire (c'est
le moins que l'on puisse dire), il est surprenant de voir que je peux
malgr tout communiquer sans problme en combinant ce franais sommaire
avec des gestes, des expressions du visage, des indices visuels, des
schmas, etc. Je pense que le web (contrairement au systme vieillot du
courriel textuel) peut permettre de combiner avec succs la
transmission des informations par diffrents canaux (ou diffrents
moyens), mme si ce processus n'est que partiellement satisfaisant pour
chacun des canaux pris isolment.

Pour un vritable multilinguisme sur le web, Steven Krauwer suggre
plusieurs solutions pratiques: (a) en ce qui concerne les auteurs: une
meilleure formation des auteurs de sites web pour exploiter les
combinaisons possibles permettant d'amliorer la communication en
surmontant la barrire de la langue (et pas seulement par un vernis
superficiel); (b) en ce qui concerne les usagers: des logiciels de
traduction de type AltaVista Translation, dont la qualit n'est pas
frappante, mais qui a le mrite d'exister; (c) en ce qui concerne les
logiciels de navigation: des logiciels de traduction intgre,
particulirement pour les langues non dominantes, et des dictionnaires
intgrs plus rapides  consulter.


= L'affaire de tous

Le multilinguisme est l'affaire de tous, tmoin cet Appel du Comit
europen pour le respect des cultures et des langues en Europe (CERCLE)
qui, diffus en 1998 dans les onze langues officielles de l'Union
europenne (allemand, anglais, danois, espagnol, finlandais, franais,
grec, hollandais, italien, portugais et sudois), dfend une Europe
humaniste, plurilingue et riche de sa diversit culturelle. Le CERCLE
propose aux rviseurs du Trait de l'Union europenne douze amendements
prenant en compte le respect des cultures et des langues.

On lit dans cet Appel que la diversit et le pluralisme linguistiques
ne sont pas un obstacle  la circulation des hommes, des ides et des
marchandises ou services, comme veulent le faire croire certains,
allis objectifs, conscients ou non, de la culture et de la langue
dominantes. C'est l'uniformisation et l'hgmonie qui sont un obstacle
au libre panouissement des individus, des socits et de l'conomie de
l'immatriel, source principale des emplois de demain. Le respect des
langues,  l'inverse, est la dernire chance pour l'Europe de se
rapprocher des citoyens, objectif toujours affich, presque jamais mis
en pratique. L'Union doit donc renoncer  privilgier la langue d'un
seul groupe.

Bruno Didier, webmestre de la bibliothque de l'Institut Pasteur, crit
en aot 1999: L'internet n'est une proprit ni nationale, ni
linguistique. C'est un vecteur de culture, et le premier support de la
culture, c'est la langue. Plus il y a de langues reprsentes dans leur
diversit, plus il y aura de cultures sur l'internet. Je ne pense pas
qu'il faille justement cder  la tentation systmatique de traduire
ses pages dans une langue plus ou moins universelle. Les changes
culturels passent par la volont de se mettre  la porte de celui vers
qui on souhaite aller. Et cet effort passe par l'apprhension de sa
langue. Bien entendu c'est trs utopique comme propos. Concrtement,
lorsque je fais de la veille, je peste ds que je rencontre des sites
norvgiens ou brsiliens sans un minimum d'anglais.

En 2000, le web est multilingue, mais la barrire de la langue est loin
d'avoir disparu. Si toutes les langues sont dsormais reprsentes sur
le web, on oublie trop souvent que de nombreux usagers sont unilingues,
et que mme les polyglottes ne peuvent connatre toutes les langues. Il
importe aussi d'avoir  l'esprit l'ensemble des langues, et pas
seulement les langues dominantes. Il reste  crer des passerelles
entre les communauts linguistiques pour favoriser la circulation des
crits dans d'autres langues, notamment en amliorant la qualit des
logiciels de traduction.



L'ANGLAIS RESTE PRDOMINANT


= Une ralit statistique

L'anglais reste prpondrant et ceci n'est pas prs de disparatre.
Comme indiqu en janvier 1999 par Marcel Grangier, responsable de la
section franaise des services linguistiques centraux de
l'Administration fdrale suisse, cette suprmatie n'est pas un mal en
soi, dans la mesure o elle rsulte de ralits essentiellement
statistiques (plus de PC par habitant, plus de locuteurs de cette
langue, etc.). La riposte n'est pas de "lutter contre l'anglais" et
encore moins de s'en tenir  des jrmiades, mais de multiplier les
sites en d'autres langues. Notons qu'en qualit de service de
traduction, nous prconisons galement le multilinguisme des sites eux-
mmes. La multiplication des langues prsentes sur l'internet est
invitable, et ne peut que bnficier aux changes multiculturels.

Professeur en technologies de la communication  la Webster University
de Genve (Suisse), Henk Slettenhaar insiste tout autant sur la
ncessit de sites bilingues, dans la langue originale et en anglais.
Les communauts locales prsentes sur le web devraient en tout premier
lieu utiliser leur langue pour diffuser des informations, crit-il en
dcembre 1998. Si elles veulent prsenter ces informations  la
communaut mondiale, celles-ci doivent tre disponibles aussi en
anglais. Je pense qu'il existe un rel besoin de sites bilingues. (...)
Mais je suis enchant qu'il existe maintenant tant de documents
disponibles dans leur langue originale. Je prfre de beaucoup lire
l'original avec difficult plutt qu'une traduction mdiocre.

Henk ajoute en aot 1999: A mon avis, il existe deux types de
recherches sur le web. La premire est la recherche globale dans le
domaine des affaires et de l'information. Pour cela, la langue est
d'abord l'anglais, avec des versions locales si ncessaire. La seconde,
ce sont les informations locales de tous ordres dans les endroits les
plus reculs. Si l'information est  destination d'une ethnie ou d'un
groupe linguistique, elle doit d'abord tre disponible dans la langue
de l'ethnie ou du groupe, avec peut-tre un rsum en anglais.

Guy Antoine, crateur de Windows on Haiti, un site de rfrence sur la
culture hatienne, croit en la ncessit de l'anglais en tant que
langue commune. Pour des raisons pratiques, l'anglais continuera de
dominer le web, relate-t-il en novembre 1999. Je ne pense pas que ce
soit une mauvaise chose, en dpit des sentiments rgionalistes qui s'y
opposent, parce que nous avons besoin d'une langue commune permettant
de favoriser les communications  l'chelon international. Ceci dit, je
ne partage pas l'ide pessimiste selon laquelle les autres langues
n'ont plus qu' se soumettre  la langue dominante. Au contraire. Tout
d'abord l'internet peut hberger des informations utiles sur les
langues minoritaires, qui seraient autrement amenes  disparatre sans
laisser de traces. De plus,  mon avis, l'internet incite les gens 
apprendre les langues associes aux cultures qui les intressent. Ces
personnes ralisent rapidement que la langue d'un peuple est un lment
fondamental de sa culture. De ce fait, je n'ai pas grande confiance
dans les outils de traduction automatique qui, s'ils traduisent les
mots et les expressions, ne peuvent gure traduire l'me d'un peuple.
Que sont les Hatiens, par exemple, sans le kreyl (crole pour les non
initis), une langue qui a permis de souder entre elles diverses tribus
africaines transplantes  Hati pendant la priode de l'esclavage?
Cette langue reprsente de manire la plus palpable l'unit de notre
peuple. Elle est toutefois principalement une langue parle et non
crite. A mon avis, le web va changer cet tat de fait plus qu'aucun
autre moyen traditionnel de diffusion d'une langue. Dans Windows on
Haiti, la langue principale est l'anglais, mais on y trouve tout aussi
bien un forum de discussion anim conduit en kreyl. On y trouve
galement des documents sur Hati en franais et dans l'ancien crole
colonial, et je suis prt  publier d'autres documents en espagnol et
dans diverses langues. Je ne propose pas de traductions, mais le
multilinguisme est effectif sur ce site, et je pense qu'il deviendra de
plus en plus la norme sur le web.

Geoffrey Kingscott est directeur gnral de Praetorius, une socit
britannique spcialise en linguistique applique. Il explique en
septembre 1998: Les caractristiques propres au web sont la
multiplicit de gnrateurs de sites et le bas prix de l'mission de
messages. Ceci favorisera donc le multilinguisme au fur et  mesure du
dveloppement du web. Comme celui-ci a vu le jour aux tats-Unis, il
est encore principalement en anglais, mais ce n'est qu'un phnomne
temporaire. Pour expliquer ceci plus en dtail, je dirais que, quand
nous comptions sur l'imprim ou l'audiovisuel (film, tlvision, radio,
vido, cassettes), l'information ou le divertissement que nous
attendions dpendait d'agents (diteurs, stations de tlvision ou de
radio, producteurs de cassettes ou de vidos) qui devaient subsister
commercialement et, dans le cas de la radio-tldiffusion du service
public, avec de svres contraintes budgtaires. Ceci signifie que la
quantit de clients est primordiale, et dtermine la ncessit de
langues autres que l'omniprsent anglais. Ces contraintes disparaissent
avec le web.

Pour ne donner qu'un exemple mineur tir de notre exprience, nous
publions la version imprime de notre magazine Language Today
uniquement en anglais, qui est le dnominateur commun de nos lecteurs.
Quand nous utilisons un article qui tait originellement dans une autre
langue que l'anglais, ou que nous relatons un entretien men dans une
autre langue que l'anglais, nous le traduisons en anglais et nous ne
publions que la version anglaise, pour la raison suivante: le nombre de
pages que nous pouvons imprimer est limit, et dtermin en fonction de
notre clientle (annonceurs et abonns). Par contre, dans notre version
web, nous proposons aussi la version originale.


= Commentaires francophones

Luc dall'Armellina, co-auteur et webmestre d'oVosite, un espace
d'criture hypermdia, crit en juin 2000: L'anglais s'impose sans
doute parce qu'il est devenu la langue commerciale d'change
gnralise; il semble important que toutes les langues puissent
continuer  tre reprsentes parce que chacune d'elle est porteuse
d'une vision "singulire" du monde. La traduction simultane (propose
par AltaVista par exemple) ou les versions multilingues d'un mme
contenu me semblent aujourd'hui les meilleures rponses au danger de
pense unique que reprsenterait une seule langue d'change. Peut-tre
appartient-il aux diteurs des systmes d'exploitation (ou de
navigateurs?) de proposer des solutions de traduction partielle, avec
toutes les limites connues des systmes automatiques de traduction...

Pierre Franois Gagnon, fondateur d'ditel et pionnier de l'dition
littraire francophone en ligne, crit en juillet 2000: Je pense que,
si les diverses langues de la plante vont occuper chacune l'internet
en proportion de leur poids dmographique respectif, la ncessit d'une
langue vhiculaire unique se fera sentir comme jamais auparavant, ce
qui ne fera qu'assurer davantage encore la suprmatie plantaire de
l'anglais, ne serait-ce que du fait qu'il a t adopt dfinitivement
par l'Inde et la Chine. Or la marche de l'histoire n'est pas plus
comprimable dans le d  coudre d'une quelconque quation mathmatique
que le march des options en bourse!

Philippe Loubire, traducteur littraire et dramatique, dnonce pour sa
part la main-mise anglophone sur le rseau. Tout ce qui peut
contribuer  la diversit linguistique, sur internet comme ailleurs,
est indispensable  la survie de la libert de penser, explique-t-il en
mars 2001. Je n'exagre absolument pas: l'homme moderne joue l sa
survie. Cela dit, je suis trs pessimiste devant cette volution. Les
Anglo-saxons vous crivent en anglais sans vergogne. L'immense majorit
des Franais constate avec une indiffrence totale le remplacement
progressif de leur langue par le mauvais anglais des marchands et des
publicitaires, et le reste du monde a parfaitement admis l'hgmonie
linguistique des Anglo-saxons parce qu'ils n'ont pas d'autres horizons
que de servir ces riches et puissants matres. La seule solution
consisterait  recourir  des lgislations internationales assez
contraignantes pour obliger les gouvernements nationaux  respecter et
 faire respecter la langue nationale dans leur propre pays (le
franais en France, le roumain en Roumanie, etc.), cela dans tous les
domaines et pas seulement sur internet. Mais ne rvons pas...

C'est aussi le sentiment de Blaise Rosnay, webmestre du site du Club
des potes, qui crit en janvier 2000: Dans la mesure o la culture
franaise, y compris contemporaine, pourra tre diffuse sans
obstacles, la langue franaise aura la possibilit de rester vivante
sur le rseau. Ses oeuvres, lies au gnie de notre langue, susciteront
ncessairement de l'intrt puisqu'elles sont en prise avec l'volution
actuelle de l'esprit humain. Dans la mesure o il y aura une volont
d'utiliser l'internet comme moyen de partage de la connaissance, de la
beaut, de la culture, toutes les langues, chacune avec leur gnie
propre, y auront leur place. Mais si l'internet, comme cela semble tre
le cas, abandonne ces promesses pour devenir un lieu unique de
transactions commerciales, la seule langue qui y sera finalement parle
sera une sorte de jargon dnaturant la belle langue anglaise, je veux
dire un anglais amoindri  l'usage des relations uniquement
commerciales.

Richard Chotin, professeur  l'cole suprieure des affaires (ESA) de
Lille, rappelle  juste titre que la suprmatie de l'anglais a succd
 celle du franais. Le problme est politique et idologique,
explique-t-il en septembre 2000. C'est celui de l'"imprialisme" de la
langue anglaise dcoulant de l'imprialisme amricain. Il suffit
d'ailleurs de se souvenir de l'"imprialisme" du franais aux 18e et
19e sicles pour comprendre la dficience en langues des tudiants
franais: quand on n'a pas besoin de faire des efforts pour se faire
comprendre, on n'en fait pas, ce sont les autres qui les font.

Bakayoko Bourahima, bibliothcaire de l'cole nationale suprieure de
statistique et d'conomie applique (ENSEA) d'Abidjan (Cte d'Ivoire),
crit en juillet 2000: Pour nous les Africains francophones, le diktat
de l'anglais sur la toile reprsente pour la masse un double handicap
d'accs aux ressources du rseau. Il y a d'abord le problme de
l'alphabtisation qui est loin d'tre rsolu et que l'internet va poser
avec beaucoup plus d'acuit, ensuite se pose le problme de la matrise
d'une seconde langue trangre et son adquation  l'environnement
culturel. En somme,  dfaut de multilinguisme, l'internet va nous
imposer une seconde colonisation linguistique avec toutes les
contraintes que cela suppose. Ce qui n'est pas rien quand on sait que
nos systmes ducatifs ont dj beaucoup de mal  optimiser leurs
performances, en raison, selon certains spcialistes, des contraintes
de l'utilisation du franais comme langue de formation de base. Il est
donc de plus en plus question de recourir aux langues vernaculaires
pour les formations de base, pour "dsenclaver" l'cole en Afrique et
l'impliquer au mieux dans la valorisation des ressources humaines.
Comment faire? Je pense qu'il n'y a pas de chance pour nous de faire
prvaloir une quelconque exception culturelle sur la toile, ce qui
serait de nature tout  fait grgaire. Il faut donc que les diffrents
blocs linguistiques s'investissent beaucoup plus dans la promotion de
leur accs  la toile, sans oublier leurs diffrentes spcificits
internes.

Lucie de Boutiny, romancire, crit en septembre 2000: "Les chiffres de
septembre 2000 montrent que 51% des utilisateurs sont anglo-saxons, et
78% des sites aussi. Les chiffres de cette prpondrance baissent 
mesure qu'augmentent le nombre des internautes de par le monde...
L'anglais va devenir la deuxime langue mondiale aprs la langue
natale, mais il y en aura d'autres. Un exemple: personnellement, 
l'ge de 4 ans, je parlais trois langues alors que je ne savais ni lire
ni crire. Pour parler une langue, il peut suffire d'avoir la chance de
l'couter. On peut esprer que le cosmopolitisme traverse toutes les
classes sociales en raison, par exemple, de l'Union europenne, du
nomadisme des travailleurs, de la facilit de dplacement  l'tranger
des tudiants, de la prsence des chanes TV et sites trangers, etc."

Grard Fourestier, crateur de Rubriques  Bac, un site destin aux
tudiants du premier cycle universitaire, crit en octobre 2000: Je
suis de langue franaise. J'ai appris l'allemand, l'anglais, l'arabe,
mais je suis encore loin du compte quand je surfe dans tous les coins
de la plante. Il serait dommage que les plus nombreux ou les plus
puissants soient les seuls qui "s'affichent" et, pour ce qui est des
logiciels de traduction, il y a encore largement  faire. (...) Pour
l'instant, [il importe] de connatre suffisamment d'anglais et de crer
beaucoup plus encore en franais.


= Des solutions logicielles

Alain Bron, consultant en systmes d'information et crivain, explique
pour sa part en novembre 1999: Il y aura encore pendant longtemps
l'usage de langues diffrentes et tant mieux pour le droit  la
diffrence. Le risque est bien entendu l'envahissement d'une langue au
dtriment des autres, donc l'aplanissement culturel. Je pense que des
services en ligne vont petit  petit se crer pour pallier cette
difficult. Tout d'abord, des traducteurs pourront traduire et
commenter des textes  la demande, et surtout les sites de grande
frquentation vont investir dans des versions en langues diffrentes,
comme le fait l'industrie audiovisuelle.

Tt ou tard, le pourcentage des langues sur le rseau correspondra-t-il
 leur rpartition sur la plante? Rien n'est moins sr  l'heure de la
fracture numrique entre riches et pauvres, entre zones rurales et
zones urbaines, entre rgions favorises et rgions dfavorises, entre
l'hmisphre nord et l'hmisphre sud, entre pays dvelopps et pays en
dveloppement.

Selon Zina Tucsnak, ingnieur d'tudes au laboratoire ATILF (Analyse et
traitement informatique de la langue franaise), interviewe en octobre
2000, "le meilleur moyen serait l'application d'une loi par laquelle on
va attribuer un "quota"  chaque langue. Mais n'est-ce pas une utopie
de demander l'application d'une telle loi dans une socit de
consommation comme la ntre?"

 la mme date, Emmanuel Barthe, documentaliste juridique, exprime un
avis contraire: Des signes rcents laissent penser qu'il suffit de
laisser les langues telles qu'elles sont actuellement sur le web. En
effet, les langues autres que l'anglais se dveloppent avec
l'accroissement du nombre de sites web nationaux s'adressant
spcifiquement aux publics nationaux, afin de les attirer vers
internet. Il suffit de regarder l'accroissement du nombre de langues
disponibles dans les interfaces des moteurs de recherche gnralistes.
Il serait nanmoins utile (et bnfique pour un meilleur quilibre des
langues) de disposer de logiciels de traduction automatique de
meilleure qualit et  trs bas prix sur internet. La rcente mise sur
le web du GDT (Grand dictionnaire terminologique, rdig par l'Office
de la langue franaise du Qubec) va dans ce sens.

Michel Benot, romancier vivant  Montral (Qubec), crit en juin
2000: Lorsqu'un problme affecte une structure, quelle qu'elle soit,
j'ai toujours tendance  imaginer que c'est techniquement que le
problme trouve sa solution. Vous connaissez cette thorie? Si les
Romains avaient trouv le moyen d'enlever le plomb de leur couvert
d'tain, Nron ne serait jamais devenu fou et n'aurait jamais incendi
Rome. Escusi, farfelu? Peut-tre que oui, peut-tre que non. E que
save? L'internet multilingue? Demain, ou aprs-demain au plus. Voyons,
pensez au premier ordinateur, il y a de cela un peu plus que cinquante
ans. Un tage au complet pour faire  peine plus que les quatre
oprations de base. Dans ce temps-l, un bug, c'tait vritablement une
mouche - ou autre insecte - qui s'insrait entre les lecteurs optiques.
De nos jours [en 2000], un carte de 3 cm x 5 cm fait la mme chose. La
traduction instantane: demain, aprs-demain au plus.

C'est aussi l'avis de Pierre Magnenat, responsable de la cellule
gestion et prospective du centre informatique de l'Universit de
Lausanne, qui crit en octobre 2000: La seule solution que je vois
serait qu'un effort majeur et global soit entrepris pour dvelopper des
traducteurs automatiques. Je ne pense pas qu'une quelconque incitation
ou autre quota pourrait empcher la domination totale de l'anglais. Cet
effort pourrait - et devrait - tre initi au niveau des tats, et
disposer des moyens suffisants pour aboutir.

Pierre-Nol Favennec, expert  la direction scientifique de France
Tlcom R&D, souligne en fvrier 2001: Les recherches sur la
traduction automatique devraient permettre une traduction automatique
dans les langues souhaites, mais avec des applications pour toutes les
langues et non les seules dominantes (ex.: diffusion de documents en
japonais, si l'metteur est de langue japonaise, et lecture en breton,
si le rcepteur est de langue bretonne...). Il y a donc beaucoup de
travaux  faire dans le domaine de la traduction automatique et crite
de toutes les langues.



LE FRANAIS SUR LE WEB


= Une nation de langue francophone

En dcembre 1997, Tim Berners-Lee, l'inventeur du World Wide Web (en
1990), dclare  Pierre Ruetschi, journaliste  la Tribune de Genve,
un quotidien suisse: Pourquoi les Francophones ne mettent-ils pas
davantage d'informations sur le web? Est-ce qu'ils pensent que personne
ne veut la lire, que la culture franaise n'a rien  offrir? C'est de
la folie, l'offre est videmment norme.

C'est chose faite dans les annes qui suivent, d'abord par le Qubec,
une rgion dynamique qui dispose d'un accs beaucoup plus facile et
conomique  l'internet les premires annes, et ensuite par la
Francophonie dans son ensemble.

Dbut 1998, les Qubcois, pionniers de l'internet francophone,
attendent de pied ferme l'arrive en masse de sites web franais, y
compris commerciaux. Lors d'un entretien publi par le magazine en
ligne Multimdium, Louise Beaudouin, ministre de la Culture et des
Communications au Qubec, dclare en fvrier 1998: J'attendais depuis
deux ans que la France se rveille. Aujourd'hui, je ne m'en plaindrai
pas.  cette date, le Qubec (avec 6 millions d'habitants) propose
plus de sites web que la France (avec 60 millions d'habitants). La
ministre attribue le retard de la France  deux facteurs: d'une part
les tarifs levs du tlphone (et donc de l'internet, puisque la
connexion s'effectue par le biais de la ligne tlphonique), d'autre
part les transactions commerciales possibles sur le minitel (le
videotex franais) depuis plusieurs annes, ce qui ralentit l'expansion
du commerce lectronique sur l'internet.

C'est l'UREC (Unit rseaux du Centre national de la recherche
scientifique) qui, en France, lance le premier annuaire de sites web
francophones. L'annuaire de l'UREC a pour but de se familiariser avec
le web sans se noyer dans la masse d'informations mondiale, et de
connatre les sites qui petit  petit fleurissent en langue franaise.
Cr dbut 1994, il recense d'abord les sites acadmiques avant de
devenir plus gnraliste. D'autres annuaires voient ensuite le jour,
dont certains dbuts avec l'aide de l'UREC. Le nombre de sites web, y
compris commerciaux, augmente de manire exponentielle, si bien que la
gestion d'un annuaire gnraliste devient difficile. En juillet 1997,
considrant sa mission comme accomplie, l'UREC arrte la mise  jour de
cet annuaire gnraliste, et le remplace par un annuaire spcialis
consacr  l'enseignement suprieur et  la recherche.

Fonde en mars 1970  Niamey (Niger) pour regrouper 21 tats
francophones, l'Agence la Francophonie - qui se prnomme d'abord
l'Agence de coopration culturelle et technique (ACCT) - compte 47
tats francophones en 1997. Cette agence se veut un instrument de
coopration multilatrale ne d'un idal, celui de crer une communaut
qui fasse entendre sa voix dans le concert des nations.

Une Confrence des ministres francophones chargs des inforoutes a lieu
 Montral en mai 1997. Date du 21 mai 1997, la Dclaration de
Montral propose de dvelopper une aire francophone d'ducation, de
formation et de recherche; soutenir la cration et la circulation de
contenus francophones et contribuer  la sauvegarde et  la
valorisation des patrimoines; encourager la promotion de l'aire
francophone de dveloppement conomique; mettre en place une vigie
francophone (veille active); sensibiliser prioritairement la jeunesse
ainsi que les utilisateurs, les producteurs et les dcideurs; assurer
la prsence et la concertation des Francophones dans les instances
spcialises.

Par ailleurs, l'Agence universitaire de la Francophonie (AUF) cre le
rseau internet REFER pour desservir la communaut scientifique et
technique en Afrique, en Asie et en Europe orientale, avec 24 pays
participants en 2002.

Le 20 mars 2010, la Francophonie fte ses quarante ans d'existence.
L'Organisation internationale de la Francophonie (OIF) rassemble
dsormais 70 tats et gouvernements (56 membres et 14 observateurs)
totalisant 870 millions d'habitants, soit 13% de la population
mondiale.

Mais, selon diverses sources, on ne recenserait en fait que 200
millions de Francophones dans le monde, dont 72 millions de locuteurs
partiels. 96,2 millions de Francophones vivraient en Afrique. Le
franais serait la neuvime langue de la plante et 5% des pages
internet seraient rdiges en franais. Tous chiffres  prendre avec
prcaution.

S'il est la langue des pays francophones, le franais est aussi la
deuxime langue utilise dans les organisations internationales. Malgr
la pression anglophone - relle ou suppose selon les cas -, des
Francophones veillent  ce que leur langue ait une place significative
dans le monde, au mme titre que les autres grandes langues de
communication que sont l'anglais, l'arabe, le chinois et l'espagnol. L
aussi, l'optique est aussi bien la dfense d'une langue que le respect
du multilinguisme et de la diversit des peuples.


= Le patrimoine linguistique en ligne

L'internet peut favoriser non seulement l'usage du franais, en cas de
volont politique et culturelle dans ce sens, mais aussi la
transmission du patrimoine linguistique. Un exemple parmi d'autres est
celui des dictionnaires anciens, qui trouvent une nouvelle vie grce au
web.

Ds 1996, le site de l'Institut national de la langue franaise (InaLF)
offre des ressources terminologiques sur le discours littraire des 14e
au 20e sicles (contenu, smantique, thmatique), sur la langue
courante (langue crite, langue parle, argot) et sur le discours
scientifique et technique.

Christiane Jadelot, ingnieur d'tudes  l'INaLF-Nancy, explique en
juin 1998: Les premires pages sur l'INaLF ont t mises sur
l'internet au milieu de l'anne 1996,  la demande de Robert Martin,
directeur de l'INaLF. J'ai particip  la mise sous internet de ces
pages (...). La direction a senti la ncessit urgente de nous faire
connatre par l'internet, que beaucoup d'autres entreprises utilisaient
dj pour promouvoir leurs produits. Nous sommes en effet "Unit de
recherche et de service" et nous avons donc  trouver des clients pour
nos produits informatiss, le plus connu d'entre eux tant la base
textuelle FRANTEXT [sur l'internet depuis dbut 1995, NDLR], ainsi
qu'une maquette du tome 14 du TLF [Trsor de la langue franaise]. Il
tait donc ncessaire de faire connatre l'ensemble de l'INaLF par ce
moyen. Cela correspondait  une demande gnrale.

La base FRANTEXT comprend, en mode interactif, 180 millions de mots-
occurrences provenant d'une collection reprsentative de 3.500 units
textuelles en arts, sciences et techniques des 16e-20e sicles. Dbut
1998, 82 centres de recherche et bibliothques universitaires sont
abonns, en Europe, en Australie, au Japon et au Canada, ce qui
reprsente 1.250 postes de travail ayant accs  la base, avec une
cinquantaine de sessions d'interrogations par jour.

Le Projet ARTFL (ARTFL: American and French Research on the Treasury of
the French Language) est un projet commun du Centre national de la
recherche scientifique (CNRS, France) et de l'Universit de Chicago
(Illinois, tats-Unis).  l'origine, ce projet a pour but de constituer
une base de donnes de 2.000 textes des 13e-20e sicles ayant trait 
la littrature, la philosophie, les arts et les sciences.

En 1998, l'ARTFL travaille  la version en ligne exhaustive de la
premire dition (1751-1772) de l'Encyclopdie ou Dictionnaire raisonn
des sciences, des mtiers et des arts de Diderot et d'Alembert. 72.000
articles rdigs par plus de 140 collaborateurs - dont Voltaire,
Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc. - ont fait de
cette encyclopdie un monumental ouvrage de rfrence pour les arts et
les sciences. Destine  rassembler puis divulguer les connaissances de
l'poque, elle porte la marque des courants intellectuels et sociaux du
18e sicle, et c'est grce  elle qu'ont t propages les ides du
Sicle des Lumires.

L'Encyclopdie comprend 17 volumes de texte - qui reprsentent 18.000
pages et 20.736.912 mots - et 11 volumes de planches.

La base de donnes correspondant au premier volume est accessible en
ligne  titre exprimental. La recherche peut tre effectue par mot,
portion de texte, auteur ou catgorie, ou par la combinaison de ces
critres entre eux. On dispose de renvois d'un article  l'autre, au
moyen de liens permettant d'aller d'une planche au texte ou du texte au
fac-simil des pages originales. L'automatisation complte des
procdures de saisie entrane des erreurs typographiques et des erreurs
d'identification qui sont ensuite corriges au fil des mois. La
recherche d'images par mot, portion de texte ou catgorie est galement
possible dans un deuxime temps.

L'ARTFL travaille aussi  un projet de base de donnes pour le
Dictionnaire de l'Acadmie franaise, dont les diffrentes ditions se
sont chelonnes entre 1694 et 1935. Ce projet inclut la saisie et
l'dition du texte, ainsi que la cration d'un moteur de recherche
spcifique. La premire dition (1694) et la cinquime dition (1798)
du dictionnaire sont les premires  tre disponibles pour une
recherche par mot, puis pour une recherche en texte intgral. Les
diffrentes ditions sont ensuite combines dans une base de donnes
unique, qui permet de juger de l'volution d'un terme en consultant
aussi bien une dition particulire que l'ensemble des ditions.

Les autres projets de l'ARTFL sont la version image de l'dition de
1740 du Dictionnaire historique et critique de Philippe Bayle, le
Roget's Thesaurus de 1911, le Webster's Revised Unabridged Dictionary
de 1913, le Thresor de la langue franaise de Jean Nicot (1606), un
projet multilingue sur La Bible comprenant entre autres La Bible
franaise de Louis Segond (1910), etc.



PREMIERS PROJETS MULTILINGUES


= Travlang

Travlang, site ddi  la fois aux voyages et aux langues, est cr par
Michael C. Martin en 1994 sur le site de son universit alors qu'il
tait tudiant en physique. Devenu chercheur au Lawrence Berkeley
National Laboratory (Californie), Michael Martin poursuit la gestion de
ce site devenu trs populaire.

La section Foreign Languages for Travelers donne la possibilit
d'apprendre les rudiments de soixante langues sur le web. La section
Translating Dictionaries donne accs  des dictionnaires gratuits dans
diverses langues (afrikaans, allemand, danois, espagnol, espranto,
finnois, franais, frison, hollandais, hongrois, italien, latin,
norvgien, portugais et tchque). Ces dictionnaires sont le plus
souvent sommaires et de qualit ingale. Le site offre aussi de
nombreux liens vers des services de traduction, des coles de langue,
des librairies multilingues, etc.

Michael Martin crit en aot 1998: Je pense que le web est un endroit
idal pour rapprocher les cultures et les personnes, et ceci inclut
d'tre multilingue. Notre site Travlang est trs populaire pour cette
raison, et les gens aiment le contact avec d'autres parties du monde.
(...) L'internet est vraiment un outil important pour communiquer avec
des gens avec lesquels on n'aurait pas l'occasion de dialoguer
autrement. J'apprcie vraiment la collaboration gnrale qui a rendu
possibles les pages de Foreign Languages for Travelers. (...) Je pense
que les traductions intgrales informatises vont devenir monnaie
courante, et qu'elles permettront de communiquer  la base avec
davantage de gens. Ceci aidera aussi  amener davantage l'internet au
monde non anglophone.


= Les projets de Tyler

Cre par Tyler Chambers en mai 1994, la Human-Languages Page est un
catalogue dtaill de 1.800 ressources linguistiques dans une centaine
de langues. Ces ressources sont classes dans plusieurs rubriques:
langues et littrature, coles et institutions, ressources
linguistiques, produits et services, organismes, emplois et stages,
dictionnaires et cours de langues.

Tyler Chambers mne aussi un autre projet relatif aux langues,
l'Internet Dictionary Project, un projet coopratif ouvert  tous pour
la constitution de dictionnaires en accs libre sur le web, de
l'anglais vers d'autres langues (allemand, espagnol, franais, italien,
latin et portugais).

Comme expliqu sur le site web, le but de l'Internet Dictionary
Project est de crer des dictionnaires de traduction grce  l'aide des
internautes. Ce site permet aux usagers du monde entier de consulter et
de participer  la traduction de termes anglais dans d'autres langues.
Les listes de termes anglais et leurs correspondants dans d'autres
langues sont ensuite mis  la disposition de tous sur ce site, sans
restriction d'aucune sorte. (...) L'Internet Dictionary Project a
dbut en 1995 pour combler une lacune et procurer des dictionnaires de
traduction gratuits  la communaut des internautes et  tous ceux qui
s'intressent  l'informatique. Non seulement il est trs utile d'avoir
immdiatement accs  des dictionnaires par le World Wide Web, mais
ceci permet aussi le dveloppement de logiciels pouvant tirer parti de
tels dictionnaires, que ce soit des programmes de traduction ou des
vrificateurs d'orthographe ou encore des guides d'apprentissage des
langues. En facilitant la cration de ces dictionnaires en ligne par
des milliers de volontaires, et en les mettant gratuitement  la
disposition de tous, l'Internet Dictionary Project espre imprimer sa
marque sur l'internet et susciter d'autres projets qui seront plus
bnfiques que de gnrer des revenus purement financiers.

Tyler crit en septembre 1998 lors d'un entretien par courriel: Le
multilinguisme sur le web tait invitable bien avant que ce mdium ne
se dveloppe vraiment. Mon premier vrai contact avec l'internet date de
1994, un peu aprs ses dbuts mais bien avant son expansion. 1994 a t
aussi l'anne o j'ai dbut mon premier projet web multilingue [The
Human-Languages Page, NDLR], et il existait dj un nombre significatif
de ressources linguistiques en ligne. Ceci tait antrieur  la
cration de Netscape. Mosaic tait le seul navigateur sur le web, et
les pages web taient essentiellement des documents textuels relis par
des hyperliens. Avec l'amlioration des navigateurs et l'exprience
acquise par les usagers, je ne pense pas qu'il existe une langue
vivante qui ne soit pas maintenant reprsente sur le web, que ce soit
la langue des Indiens d'Amrique ou les dialectes moyen-orientaux. De
mme une plthore de langues mortes peut maintenant trouver une
audience nouvelle avec des rudits et autres spcialistes en ligne. 
ma connaissance, trs peu de jeux de caractres ne sont pas disponibles
en ligne: les navigateurs ont maintenant la possibilit de visualiser
les caractres romains, asiatiques, cyrilliques, grecs, turcs, etc.
Accent Software a un produit appel "Internet avec accents" qui serait
capable de visualiser plus de 30 encodages diffrents. S'il existe
encore des obstacles  la diffusion d'une langue spcifique sur le web,
ceci ne devrait pas durer.

En ce qui concerne les projets en ligne de Tyler: Mon activit en
ligne a t de rendre l'information linguistique accessible  davantage
de gens par le biais de deux de mes projets sur le web [Human-Languages
Page et Internet Dictionary Project, NDLR]. Bien que je ne sois pas
multilingue, ni mme bilingue moi-mme, je suis conscient du fait que
trs peu de domaines ont une importance comparable  celle des langues
et du multilinguisme. L'internet m'a permis de toucher des millions de
personnes et de les aider  trouver ce qu'elles cherchaient, chose que
je suis heureux de faire. (...) Dans l'ensemble, je pense que le web est
important pour la sensibilisation aux langues et pour les questions
culturelles. Dans quel autre endroit peut-on chercher au hasard pendant
vingt minutes et trouver des informations susceptibles de vous
intresser dans trois langues diffrentes sinon plus? Les mdias de
communication rendent le monde plus petit en rapprochant les gens; je
pense que le web est le premier mdium - bien plus que le courrier, le
tlgraphe, le tlphone, la radio ou la tlvision -  rellement
permettre  l'usager moyen de franchir les frontires nationales et
culturelles. (...) Notre monde est dsormais suffisamment petit pour
tenir sur un cran d'ordinateur.

Comment Tyler voit-il l'avenir? Je pense que l'avenir de l'internet
rside dans davantage de multilinguisme, d'exploration et de
comprhension multiculturelles que nous n'en avons jamais vu. Toutefois
l'internet sera seulement le mdium au travers duquel l'information
circule. Comme le papier qui sert de support au livre, l'internet en
lui-mme augmente trs peu le contenu de l'information. Par contre il
augmente normment la valeur de celle-ci dans la capacit qu'il a de
communiquer cette information. Dire que l'internet aiguillonne le
multilinguisme est  mon sens une opinion fausse. C'est la
communication qui aiguillonne le multilinguisme et l'change
multiculturel. L'internet est seulement le mode de communication le
plus rcent qui soit accessible aux gens plus ou moins ordinaires.
L'internet a un long chemin  parcourir avant d'tre omniprsent dans
le monde entier, mais il est vraisemblable que lui-mme ou un mdium de
la mme ligne atteigne ce but. Les langues deviendront encore plus
importantes qu'elles ne le sont quand tout le monde pourra communiquer
 l'chelle de la plante ( travers le web, les discussions, les jeux,
le courrier lectronique, ou toute application appartenant encore au
domaine de l'avenir), mais je ne sais pas si ceci mnera  un
renforcement des attaches linguistiques ou  une fusion des langues
jusqu' ce qu'il n'en subsiste plus que quelques-unes ou mme une
seule. Une chose qui m'apparat certaine est que l'internet sera
toujours la marque de notre diversit, y compris la diversit des
langues, mme si cette diversit diminue. Et c'est une des choses que
j'aime au sujet de l'internet, c'est un exemple  l'chelle mondiale du
dicton: "Cela n'a pas vraiment disparu tant que quelqu'un s'en
souvient." Et les gens se souviennent.

Au printemps 2001, la Human-Languages Page fusionne avec le Languages
Catalog (Catalogue des langues), une section de la WWW Virtual Library,
pour devenir iLoveLanguages. En septembre 2003, iLoveLanguages offre
2.000 ressources linguistiques dans une centaine de langues. Quant 
l'Internet Dictionary Project, faute de temps, Tyler met fin  ce
projet en janvier 2007, tout en laissant les dictionnaires existants
tels quels sur le web pour consultation ou tlchargement.


= NetGlos

NetGlos - abrg de The Multilingual Glossary of Internet Terminology -
est lanc en 1995  l'initiative du WorldWide Language Institute
(WWLI). Il s'agit d'un projet coopratif en treize langues (allemand,
anglais, chinois, croate, espagnol, franais, grec, hbreu,
hollandais/flamand, italien, maori, norvgien et portugais), avec la
participation de nombre de traducteurs et autres professionnels des
langues.

Brian King, directeur du WorldWide Language Institute, explique en
septembre 1998: Bien que l'anglais soit la langue la plus importante
du web et de l'internet en gnral, je pense que le multilinguisme fait
invitablement partie des futures orientations du cyberespace. Voici
quelques lments qui,  mon sens, permettront que le web multilingue
devienne une ralit:

1. <La popularisation des technologies de l'information>. La
technologie des ordinateurs a longtemps t le seul domaine d'une lite
"technicienne",  l'aise  la fois dans des langages de programmation
complexes et en anglais, la langue universelle des sciences et
techniques. Au dpart, les ordinateurs n'ont jamais t conus pour
manier des systmes d'criture ne pouvant tre traduits en ASCII. Il
n'y avait pas de place pour autre chose que les 26 lettres de
l'alphabet anglais dans un systme d'encodage qui,  l'origine, ne
pouvait mme pas reconnatre les accents aigus et les trmas, sans
parler de systmes non alphabtiques comme le chinois. Mais la
tradition a t bouleverse, et la technologie popularise. Des
interfaces graphiques tels que Windows et Macintosh ont acclr le
processus. La stratgie de marketing de Microsoft a consist 
prsenter son systme d'exploitation comme facile  utiliser par le
client moyen. A l'heure actuelle, cette facilit d'utilisation s'est
tendue au-del du PC vers le rseau internet, si bien que mme ceux
qui ne sont pas programmeurs peuvent maintenant insrer des applets
Java dans leurs pages web sans comprendre une seule ligne de
programmation.

2. <La comptition entre les grandes socits pour une part de "march
global">. L'extension de cette popularisation  l'chelon local est
l'exportation des technologies de l'information dans le monde entier.
La popularisation est maintenant effective  l'chelon mondial, et
l'anglais n'est plus ncessairement la langue oblige de l'utilisateur.
Il n'y a plus vraiment de langue indispensable, il y a les langues
propres aux utilisateurs. Une chose est certaine: il n'est plus
ncessaire de comprendre l'anglais pour utiliser un ordinateur, de mme
qu'il n'est plus ncessaire d'avoir un diplme d'informatique. La
demande des utilisateurs non anglophones  - et l'effort entrepris par
les socits de haute technologie se faisant concurrence pour obtenir
les marchs mondiaux - ont fait de la localisation un secteur en
expansion rapide dans le dveloppement des logiciels et du matriel
informatique. Le premier pas a t le passage de l'ASCII  l'ASCII
tendu. Ceci signifie que les ordinateurs commenaient  reconnatre
les accents et les symboles utiliss dans les variantes de l'alphabet
anglais, symboles qui appartenaient le plus souvent aux langues
europennes. Cependant une page ne pouvait tre affiche que dans une
seule langue  la fois.

3. <L'innovation technologique>. L'innovation la plus rcente est
l'Unicode. Bien qu'il soit encore en train d'voluer et qu'il ait tout
juste t incorpor dans les derniers logiciels, ce nouveau systme
d'encodage traduit chaque caractre en 16 octets. Alors que l'ASCII
tendu  huit bits pouvait prendre en compte un maximum de 256
caractres, l'Unicode peut prendre en compte plus de 65.000 caractres
uniques et il a donc la possibilit de traiter informatiquement tous
les systmes d'criture du monde. Les instruments sont maintenant plus
ou moins en place. Ils ne sont pas encore parfaits, mais on peut
dsormais surfer sur le web en utilisant le chinois, le japonais, le
coren, et nombre d'autres langues n'utilisant pas l'alphabet
occidental. Comme l'internet s'tend  des parties du monde o
l'anglais est trs peu utilis, par exemple la Chine, il est naturel
que ce soit le chinois et non l'anglais qui soit utilis. La majorit
des usagers en Chine n'a pas d'autre choix que sa langue maternelle.

Une priode intermdiaire prcde bien sr ce changement. Une grande
partie de la terminologie technique disponible sur le web n'est pas
encore traduite dans d'autres langues. Et, comme nous nous en sommes
rendus compte dans NetGlos, notre glossaire multilingue de la
terminologie de l'internet, la traduction de ces termes n'est pas
toujours facile. Avant qu'un nouveau terme soit accept comme le terme
correct, il y a une priode d'instabilit avec plusieurs candidats en
comptition. Souvent un terme emprunt  l'anglais est le point de
dpart et, dans de nombreux cas, il est aussi le point d'arrive.
Finalement merge un vainqueur qui est ensuite utilis aussi bien dans
les dictionnaires techniques que dans le vocabulaire quotidien de
l'usager non spcialiste. La dernire version de NetGlos est la version
russe, et elle devrait tre disponible dans deux semaines environ [
savoir fin septembre 1998, NDLR]. Elle sera sans nul doute un excellent
exemple du processus dynamique en cours pour la russification de la
terminologie du web.

4. <La dmocratie linguistique>. Dans un rapport de l'UNESCO du dbut
des annes 1950, l'enseignement dispens dans sa langue maternelle
tait considr comme un droit fondamental de l'enfant. La possibilit
de naviguer sur l'internet dans sa langue maternelle pourrait bien tre
son quivalent  l'ge de l'Information. Si l'internet doit vraiment
devenir le rseau mondial qu'on nous promet, tous les usagers devraient
y avoir accs sans problme de langue. Le considrer comme la chasse
garde de ceux qui, par accident historique, ncessit pratique ou
privilge politique, connaissent l'anglais, est injuste  l'gard de
ceux qui ne connaissent pas cette langue.

5. <Le commerce lectronique>. Bien qu'un web multilingue soit
souhaitable sur le plan moral et thique, un tel idal ne suffit pas
pour en faire une ralit  vaste chelle. De mme que l'utilisateur
non anglophone peut maintenant avoir accs aux technologies dans sa
propre langue, l'impact du commerce lectronique peut constituer une
force majeure qui fasse du multilinguisme la voie la plus naturelle
vers le cyberespace. Les vendeurs de produits et services dans le
march virtuel mondial que devient l'internet doivent tre prpars 
traiter avec un monde virtuel qui soit aussi multilingue que le monde
physique. S'ils veulent russir, ils doivent s'assurer qu'ils parlent
bien la langue de leurs clients!

En ce qui concerne le WorldWide Language Institute, quelles sont les
perspectives? Comme l'existence de notre organisme est lie 
l'importance attache aux langues, je pense que son avenir sera
excitant et stimulant. Mais il est impossible de pratiquer
l'autosuffisance  l'gard de nos russites et de nos ralisations. La
technologie change  une allure frntique. L'apprentissage durant
toute la vie est une stratgie que nous devons tous adopter si nous
voulons rester en tte et tre comptitifs. C'est une tche qui est
dj assez difficile dans un environnement anglophone. Si nous ajoutons
 cela la complexit apporte par la communication dans un cyberespace
multilingue et multiculturel, la tche devient encore plus
astreignante. Probablement davantage encore que par le pass, la
coopration est aussi indispensable que la concurrence. Les germes
d'une coopration par le biais de l'internet existent dj. Notre
projet NetGlos dpend du bon vouloir de traducteurs volontaires de
nombreux pays: Canada, tats-Unis, Autriche, Norvge, Belgique, Isral,
Portugal, Russie, Grce, Brsil, Nouvelle-Zlande, etc.  mon avis, les
centaines de visiteurs qui consultent quotidiennement les pages de
NetGlos constituent un excellent tmoignage du succs de ce type de
relations de travail. Les relations de coopration s'accrotront encore
 l'avenir, mais pas ncessairement sur la base du volontariat.


= Logos

Fond en 1979  Modne (Italie) par Rodrigo Vergara, Logos est une
socit de traduction offrant des services dans 35 langues en 1997,
avec 300 traducteurs travaillant sur place et un rseau mondial de
2.500 traducteurs travaillant en free-lance. La moyenne de production
est de 200 textes par jour.

Fin 1997, Logos dcide de mettre tous ses outils professionnels en
accs libre sur le web. Le Logos Dictionary est un dictionnaire
multilingue de 7,5 millions d'entres. La Wordtheque est une base de
donnes multilingue de 328 millions de mots, constitue  partir de
milliers de traductions, notamment des romans et des documents
techniques. La recherche dans la Wordtheque est possible par langue,
par mot, par auteur ou par titre. Linguistic Resources offre un point
d'accs unique  553 glossaires. L'Universal Conjugator propose des
tableaux de conjugaison dans 17 langues.

Annie Kahn, journaliste au quotidien Le Monde, publie le 7 dcembre
1997 un article Les mots pour le dire, dans lequel Robert Vergara
relate: Nous voulions que nos traducteurs aient tous accs aux mmes
outils de traduction. Nous les avons donc mis  leur disposition sur
internet, et tant qu' faire nous avons ouvert le site au public. Cela
nous a rendus trs populaires, nous a fait beaucoup de publicit.
L'opration a drain vers nous de nombreux clients, mais aussi nous a
permis d'toffer notre rseau de traducteurs grce aux contacts tablis
 la suite de cette initiative.

Annie Kahn explique dans le mme article: Le site de Logos est
beaucoup plus qu'un dictionnaire ou qu'un rpertoire de liens vers
d'autres dictionnaires en ligne. L'un des piliers du systme est un
logiciel de recherche documentaire fonctionnant sur un corpus de textes
littraires disponibles gratuitement sur internet. Lorsque l'on
recherche la dfinition ou la traduction d'un mot, "didactique" par
exemple, on trouve non seulement le rsultat recherch, mais aussi une
phrase d'une oeuvre littraire utilisant ce mot (en l'occurrence, un
essai de Voltaire). Un simple clic permet d'accder au texte intgral
de l'oeuvre ou de commander le livre grce  un partenariat avec
Amazon.com, le libraire en ligne bien connu. Il en est de mme avec les
traductions trangres. Si aucun texte utilisant ce mot n'a t trouv,
le systme fonctionne alors comme un moteur de recherche et renvoie aux
sites web concernant ce mot. Pour certains termes, il est propos d'en
entendre la prononciation. Si une traduction manque, le systme fait un
appel au peuple. A chacun d'enrichir la base, les traducteurs de
l'entreprise valident ensuite les traductions proposes.

En 2007, la Wordtheque, devenue la Logos Library, comprend 710 millions
de termes. Conjugation of Verbs, devenu l'Universal Conjugator, propose
des tableaux de conjugaison dans 36 langues. Et Linguistic Resources
offre un point d'accs unique  1.215 glossaires.



DICTIONNAIRES DE LANGUES


= Dictionnaires imprims en ligne

Le premier dictionnaire de langue franaise en accs libre est le
Dictionnaire universel francophone en ligne, qui rpertorie 45.000 mots
et 116.000 dfinitions tout en prsentant sur un pied d'galit, le
franais dit "standard" et les mots et expressions en franais tel
qu'on le parle sur les cinq continents.

Issu de la collaboration entre Hachette et l'AUPELF-UREF (devenu depuis
l'AUF: Agence universitaire de la Francophonie), il correspond  la
partie noms communs du dictionnaire imprim disponible chez Hachette.
L'quivalent pour la langue anglaise est le site Merriam-Webster
OnLine, qui donne librement accs au Collegiate Dictionary et au
Collegiate Thesaurus.

En mars 2000, les 20 volumes de l'Oxford English Dictionary (OED) sont
mis en ligne par l'Oxford University Press (OUP). La consultation du
site est payante. Le dictionnaire bnficie d'une mise  jour
trimestrielle d'environ 1.000 entres nouvelles ou rvises.

Deux ans aprs cette premire exprience, en mars 2002, l'Oxford
University Press met en ligne l'Oxford Reference Online (ORO), une
vaste encyclopdie conue directement pour le web et consultable elle
aussi sur abonnement payant. Avec 60.000 pages et un million d'entres,
elle reprsente l'quivalent d'une centaine d'ouvrages de rfrence.


= Rpertoires de dictionnaires

Le rpertoire Dictionnaires lectroniques est un excellent rpertoire
tabli par la section franaise des Services linguistiques centraux
(SLC-f) de l'Administration fdrale suisse. Cette liste trs complte
de dictionnaires monolingues (allemand, anglais, espagnol, franais,
italien), bilingues et multilingues est complte par des rpertoires
d'abrviations et acronymes et des rpertoires gographiques,
essentiellement des atlas.

Marcel Grangier, responsable de la section franaise des Services
linguistiques centraux, crit en janvier 1999: Travailler sans
internet est devenu tout simplement impossible: au-del de tous les
outils et commodits utiliss (messagerie lectronique, consultation de
la presse lectronique, activits de services au profit de la
profession des traducteurs), internet reste pour nous une source
indispensable et inpuisable d'informations dans ce que j'appellerais
le "secteur non structur" de la toile. Pour illustrer le propos,
lorsqu'aucun site comportant de l'information organise ne fournit de
rponse  un problme de traduction, les moteurs de recherche
permettent dans la plus grande partie des cas de retrouver le chanon
manquant quelque part sur le rseau.

Comment voit-il l'avenir? La multiplication des langues prsentes sur
internet est invitable, et ne peut que bnficier aux changes
multiculturels. Pour que ces changes prennent place dans un
environnement optimal, il convient encore de dvelopper les outils qui
amlioreront la compatibilit. La gestion complte des diacritiques ne
constitue qu'un exemple de ce qui peut encore tre entrepris.

Quelques annes aprs, le rpertoire Dictionnaires lectroniques
rejoint le site de la Confrence des Services de traduction des tats
europens (CST).


= yourDictionary.com

Robert Beard, professeur de langues  la Bucknell University (tats-
Unis), cre d'abord en 1995 A Web of Online Dictionaries (Un web de
dictionnaires en ligne), qui est un rpertoire de dictionnaires en
ligne (avec 800 liens en automne 1998) dans de nombreuses langues,
auquel s'ajoutent d'autres sections: dictionnaires multilingues,
dictionnaires anglophones spcialiss, thsauri et vocabulaires,
grammaires en ligne, et enfin outils linguistiques pour non
spcialistes.

Robert Beard crit en septembre 1998: On a d'abord craint que le web
reprsente un danger pour le multilinguisme, tant donn que l'HTML et
d'autres langages de programmation sont bass sur l'anglais et qu'on
trouve tout simplement plus de sites web en anglais que dans toute
autre langue. Cependant, les sites web que je gre montrent que le
multilinguisme est trs prsent et que le web peut en fait permettre de
prserver des langues menaces de disparition. Je propose maintenant
des liens vers des dictionnaires dans 150 langues et des grammaires
dans 65 langues. De plus, ceux qui dveloppent les logiciels de
navigation manifestent une attention nouvelle pour la diversit des
langues dans le monde, ce qui favorisera la prsence d'un nombre encore
plus grand de sites web dans diffrentes langues.

Robert Beard co-fonde ensuite le portail yourDictionary.com, qui
intgre son site prcdent, avec mise en ligne du portail en fvrier
2000.

Il crit en janvier 2000: Nos nouvelles ides sont nombreuses. Nous
projetons de travailler avec l'Endangered Language Fund aux tats-Unis
et en Grande-Bretagne pour rassembler des fonds pour cette fondation et
nous publierons les rsultats sur notre site. Nous aurons des groupes
de discussion et des bulletins d'information sur les langues. Il y aura
des jeux de langue destins  se distraire et  apprendre les bases de
la linguistique. La page Linguistic Fun [qui propose des lments de
linguistique pour les non initis, NDLR] deviendra un journal en ligne
avec des extraits courts, intressants et mme amusants dans
diffrentes langues, choisis par des experts du monde entier. (...) Si
l'anglais domine encore le web, on voit s'accentuer le dveloppement de
sites monolingues et non anglophones du fait des solutions varies
apportes aux problmes de caractres.

En septembre 2003, yourDictionary.com, devenu un portail de rfrence,
rpertorie plus de 1.800 dictionnaires dans 250 langues, ainsi que de
nombreux outils linguistiques: vocabulaires, grammaires, glossaires,
mthodes de langues, etc. En avril 2007, le rpertoire comprend 2.500
dictionnaires et grammaires dans 300 langues.

Soucieux de servir toutes les langues sans exception, le portail
propose comme prvu l'Endangered Language Repository, une section
spcifique consacre aux langues menaces. Les langues menaces sont
essentiellement des langues non crites, crit Robert Beard en janvier
2000. Un tiers seulement des quelques 6.000 langues existant dans le
monde sont  la fois crites et parles. Je ne pense pourtant pas que
le web va contribuer  la perte de l'identit des langues et j'ai mme
le sentiment que,  long terme, il va renforcer cette identit. Par
exemple, de plus en plus d'Indiens d'Amrique contactent des linguistes
pour leur demander d'crire la grammaire de leur langue et de les aider
 laborer des dictionnaires. Pour eux, le web est un instrument  la
fois accessible et trs prcieux d'expression culturelle.


= Le Grand Dictionnaire terminologique

Le Grand dictionnaire terminologique (GDT) est une initiative majeure
de l'Office qubcois de la langue franaise (OQLF). C'est en effet la
premire fois qu'un organisme propose une base terminologique aussi
importante en accs libre sur le web, en septembre 2000. Le GDT est
prcd par Le Signet, une base terminologique pour les technologies de
l'information, dont les 10.000 fiches bilingues franais-anglais sont
ensuite intgres au GDT.

Le GDT est un dictionnaire bilingue franais-anglais de 3 millions de
termes appartenant au vocabulaire industriel, scientifique et
commercial. Sa mise en ligne est le rsultat d'un partenariat entre
l'OQLF, auteur du dictionnaire, et Semantix, socit spcialise dans
les solutions logicielles linguistiques. vnement clbr par de trs
nombreux linguistes, cette mise en ligne est un succs. Ds le premier
mois, le GDT est consult par 1,3 million de personnes, avec des
pointes de 60.000 requtes quotidiennes. La gestion de la base est
ensuite assure par Convera Canada. En fvrier 2003, les requtes sont
au nombre de 3,5 millions par mois. Une nouvelle version du GDT est
mise en ligne en mars 2003. Sa gestion est dsormais assure par l'OQLF
lui-mme, et non plus par une socit prestataire.


= Eurodicautom et IATE

Gr par le service de traduction de la Commission europenne,
Eurodicautom est une base terminologique multilingue de termes
conomiques, scientifiques, techniques et juridiques permettant de
combiner entre elles les onze langues officielles de l'Union europenne
(allemand, anglais, danois, espagnol, finnois, franais, grec,
hollandais, italien, portugais, sudois), ainsi que le latin, avec une
moyenne de 120.000 consultations par jour en 2003.

Fin 2003, Eurodicautom annonce son intgration dans une base
terminologique plus vaste regroupant les bases terminologiques de
plusieurs institutions de l'Union europenne, notamment EUTERPE, la
base du Parlement europen, et TIS, la base du Conseil de l'Union
europenne. Cette nouvelle base traiterait non plus douze langues  mais
une vingtaine, du fait de l'largissement de l'Union europenne prvu
l'anne suivante pour intgrer plusieurs pays d'Europe de l'Est.

Un projet de base terminologique commune est voqu ds 1999 afin de
renforcer la coopration inter-institutionnelle. Les partenaires de ce
projet sont le Parlement europen, le Conseil de l'Union europenne, la
Commission europenne, la Cour de justice, la Cour des comptes
europenne, le Comit conomique et social europen, le Comit des
rgions, la Banque europenne d'investissement, la Banque centrale
europenne et enfin le Centre de traduction des organes de l'Union
europenne.

La nouvelle base terminologique voit le jour au printemps 2004 sous le
nom de IATE (Inter-Active Terminology for Europe), d'abord pour un
usage interne dans les institutions de l'Union europenne avant de
migrer sur le web en juin 2007 en tant que service public, avec 1,4
million d'entres dans les 23 langues officielles de l'Union
europenne, plus le latin. L'Union europenne est en effet passe de 15
 25 pays membres en mai 2004, pour atteindre 27 pays membres en
janvier 2007, d'o la ncessit de 23 langues officielles au lieu des
11 langues officielles prsentes dans Eurodicautom.

Le site web de IATE est administr par le Centre de traduction des
organes de l'Union europenne  Luxembourg (capitale du pays du mme
nom), pour le compte des partenaires du projet. Comme expliqu dans la
brochure de IATE, elle-mme disponible en 23 langues, les termes sont
introduits dans la base de donnes par les terminologues et les
traducteurs de l'Union europenne sur la base des informations fournies
par les traducteurs, les administrateurs, les juristes-linguistes, les
experts et d'autres sources fiables. En 2009, IATE comprend 8,4
millions de termes, dont  540.000 abrviations et 130.000 expressions.


= WordReference.com

Le site WordReference.com est lanc en 1999 par Michael Kellogg pour
offrir des dictionnaires bilingues gratuits en ligne. En mars 2010,
Michael relate sur son site: L'internet a t un incroyable outil ces
dernires annes pour rassembler des gens du monde entier. L'un des
principaux obstacles  cela reste bien entendu la langue. Le contenu de
l'internet est pour une grande part en anglais et de trs nombreux
usagers lisent ces pages alors que l'anglais est leur deuxime langue
et non leur langue maternelle. De par mes propres expriences avec la
langue espagnole, je sais que de nombreux lecteurs comprennent une
grande partie de ce qu'ils lisent, mais pas la totalit.

J'ai dbut ce site en 1999 pour procurer des dictionnaires bilingues
gratuits en ligne et d'autres outils pour tous sur l'internet. Depuis,
le site s'est progressivement dvelopp pour devenir l'un des sites de
dictionnaires en ligne les plus utiliss, et le principal dictionnaire
en ligne pour les paires de langues anglais-espagnol, anglais-franais,
anglais-italien, espagnol-franais et espagnol-portugais. Ce site est
toujours class sans interruption parmi les 500 sites les plus visits
du web. Aujourd'hui, je suis heureux de continuer  amliorer ces
dictionnaires, les autres outils linguistiques du site et les forums de
langues. J'ai vraiment plaisir  crer de nouvelles fonctionnalits
pour rendre ce site de plus en plus utile.

Les dictionnaires les plus populaires sont le dictionnaire espagnol
(espagnol-anglais et anglais-espagnol), le dictionnaire franais et le
dictionnaire italien. On trouve aussi un dictionnaire allemand, un
dictionnaire russe et un dictionnaire monolingue anglais. Des tableaux
de conjugaison sont disponibles pour l'espagnol, le franais et
l'italien.

Pour l'anglais, on trouve galement des dictionnaires de l'anglais vers
les langues suivantes: arabe, chinois, coren, grec, japonais,
polonais, portugais, roumain, tchque et turc, et vice versa.

Pour l'espagnol, en plus des deux dictionnaires d'Espasa Calpe et
d'Oxford complts par le supplment propre  WordReference.com, on
peut consulter un dictionnaire monolingue espagnol, un dictionnaire
espagnol de synonymes, un dictionnaire espagnol-franais et un
dictionnaire espagnol-portugais.

Pour le franais et l'italien, outre les dictionnaires d'Oxford,
WordReference.com propose deux dictionnaires qui lui sont propres, 
savoir un dictionnaire franais-anglais de 250.000 termes et un
dictionnaire italien-anglais de 200.000 termes.

WordReference.com offre galement des forums linguistiques trs actifs
et de qualit. Si les usagers ont une question sur un problme
linguistique donn, ils peuvent faire une recherche dans les centaines
de milliers de questions prcdentes, avant de poser leur propre
question dans l'un des forums si ncessaire, pour tre aids par des
gens des quatre coins du monde.

WordReference Mini est une version miniature du site qui permet son
intgration dans d'autres sites, par exemple des sites d'apprentissage
de langues.

Une version pour appareil mobile est galement disponible pour
plusieurs dictionnaires: anglais-espagnol, espagnol-anglais, anglais-
franais, franais-anglais, anglais-italien, italien-anglais, avec
d'autres paires de langues  venir.



L'APPRENTISSAGE DES LANGUES


= Quelques expriences

Maria Victoria Marinetti, de nationalit mexicaine, est titulaire d'un
doctorat en ingnierie. Depuis son installation en France, elle est
professeur d'espagnol dans plusieurs entreprises du bassin anncien, en
Haute-Savoie, et galement traductrice.

Elle raconte en aot 1999: J'ai accs  un nombre important
d'informations au niveau mondial, ce qui est trs intressant pour moi.
J'ai galement la possibilit de transmettre ou de recevoir des
fichiers, dans un va-et-vient d'information constant. L'internet me
permet de recevoir ou d'envoyer des traductions gnrales ou techniques
du franais vers l'espagnol et vice versa, ainsi que des textes
espagnols corrigs. Dans le domaine technique ou chimique, je propose
une aide technique, ainsi que des informations sur l'exportation
d'quipes de haute technologie vers le Mexique ou d'autres pays
d'Amrique latine.

Elle ajoute en aot 2001: Depuis notre premier entretien, j'utilise
beaucoup l'internet pour des changes avec ma famille au Mexique et
avec mes amis un peu partout dans le monde. C'est un outil de
communication rapide, agrable et fantastique pour moi. Par contre,
pour l'utilisation d'internet comme outil de tltravail, trs peu
d'entreprises ont le matriel et l'exprience ncessaires pour changer
des donnes dans le travail quotidien, notamment par la voix et l'image
(par exemple pour la formation ou les confrences par l'internet). Pour
ma part, je rencontre ce problme car je souhaite proposer une
tlformation en langue espagnole, en utilisant la voix et l'image.
Mais mes entreprises clientes ne sont pas habitues  utiliser ces
moyens de communication malgr leur caractre pratique (pas de
dplacements  faire) et malgr la fiabilit accrue de ces nouveaux
moyens de communication par l'internet. En conclusion, les socits de
conseil informatique ont encore beaucoup  faire pour familiariser les
entreprises  l'utilisation des nouvelles technologies lies aux
transferts de donnes par l'internet.

Robert Beard, professeur de langues et crateur du portail
yourDictionary.com, crit en septembre 1998: En tant que professeur de
langues, je pense que le web prsente une plthore de nouvelles
ressources disponibles dans la langue tudie, de nouveaux instruments
d'apprentissage (exercices interactifs Java et Shockwave) et de test,
qui sont  la disposition des tudiants quand ceux-ci en ont le temps
ou l'envie, 24 heures par jour et 7 jours par semaine. Aussi bien pour
mes collgues que pour moi, et bien sr pour notre tablissement,
l'internet nous permet aussi de publier pratiquement sans limitation.

Comment voit-il l'avenir? L'internet nous offrira tout le matriel
pdagogique dont nous pouvons rver, y compris des notes de lecture,
exercices, tests, valuations et exercices interactifs plus efficaces
que par le pass, parce que reposant davantage sur la notion de
communication.

Une autre exprience est celle de Russon Wooldridge, professeur au
dpartement des tudes franaises de l'Universit de Toronto (Canada),
qui relate en fvrier 2001: Tout mon enseignement exploite au maximum
les ressources d'internet (le web et le courriel): les deux lieux
communs d'un cours sont la salle de classe et le site du cours, sur
lequel je mets tous les matriaux des cours. Je mets toutes les donnes
de mes recherches des vingt dernires annes sur le web (rdition de
livres, articles, textes intgraux de dictionnaires anciens en bases de
donnes interactives, de traits du 16e sicle, etc.). Je publie des
actes de colloques, j'dite un journal, je collabore avec des collgues
franais, mettant en ligne  Toronto ce qu'ils ne peuvent pas publier
en ligne chez eux. En mai 2000 j'ai organis  Toronto un colloque
international sur "Les tudes franaises valorises par les nouvelles
technologies". (...) Je me rends compte que sans internet mes activits
seraient bien moindres, ou du moins trs diffrentes de ce qu'elles
sont actuellement. Donc je ne vois pas l'avenir sans.


= Des outils pour les enseignants

Depuis ses dbuts en 1989, le Computer in Teaching Initiative (CTI)
Centre for Modern Languages est un centre inclus dans l'Institut des
langues de l'Universit d'Hull (Royaume-Uni) et vise  promouvoir
l'utilisation des ordinateurs dans l'apprentissage et l'enseignement
des langues. Connu sous le nom de CTI Centre, il procure des
informations sur la manire dont l'apprentissage des langues assist
par ordinateur peut tre effectivement intgr  des cours existants,
et il offre un soutien aux professeurs qui utilisent - ou souhaitent
utiliser - l'informatique dans l'enseignement qu'ils dispensent.

June Thompson, responsable du CTI Centre, crit en dcembre 1998: Avec
l'internet, on a la possibilit de favoriser l'utilisation des langues
trangres, et notre organisation ne soutient absolument pas la
suprmatie de l'anglais en tant que langue de l'internet. L'utilisation
de l'internet a apport une nouvelle dimension  notre tche qui
consiste  soutenir les professeurs de langue dans l'utilisation de la
technologie correspondante. Je pense que, dans un avenir proche,
l'utilisation de supports linguistiques sur l'internet va continuer 
se dvelopper en mme temps que d'autres activits lies aux
technologies, par exemple l'utilisation de CD-ROM - certains
tablissements n'ont pas suffisamment de matriel informatique en
rseau. A l'avenir, il me semble que l'utilisation de l'internet jouera
un rle plus grand, mais seulement si ces activits sont  caractre
pdagogique. Notre organisme travaille troitement avec le WELL, qui se
consacre  ces problmes.

Le WELL (Web Enhanced Language Learning) est un projet britannique men
 bien entre 1997 et 2000 pour donner accs  des ressources en ligne
de qualit dans douze langues diffrentes. Slectionnes et dcrites
par des experts, ces ressources sont compltes par des informations et
des exemples sur la manire de les utiliser pour l'enseignement ou
l'apprentissage d'une langue.

Ce projet est l'oeuvre de l'association EUROCALL (European Association
for Computer-Assisted Language Learning), qui regroupe des
professionnels de l'enseignement des langues exerant en Europe et dans
le monde entier. Ses objectifs sont de favoriser l'utilisation des
langues trangres en Europe, encourager une vision europenne de
l'utilisation des technologies pour l'apprentissage des langues, et
enfin promouvoir la cration et la diffusion d'un matriel de qualit.

Un autre projet d'EUROCALL est CAPITAL (Computer-Assisted Pronunciation
Investigation Teaching and Learning), qui regroupe des chercheurs et
praticiens souhaitant utiliser l'informatique dans ce domaine.


= La LINGUIST List

Gre par l'Eastern Michigan University et la Wayne State University,
deux universits des tats-Unis, la LINGUIST List est une liste de
diffusion  destination des linguistes. Les messages reus sont classs
dans diverses rubriques: profession (confrences, associations
linguistiques, programmes, etc.), recherche et soutien  la recherche
(articles, rsums de mmoires, projets, bibliographies, dossiers,
textes), publications, pdagogie, ressources linguistiques (langues,
familles linguistiques, dictionnaires, informations rgionales) et
soutien informatique (polices de caractres et logiciels). La LINGUIST
List propose aussi un centre de documentation virtuel, dnomm Virtual
Library.

Helen Dry, modratrice de la LINGUIST List, explique en aot 1998: La
LINGUIST List, que je modre, a pour politique d'accepter les
informations dans toutes les langues, puisque c'est une liste pour
linguistes. Nous ne souhaitons cependant pas que le message soit publi
dans plusieurs langues, tout simplement  cause de la charge de travail
que cela reprsenterait pour notre personnel de rdaction (nous ne
sommes pas une liste fourre-tout, mais une liste modre: avant d'tre
publi, chaque message est class par nos tudiants-rdacteurs dans une
section comprenant des messages du mme type). Notre exprience nous
montre que pratiquement tout le monde choisit de publier en anglais.
Mais nous relions ces informations  un systme de traduction qui
prsente nos pages dans cinq langues diffrentes. Ainsi un abonn ne
lit LINGUIST en anglais que s'il le souhaite. Nous essayons aussi
d'avoir au moins un tudiant-diteur qui soit rellement multilingue,
afin que les lecteurs puissent correspondre avec nous dans d'autres
langues que l'anglais.



LES LANGUES MINORITAIRES


= La liste de Caoimhn

Contrairement aux clichs vhiculs dans les mdias, l'internet ne
favorise pas forcment l'hgmonie de l'anglais et n'entrane pas la
disparition des langues minoritaires. L'internet peut au contraire
contribuer  protger ces langues, s'il existe une volont politique et
culturelle dans ce sens. En tmoigne l'exprience de Caoimhn.

Caoimhn  Donnale est professeur d'informatique  l'Institut Sabhal
Mr Ostaig, situ sur l'le de Skye, en cosse. Il dispense ses cours
en galique cossais. Il est galement le webmestre du site de
l'institut, qui est bilingue anglais-galique et qui se trouve tre la
principale source d'information mondiale sur le galique cossais. Sur
ce site, il tient  jour la page European Minority Languages, une liste
elle aussi bilingue anglais-galique, avec classement par ordre
alphabtique de langues et par famille linguistique.

Interview en aot 1998, Caoimhn raconte: L'internet a contribu et
contribuera au dveloppement fulgurant de l'anglais comme langue
mondiale. L'internet peut aussi grandement aider les langues
minoritaires. Ceci ne se fera pas tout seul, mais seulement si les gens
choisissent de dfendre une langue. Le web est trs utile pour
dispenser des cours de langues, et la demande est grande.

Prs de trois ans plus tard, en mai 2001, il ajoute: Nos tudiants
utilisent un correcteur d'orthographe en galique et une base
terminologique en ligne en galique. (...) Il est maintenant possible
d'couter la radio en galique (cossais et irlandais) en continu sur
l'internet partout dans le monde. Une ralisation particulirement
importante a t la traduction en galique du navigateur Opera. C'est
la premire fois qu'un logiciel de cette taille est disponible en
galique.

La langue galique est promue par toute une communaut linguistique.
Mais qu'en est-il des langues menaces? En ce qui concerne l'avenir
des langues menaces, l'internet acclre les choses dans les deux
sens. Si les gens ne se soucient pas de prserver les langues,
l'internet et la mondialisation qui l'accompagne acclreront
considrablement la disparition de ces langues. Si les gens se soucient
vraiment de les prserver, l'internet constituera une aide
irremplaable.


= Le site Windows on Haiti

Guy Antoine, crateur de Windows on Haiti, site de rfrence sur la
langue hatienne, relate en novembre 1999: J'ai fait de la promotion
du kreyl (crole hatien) une cause personnelle, puisque cette langue
est le principal lien unissant tous les Hatiens, malgr l'attitude
ddaigneuse d'une petite lite hatienne -  l'influence
disproportionne - vis--vis de l'adoption de normes pour l'criture du
kreyl et le soutien de la publication de livres et d'informations
officielles dans cette langue. A titre d'exemple, il y avait rcemment
dans la capitale d'Hati un Salon du livre de deux semaines,  qui on
avait donn le nom de "Livres en folie". Sur les 500 ouvrages d'auteurs
hatiens prsents lors du salon, il y en avait une vingtaine en
kreyl, ceci dans le cadre de la campagne insistante que mne la France
pour clbrer la Francophonie dans ses anciennes colonies. A Hati cela
se passe relativement bien, mais au dtriment direct de la
Crolophonie.

En rponse  l'attitude de cette minorit hatienne, j'ai cr sur mon
site Windows on Haiti deux forums de discussion exclusivement en
kreyl. Le premier forum regroupe des discussions gnrales sur toutes
sortes de sujets, mais en fait ces discussions concernent
principalement les problmes socio-politiques qui agitent Hati. Le
deuxime forum est uniquement rserv aux dbats sur les normes
d'criture du kreyl. Ces dbats sont assez anims, et un certain
nombre d'experts linguistiques y participent. Le caractre exceptionnel
de ces forums est qu'ils ne sont pas acadmiques. Je n'ai trouv nulle
part ailleurs sur l'internet un change aussi spontan et aussi libre
entre des experts et le grand public pour dbattre dans une langue
donne des attributs et des normes de la mme langue.

En juin 2001, Guy Antoine rejoint l'quipe dirigeante de Mason
Integrated Technologies, une socit dont l'objectif est de crer des
outils permettant l'accessibilit des documents publis dans des
langues dites minoritaires. tant donn l'exprience de l'quipe en la
matire, nous travaillons d'abord sur le crole hatien (kreyl), qui
est la seule langue nationale d'Hati, et l'une des deux langues
officielles (l'autre tant le franais). Cette langue ne peut gure
tre considre comme une langue minoritaire dans les Carabes
puisqu'elle est parle par huit  dix millions de personnes.



DES ENCYCLOPDIES MULTILINGUES


= Des projets prcurseurs

Robert Beard, professeur de langues et co-fondateur du portail
yourDictionary.com, crit en septembre 1998: Le web sera une
encyclopdie du monde faite par le monde pour le monde. Il n'y aura
plus d'informations ni de connaissances utiles qui ne soient pas
disponibles, si bien que l'obstacle principal  la comprhension
internationale et interpersonnelle et au dveloppement personnel et
institutionnel sera lev. Il faudrait une imagination plus dbordante
que la mienne pour prdire l'effet de ce dveloppement sur l'humanit.

Les premires grandes encyclopdies en ligne apparaissent en dcembre
1999 avec WebEncyclo et l'Encyclopaedia Universalis en langue franaise
et Britannica.com en langue anglaise.

WebEncyclo, publi par les ditions Atlas, est la premire grande
encyclopdie francophone en accs libre. La recherche est possible par
mots-cls, thmes, mdias ( savoir les cartes, liens internet, photos
ou illustrations) et ides. Un appel  contribution incite les
spcialistes d'un sujet donn  envoyer des articles, qui sont
regroups dans la section WebEncyclo contributif. Aprs avoir t
libre, l'accs est ensuite soumis  une inscription pralable gratuite.

La version web de l'Encyclopaedia Universalis est mise en ligne  la
mme date, soit un ensemble de 28.000 articles signs par 4.000
auteurs. Si la consultation est payante sur la base d'un abonnement
annuel, de nombreux articles sont en accs libre.

Le site Britannica.com est la premire grande encyclopdie anglophone
en accs libre. Le site web propose l'quivalent numrique des 32
volumes de la 15e dition de l'Encyclopaedia Britannica, paralllement
 la version imprime et  la version CD-ROM, toutes deux payantes. Le
site offre aussi une slection d'articles issus de 70 magazines, un
guide des meilleurs sites, un choix de livres, etc., le tout tant
accessible  partir d'un moteur de recherche unique. En septembre 2000,
le site fait partie des cent sites les plus visits au monde. En
juillet 2001, la consultation devient payante sur la base d'un
abonnement annuel ou mensuel. Fin 2008, Britannica.com annonce
l'ouverture prochaine de son site  des contributeurs extrieurs, avec
inscription obligatoire pour crire et modifier des articles.


= Wikipdia

Issu du terme hawaen wiki (qui signifie: vite, rapide), un wiki est
un site web permettant  plusieurs utilisateurs de collaborer en ligne
sur un mme projet. A tout moment, ces utilisateurs peuvent contribuer
 la rdaction du contenu, modifier ce contenu et l'enrichir en
permanence. Le wiki est utilis par exemple pour crer et grer des
dictionnaires, des encyclopdies ou encore des sites d'information sur
un sujet donn. Le programme prsent derrire l'interface d'un wiki est
plus ou moins labor. Un programme simple gre du texte et des
hyperliens. Un programme labor permet d'inclure des images, des
graphiques, des tableaux, etc. L'encyclopdie wiki la plus connue est
Wikipdia.

Fonde en janvier 2001  l'initiative de Jimmy Wales et de Larry Sanger
(Larry quitte ensuite l'quipe), Wikipdia est une encyclopdie
gratuite crite collectivement et dont le contenu est librement
rutilisable. Elle est immdiatement trs populaire. Sans publicit et
finance par des dons, cette encyclopdie cooprative est rdige par
des milliers de volontaires - appels Wikipdiens, et qui s'inscrivent
sous un pseudonyme - avec possibilit de corriger et complter les
articles, aussi bien les leurs que ceux d'autres contributeurs. Les
articles restent la proprit de leurs auteurs, et leur libre
utilisation est rgie par la licence GFDL (GNU free documentation
license).

En dcembre 2004, Wikipdia compte 1,3 million d'articles rdigs dans
une centaine de langues par 13.000 contributeurs. En dcembre 2006,
Wikipdia compte 6 millions d'articles dans 250 langues, et devient
l'un de dix sites les plus visits du web. En mai 2007, Wikipdia
compte 7 millions d'articles dans 192 langues, dont 1,8 million en
anglais, 589.000 en allemand, 500.000 en franais, 260.000 en portugais
et 236.000 en espagnol. En 2009, Wikipdia fait partie des cinq sites
les plus visits du web.

Fonde en juin 2003, la Wikimedia Foundation gre non seulement
Wikipdia mais aussi Wiktionary, un dictionnaire et thsaurus
multilingue lanc en dcembre 2002, puis Wikibooks (livres et manuels
en cours de rdaction) lanc en juin 2003, auxquels s'ajoutent ensuite
Wikiquote (rpertoire de citations), Wikisource (textes appartenant au
domaine public), Wikimedia Commons (sources multimdia), Wikispecies
(rpertoire d'espces animales et vgtales), Wikinews (site
d'actualits) et enfin Wikiversity (matriel d'enseignement), lanc en
aot 2006.



LOCALISATION ET INTERNATIONALISATION


Peter Raggett, sous-directeur (puis directeur) du Centre de
documentation et d'information (CDI) de l'OCDE (Organisation de
coopration et de dveloppement conomiques), crit en aot 1999: Je
pense qu'il appartient aux organisations et socits europennes
d'offrir des sites web si possible en trois ou quatre langues. 
l'heure de la mondialisation et du commerce lectronique, les socits
ont un march potentiel sur plusieurs pays  la fois. Permettre aux
usagers francophones, germanophones ou nippons de consulter un site web
aussi facilement que les usagers anglophones donnera une plus grande
comptitivit  une firme donne.

Vers la communication sur internet dans toutes les langues..., tel
est le sous-titre de la page d'accueil de Babel, un projet conjoint
d'Alis Technologies et de l'Internet Society lanc en 1997 dans
l'optique d'une internationalisation de l'internet.  cette date, le
site multilingue de Babel (en anglais, allemand, espagnol, franais,
italien, portugais et sudois) propose deux grands secteurs: (a) un
secteur langues, avec trois sections: langues du monde, glossaire
typographique et linguistique, Francophonie; (b) un secteur internet et
multilinguisme, avec deux sections: dvelopper votre site web
multilingue, et codage des critures du monde. Babel propose aussi la
page Palmars des langues de la toile, qui est la premire  donner la
rpartition relle des langues sur le rseau.

Bill Dunlap est le fondateur de Euro-Marketing Associates, une socit
de conseil en marketing qu'il lance en 1985  Paris et San Francisco.
En 1995, il restructure cette socit en service de conseil en ligne
dnomm Global Reach, le but tant de promouvoir les sites web des
entreprises dans d'autres pays, afin d'attirer plus de visiteurs, et
donc d'augmenter les ventes. Cette mthode comprend la traduction d'un
site web dans plusieurs langues, la promotion active du site, et enfin
l'accroissement de la frquentation locale au moyen de bandeaux
publicitaires cibls.

Bill Dunlap explique en dcembre 1998: Il y a trs peu de gens aux
tats-Unis qui sont intresss de communiquer dans plusieurs langues.
Pour la plupart, ils pensent encore que le monde entier parle anglais.
Par contre, en Europe, les pays sont petits, si bien que, depuis des
sicles, une perspective internationale est ncessaire. Depuis 1981,
dbut de mon activit professionnelle, j'ai t impliqu dans la venue
de socits amricaines en Europe. Ceci est pour beaucoup un problme
de langue, puisque leurs informations commerciales doivent tre
disponibles dans les langues europennes pour tre prises en compte en
Europe. Comme le web est devenu populaire en 1995, j'ai donn  ces
activits une dimension "en ligne", et j'en suis venu  promouvoir le
cybercommerce europen auprs de mes compatriotes amricains. (...)

Promouvoir un site est aussi important que le crer, sinon plus. On
doit tre prpar  utiliser au moins autant de temps et d'argent 
promouvoir son site qu'on en a pass  l'origine  le crer. Le
programme Global Reach permet de promouvoir un site dans des pays non
anglophones, afin d'atteindre une clientle plus large... et davantage
de ventes. Une socit a de nombreuses bonnes raisons de considrer
srieusement le march international. Global Reach est pour elle le
moyen d'tendre son site web  de nombreux pays, de le prsenter  des
visiteurs en ligne dans leur propre langue, et de pntrer le rseau de
commerce en ligne prsent dans ces pays.

Bill Dunlap ajoute en juillet 1999: Une fois que la page d'accueil
d'un site est disponible en plusieurs langues, l'tape suivante est le
dveloppement du contenu dans chaque langue. Un webmestre notera
quelles langues attirent plus de visiteurs (et donc plus de ventes) que
d'autres. Ce seront donc dans ces langues que dbutera une campagne de
promotion multilingue sur le web. Paralllement, il est toujours bon de
continuer  augmenter le nombre de langues dans lesquelles un site web
est disponible. Au dbut, seule la page d'accueil traduite en plusieurs
langues suffit, mais ensuite il est souhaitable de dvelopper un
vritable secteur pour chaque langue.

Le World Wide Web Consortium (W3C) est un consortium industriel
international fond en 1994 pour dvelopper les protocoles communs du
web. Le site du W3C propose notamment une section
Internationalization/Localization, qui donne une dfinition des
protocoles utiliss: HTML (hypertext markup language), jeux (de base)
de caractres, nouveaux attributs, HTTP (hypertext transfer protocol),
ngociation de la langue, URL (uniform resource locator) et autres
identificateurs incluant des caractres non ASCII (American standard
code for information interchange). Le site propose aussi des conseils
pour crer un site multilingue.



LA TRADUCTION ASSISTE PAR ORDINATEUR


L'internet tant une source d'information  vocation mondiale, il
semble indispensable d'augmenter fortement les activits de traduction.
Auteur des Chroniques de Cybrie, une chronique hebdomadaire en ligne
des actualits du rseau, Jean-Pierre Cloutier dplore en aot 1999
qu'il se fasse trs peu de traductions des textes et essais importants
qui sont publis sur le web, tant de l'anglais vers d'autres langues
que l'inverse. (...) La nouveaut d'internet dans les rgions o il se
dploie prsentement y suscite des rflexions qu'il nous serait utile
de lire.  quand la traduction des penseurs hispanophones et autres de
la communication?

Cr  Amsterdam (Pays-Bas) par la firme Vorontsoff, Wesseling &
Partners, Aquarius est le premier rpertoire non commercial de
traducteurs et interprtes. En novembre 1998, il comprend 6.100
traducteurs, 800 socits de traduction, 91 domaines d'expertise et 369
combinaisons de langues. Le site permet de localiser particuliers et
socits et de les contacter directement, sans intermdiaire. La
recherche est possible par lieu, par combinaison de langues et par
spcialit.

De plus, depuis dcembre 1997, des logiciels de traduction automatique
sont en accs libre sur le web -  commencer par ceux de SYSTRAN sur
AltaVista - et permettent de traduire en quelques secondes une page web
ou un texte court, avec plusieurs combinaisons de langues possibles. Il
va sans dire que la traduction automatique n'offre pas la qualit de
travail des professionnels de la traduction, et qu'il est prfrable de
faire appel  ces derniers lorsqu'on a le temps et l'argent
ncessaires. Ces logiciels sont toutefois trs pratiques pour obtenir
une traduction approximative en quelques secondes.

De plus en plus utilise, la traduction assiste par ordinateur permet
de coupler traduction automatique et travail du traducteur
professionnel. Elle est une branche de l'ingnierie du langage, tout
comme le traitement de la langue naturelle et la traduction automatique
(traite dans le chapitre suivant).

Lanc en janvier 1999 par la Commission europenne, le site HLTCentral
(HLT: Human Languages Technologies) propose une courte dfinition de
l'ingnierie du langage: L'ingnierie du langage permet de vivre en
toute convivialit avec la technologie. Nous pouvons utiliser notre
connaissance du langage pour dvelopper des systmes capables de
reconnatre  la fois la parole et l'crit, de comprendre un texte
suffisamment en profondeur pour tre capable de slectionner des
informations, de le traduire dans diffrentes langues et de gnrer
aussi bien un discours oral qu'un texte imprim. L'application de ces
technologies nous permet de repousser les limites actuelles de notre
utilisation du langage. Les systmes  commande vocale sont appels 
jouer un rle prpondrant et  faire partie intgrante de notre vie
quotidienne.

Contrairement  la traduction automatique (TA) qui analyse le texte
dans la langue source et gnre automatiquement le texte correspondant
dans la langue cible, sans intervention humaine pendant ce processus,
la traduction assiste par ordinateur (TAO) est base sur l'interaction
entre l'homme et la machine pendant le processus de traduction.

La TAO est par exemple adopte ds le milieu des annes 1990 par le
Bureau des services linguistiques de l'Organisation mondiale de la
sant (OMS)  Genve (Suisse). Ce bureau travaille dans les six langues
officielles de l'organisation: anglais, arabe, chinois, espagnol,
franais et russe.

Des expriences de traduction automatique (TA) sont galement tentes,
 plusieurs reprises, mais les traductions obtenues demandent un
travail de rvision trop important, si bien que, compte-tenu du type de
documents  traduire, la TAO semble bien prfrable.

Au sein de l'OMS, l'Unit de traduction assiste par ordinateur et de
terminologie (CTT) explore les possibilits techniques offertes par les
systmes les plus rcents de TAO, qui reposent sur la notion de
mmoire de traduction.

Comme expliqu sur le site web, ces systmes permettent au traducteur
d'avoir immdiatement accs au patrimoine du "dj traduit" dans lequel
il peut puiser, quitte  rejeter ou modifier les solutions retenues par
ses prdcesseurs, son choix dfinitif venant ensuite enrichir la
mmoire. Ainsi, en archivant la production quotidienne, le traducteur
aurait vite  sa disposition une "mmoire" colossale de solutions
toutes faites  un nombre important de problmes de traduction.

En complment, le CTT utilise aussi plusieurs applications pour
l'archivage lectronique et la recherche en texte intgral,
l'alignement de textes bilingues et multilingues, la gestion de
mmoires de traduction et de bases de donnes terminologiques, et enfin
la reconnaissance vocale.

Bas  Washington, D.C., au sein de l'Organisation panamricaine de la
sant (OPS), le Bureau rgional de l'OMS pour les Amriques utilise par
contre un systme de traduction automatique dvelopp par les
linguistes computationnels, traducteurs et programmeurs de l'OPS.

Le service de traduction utilise SPANAM (de l'espagnol vers l'anglais)
depuis 1980 et ENGSPAN (de l'anglais vers l'espagnol) depuis 1985, ce
qui lui a permis de traiter plus de 25 millions de mots entre 1980 et
1998 dans les deux langues officielles de l'OPS. Le personnel et les
traducteurs extrieurs post-ditent ensuite l'information brute avec un
gain de productivit de 30  50%. Le systme est install sur le rseau
local du sige de l'organisation et dans plusieurs bureaux rgionaux
pour pouvoir tre utilis par le personnel des services techniques et
administratifs. Il est galement diffus auprs d'organismes publics et
d'organismes  but non lucratif aux tats-Unis, en Amrique latine et
en Espagne. Ce systme est plus tard renomm PAHOMTS, avec
l'introduction de nouvelles paires de langues pour le portugais.

Autre exprience, celle de Wordfast. Lanc en 1999 par Yves
Champollion, Wordfast est un logiciel de traduction avec terminologie
disponible en temps rel et contrle typographique. Il est compatible
avec d'autres logiciels trs utiliss comme le WebSphere Translation
Server d'IBM et les logiciels de TMX ou de Trados. Une version
simplifie de Wordfast est tlchargeable gratuitement, avec un manuel
d'utilisation disponible en seize langues.

Wordfast devient au fil des ans le numro un mondial des logiciels de
traduction utilisables sous toute plateforme (Windows, Mac, Linux), et
le numro deux mondial en nombre de ventes (aprs SDL Trados), avec
20.000 clients dans le monde en 2009, dont les Nations Unies, Nomura
Securities, la NASA (National Aeronautics and Space Administration) et
McGraw-Hill.



LA TRADUCTION AUTOMATIQUE


= Dfinition

Un logiciel de traduction automatique (TA) analyse le texte dans la
langue  traduire (langue source) et gnre automatiquement le texte
dans la langue dsire (langue cible), en utilisant des rgles prcises
pour le transfert de la structure grammaticale. L'tre humain
n'intervient pas au cours du processus, contrairement  la traduction
assiste par ordinateur (TAO), qui implique une interaction entre
l'homme et la machine.

Si la traduction automatique reste trs approximative, les logiciels de
traduction sont toutefois trs pratiques pour fournir un rsultat
immdiat et  moindres frais sinon gratuit. Ces logiciels n'ont cess
de s'amliorer au fil des ans, sans toutefois avoir la prtention
d'galer le travail du cerveau humain. De plus, depuis dcembre 1997,
des logiciels en accs libre sur le web permettent de traduire en
quelques secondes une page web ou un texte court, avec plusieurs
combinaisons de langues possibles.

SYSTRAN, socit franco-amricaine pionnire dans le traitement
automatique des langues, explique sur son site web: Un logiciel de
traduction automatique traduit une langue naturelle dans une autre
langue naturelle. La traduction automatique prend en compte la
structure grammaticale de chaque langue et elle utilise des rgles pour
transfrer la structure grammaticale de la langue source (texte 
traduire) vers la langue cible (texte traduit). La traduction
automatique ne remplace pas et n'est pas destine  remplacer le
traducteur humain.

L'EAMT (European Association for Machine Translation) donne pour sa
part la dfinition suivante: La traduction automatique (TA) est
l'utilisation de l'ordinateur pour la traduction de textes d'une langue
naturelle  une autre. Elle fut un des premiers domaines de recherche
en informatique. Il s'est avr que cet objectif tait difficile 
atteindre. Cependant il existe aujourd'hui un certain nombre de
systmes produisant un rsultat qui, s'il n'est pas parfait, est de
qualit suffisante pour tre utile dans certaines applications
spcifiques, en gnral dans le domaine de la documentation technique.
De plus, les logiciels de traduction, qui sont essentiellement destins
 aider le traducteur humain  produire des traductions, jouissent
d'une popularit croissante auprs d'organisations de traduction
professionnelles.


= Historique

L'intressant historique donn sur le site de Globalink, une socit
spcialise dans les logiciels et services de traduction (disparue
depuis), est rsum dans les paragraphes suivants.

Ds leurs dbuts, la traduction automatique et le traitement de la
langue naturelle progressent de pair avec l'volution de l'informatique
quantitative. Pendant la Seconde guerre mondiale, le dveloppement des
premiers ordinateurs programmables est acclr par les premiers
efforts cryptographiques pour tenter de fissurer les codes secrets
allemands et autres codes de guerre. Suite  la guerre, la traduction
et l'analyse du texte en langue naturelle procurent une base de travail
au secteur mergent de la thorie de l'information.

Pendant les annes 1950, la recherche sur la traduction automatique
prend forme au sens de traduction littrale (mot  mot) sans utiliser
de rgles linguistiques. Le projet dbut  l'Universit de Georgetown
au dbut des annes 1950 reprsente la premire tentative systmatique
pour crer un systme de traduction automatique utilisable pour le
russe.

Jusqu'au milieu des annes 1960, plusieurs projets de recherche aussi
bien universitaires que gouvernementaux sont mens aux tats-Unis et en
Europe. Au mme moment, les progrs rapides dans le domaine de la
linguistique thorique culminent en 1965 avec la publication du livre
Aspects de la thorie syntaxique de Noam Chomsky, et transforment
radicalement les concepts permettant de comprendre la phonologie, la
morphologie, la syntaxe et la smantique du langage humain.

En 1966, le rapport ALPAC (Automatic Language Processing Advisory
Committee) remis au gouvernement des tats-Unis fait une estimation
prmaturment ngative de la valeur des systmes de traduction
automatique et des perspectives sur leurs applications pratiques,
mettant ainsi fin au financement et  l'exprimentation dans ce domaine
pour la dcennie suivante.

Il faut attendre la fin des annes 1970 pour que des expriences
srieuses soient  nouveau entreprises, paralllement aux progrs de
l'informatique et des technologies des langues. Cette priode voit le
dveloppement de systmes de transfert d'une langue  l'autre et le
lancement des premires tentatives commerciales. Des socits comme
SYSTRAN et METAL sont persuades de l'utilit et de la viabilit d'un
tel march. Elles mettent sur pied des produits et services de
traduction automatique relis  un serveur central.

Mais les problmes restent nombreux, par exemple des cots levs de
dveloppement, un norme travail lexicographique, la difficult de
proposer de nouvelles combinaisons de langues, l'inaccessibilit de
tels systmes pour l'utilisateur moyen, et enfin la difficult de
passer  de nouveaux stades de dveloppement.


= Quelques avis

Contrairement aux prvisions optimistes des annes 1950 annonant
l'apparition imminente de la machine  traduire universelle, les
systmes de traduction automatique ne produisent pas encore de
traductions de bonne qualit. Pourquoi? Pierre Isabelle et Patrick
Andries, du laboratoire RALI (Laboratoire de recherche applique en
linguistique informatique)  Montral (Qubec), expliquent ce chec
dans La traduction automatique, 50 ans aprs, un article publi en 1998
dans les dossiers du magazine en ligne Multimdium.

Ils crivent: L'objectif ultime de construire une machine capable de
rivaliser avec le traducteur humain n'a cess de fuir par devant les
lentes avances de la recherche. Les approches traditionnelles  base
de rgles ont conduit  des systmes qui tendent  s'effondrer sous
leur propre poids bien avant de s'lever au-dessus des nuages de
l'ambigut smantique. Les approches rcentes  base de gros ensembles
de textes, appels corpus - qu'elles soient fondes sur les mthodes
statistiques ou les mthodes analogiques - promettent bien de rduire
la quantit de travail manuel requise pour construire un systme de TA
[traduction automatique], mais il est moins sr qu'elles promettent des
amliorations substantielles de la qualit des traductions machine.

Reprenant les ides de Yehochua Bar-Hillel exprimes dans The State of
Machine Translation, un article publi en 1951, Pierre Isabelle et
Patrick Andries dfinissent trois stratgies d'application de la
traduction automatique: (a) une aide pour balayer la production
crite et fournir des traductions approximatives; (b) des situations de
sous-langues naturelles simples, comme l'implantation russie en 1977
du systme METEO qui traduit les prvisions mtorologiques du
ministre de l'Environnement canadien; (c) et enfin, pour de bonnes
traductions de textes complexes, le couplage de l'humain et de la
machine avant, pendant et aprs le processus de traduction automatique,
un couplage qui n'est pas forcment conomique compar  la traduction
traditionnelle.

Les auteurs penchent plus pour un poste de travail pour le traducteur
humain que pour un traducteur robot. Ils expliquent: Les recherches
rcentes sur les mthodes probabilistes ont permis de dmontrer qu'il
tait possible de modliser d'une manire extrmement efficace certains
aspects simples du rapport traductionnel entre deux textes. Par
exemple, on a mis au point des mthodes qui permettent de calculer le
bon "appariement" entre les phrases d'un texte et de sa traduction,
c'est--dire d'identifier  quelle(s) phrase(s) du texte d'origine
correspond chaque phrase de la traduction. Appliques  grande chelle,
ces techniques permettent de constituer,  partir des archives d'un
service de traduction, un mmoire de traduction qui permettra souvent
de recycler des fragments de traductions antrieures. Des systmes de
ce genre ont dj commenc  apparatre sur le march (Translation
Manager II de IBM, Translator's Workbench de Trados, TransSearch du
RALI, etc.). Les recherches les plus rcentes se concentrent sur des
modles capables d'tablir automatiquement les correspondances  un
niveau plus fin que celui de la phrase: syntagmes et mots. Les
rsultats obtenus laissent entrevoir toute une famille de nouveaux
outils pour le traducteur humain, dont les aides au dpouillement
terminologique, les aides  la dicte et  la frappe des traductions
ainsi que les dtecteurs de fautes de traduction.

Fond en 1990, Globalink est une socit spcialise dans les logiciels
et services de traduction. Elle offre des solutions sur mesure  partir
d'une gamme de logiciels, options en ligne et services de traduction
professionnelle. La socit diffuse ses logiciels de traduction en
allemand, anglais, espagnol, franais, italien et portugais, et propose
des solutions aux problmes de traduction des particuliers, petites
socits, multinationales et gouvernements, que ce soit pour un produit
individuel donnant une traduction prliminaire rapide ou un systme
complet permettant de grer des traductions de documents
professionnels.

Le site web donne les informations suivantes en 1998: Avec les
logiciels d'application de Globalink, l'ordinateur utilise trois
ensembles de donnes: le texte  traiter, le programme de traduction et
un dictionnaire de mots et d'expressions dans la langue-source, ainsi
que des informations sur les concepts voqus par le dictionnaire et
les rgles applicables  la phrase: rgles de syntaxe et de grammaire,
y compris des algorithmes gouvernant la conjugaison des verbes,
l'adaptation de la syntaxe, les accords de genre et de nombre et la
mise en ordre des mots. Une fois que l'utilisateur a slectionn le
texte et lanc le processus de traduction, le programme commence 
comparer les mots du texte  traiter avec ceux qui sont stocks dans le
dictionnaire. Une fois l'adquation trouve, l'application prpare une
notice complte qui inclut des informations sur les significations
possibles du mot et, d'aprs le contexte, ses relations avec les autres
mots dans la mme phrase. Le temps requis pour la traduction dpend de
la longueur du texte. Un document de trois pages et 750 mots demande un
traitement de trois minutes environ pour une premire traduction.

En septembre 1998, Randy Hobler, consultant en marketing internet
auprs de Globalink, est rsolument optimiste: Nous arriverons
rapidement au point o une traduction trs fidle du texte et de la
parole sera si commune qu'elle pourra faire partie des plateformes ou
mme des puces. A ce stade, lorsque le dveloppement de l'internet aura
atteint sa vitesse de croisire, lorsque la fidlit de la traduction
atteindra plus de 98% et lorsque les diffrentes combinaisons de
langues possibles auront couvert la grande majorit du march, la
transparence de la langue -  savoir toute communication d'une langue 
une autre - sera une vision trop restrictive pour ceux qui vendent
cette technologie. Le dveloppement suivant sera la "transparence
transculturelle et transnationale" dans laquelle les autres aspects de
la communication humaine, du commerce et des transactions au-del du
seul langage entreront en scne. Par exemple, les gestes ont un sens,
les mouvements faciaux ont un sens, et ceci varie en fonction des
normes sociales d'un pays  l'autre. La lettre O ralise avec le pouce
et l'index signifie "OK" aux tats-Unis alors qu'en Argentine c'est un
geste obscne.

Quand se produira l'invitable dveloppement de la vidoconfrence
multilingue multimdia, il sera ncessaire de corriger visuellement les
gestes. Le Media Lab du MIT [Massachusetts Institute of Technology],
Microsoft et bien d'autres travaillent  la reconnaissance informatique
des expressions faciales, l'identification des caractristiques
biomtriques par le biais du visage, etc. Il ne servira  rien  un
homme d'affaires amricain de faire une excellente prsentation  un
Argentin lors d'une vidoconfrence multilingue sur le web, avec son
discours traduit dans un espagnol argentin parfait, s'il fait en mme
temps le geste O avec le pouce et l'index. Les ordinateurs pourront
intercepter ces gestes et les corriger visuellement. Les cultures
diffrent de milliers de faons, et la plupart de leurs codes peuvent
tre modifis par voie informatique lorsqu'on passe de l'un  l'autre.
Ceci inclut les lois, les coutumes, les habitudes de travail,
l'thique, le change montaire, les diffrences de taille dans les
vtements, les diffrences entre le systme mtrique et le systme de
mesure anglophone, etc. Les firmes dynamiques rpertorieront et
programmeront ces diffrences, et elles vendront des produits et
services afin d'aider les habitants de la plante  mieux communiquer
entre eux. Une fois que ces produits et services seront largement
rpandus, ils contribueront rellement  une meilleure comprhension 
l'chelle internationale.

D'autres sont moins enthousiastes.

Franois Vadrot, directeur de FTPress (French Touch Press), socit de
presse en ligne, crit en mai 2000: Peut-on rellement penser que
toute la population du monde va communiquer dans tous les sens? Peut-
tre? Via des systmes de traduction instantane, par crit ou par
oral? J'ai du mal  imaginer qu'on verra de sitt des outils capables
de translater les subtilits des modes de pense propres  un pays: il
faudrait pour lors traduire, non plus du langage, mais tablir des
passerelles de sensibilit. A moins que la mondialisation n'uniformise
tout cela?

Alex Andrachmes, producteur audiovisuel, crivain et explorateur
d'hypertexte, est tout aussi dubitatif. Il crit en dcembre 2000:
J'attends les fameuses traductions simultanes en direct-live... On
nous les annonce avec les nouveaux processeurs ultra-puissants, mais on
nous les annonait dj pour cette gnration-ci de processeurs. Alors,
le genre: vous/rserv/avion/de le/november 17-2000... Non merci. Plus
tard peut-tre.

Les progrs sont toutefois rapides et permettent de rver  des
applications simples et universelles. Tel est le souhait de Tim
McKenna, crivain et philosophe, qui crit en octobre 2000: Quand la
qualit des logiciels sera suffisante pour que les gens puissent
converser sur le web par crit ou par oral en temps rel dans
diffrentes langues, nous verrons tout un monde s'ouvrir  nous. Les
scientifiques, les hommes politiques, les hommes d'affaires et bien
d'autres groupes seront  mme de communiquer immdiatement entre eux
sans l'intermdiaire de mdiateurs ou traducteurs.


= Un march en 2000

En 2000, la gnralisation de l'internet et du commerce lectronique
entrane le dveloppement d'un vritable march, avec les produits et
services des socits SYSTRAN, Alis Technologies, Lernout & Hauspie,
Globalink et Softissimo, etc., avec des  gammes de produits ciblant le
grand public, les professionnels et les industriels.

SYSTRAN (acronyme de: System Translation), pionnier dans le traitement
automatique des langues, est l'auteur du premier logiciel de traduction
gratuit du web, lanc en dcembre 1997. AltaVista Translation, appel
aussi Babel Fish, traduit les pages web de l'anglais vers les langues
suivantes : allemand, franais, espagnol, italien et portugais, et vice
versa. Le sige de SYSTRAN est situ  Soisy-sous-Montmorency (France).
Sa succursale, situe  La Jolla (Californie), assure les ventes et le
marketing, ainsi qu'une partie de la R&D (recherche et dveloppement).

Base  Montral (Qubec), Alis Technologies dveloppe et commercialise
des solutions et services de traitement linguistique au moyen de
logiciels de traduction qui transforment des systmes informatiques
unilingues en outils multilingues.

Bas  Ypres (Belgique) et Burlington (Massachusetts, tats-Unis),
Lernout & Hauspie (rachet ensuite par ScanSoft) propose des produits
et services en dicte, traduction, compression vocale, synthse vocale
et documentation industrielle. Les technologies couvertes incluent la
reconnaissance automatique de la langue, la compression numrique de la
parole, le passage du texte  la parole, et la traduction. Les produits
manant des trois premires technologies sont vendus aux grandes
socits des industries suivantes: tlcommunications, informatique,
multimdia, lectronique grand public et lectronique automotrice. Les
services de traduction sont  destination des socits en technologies
de l'information, des marchs verticaux et des marchs
d'automatisation.

De plus, le Machine Translation Group form par Lernout & Hauspie
comprend des entreprises qui dveloppent, produisent et vendent des
systmes de traduction: L&H Language Technology, AppTek, AILogic,
NeocorTech et Globalink.

La socit Softissimo commercialise la srie de logiciels de traduction
Reverso,  ct de produits d'criture multilingue, de dictionnaires
lectroniques et de mthodes de langues. Reverso est utilis par
exemple par Voil, le moteur de recherche de France Tlcom. Softissimo
diffuse aussi des logiciels d'apprentissage des langues, ainsi que des
dictionnaires, notamment l'Eurodico, le Grand Collins bilingue et le
Collins English Dictionary.

En mars 2001, IBM se lance dans un march en pleine expansion avec un
produit professionnel haut de gamme, le WebSphere Translation Server.
Ce logiciel traduit instantanment en plusieurs langues (allemand,
anglais, chinois, coren, espagnol, franais, italien, japonais) les
pages web, courriels et chats (dialogues en direct). Il interprte 500
mots  la seconde et permet l'ajout de vocabulaires spcifiques.


= L'UNL, mtalangage numrique

Dvelopp  Tokyo (Japon) sous l'gide de l'Institute of Advanced
Studies (IAS) de l'Universit des Nations Unies (UNU), l'UNL (universal
networking language) est un projet de mtalangage numrique pour
l'encodage, le stockage, la recherche et la communication
d'informations multilingues. Il s'agirait d'une interlangue formant une
passerelle entre une langue source et une langue cible et offrant ainsi
une solution au problme de communication pos par la barrire des
langues.

Ce mtalangage est dvelopp  partir de janvier 1997 au sein de l'UNL
Program, un programme international impliquant de nombreux partenaires
dans toutes les communauts linguistiques. En 1998, 120 chercheurs de
par le monde travaillent sur un projet multilingue comportant seize
langues (allemand, anglais, arabe, brsilien, chinois, espagnol,
franais, hindou, indonsien, italien, japonais, letton, mongolien,
russe, swahili et tha).

Ce programme se poursuit ensuite sous l'gide de la Fondation UNDL
(Universal Networking Digital Language), cre en janvier 2001 pour
dvelopper et promouvoir le projet UNL, avec un sige social  Genve
(Suisse). En 2004, la Fondation UNDL est accrdite par les Nations
Unies en tant qu'organisation non gouvernementale (ONG).

Comme expliqu dans un des wikis du projet en 2010, l'UNL est une
langue artificielle cre pour prendre en compte les informations et
connaissances vhicules par les langues humaines. Elle est dote de
composantes lexicales, grammaticales et smantiques, comme les langues
naturelles. Couple  l'intelligence artificielle, l'UNL facilite la
communication entre l'homme et la machine, et par le biais de la
machine, entre tous les peuples dans la langue maternelle de chacun.
Notre premire tche est de complter le systme UNL. Ensuite, le
mettre au service des toutes les nations.



CHRONOLOGIE


Cette chronologie ne prtend pas  l'exhaustivit. Subjective, elle
vise seulement  souligner quelques grandes tapes. Chaque ligne dbute
par l'anne ou bien l'anne/mois. Par exemple, 1971/07 signifie juillet
1971.

  1968: Le code ASCII est le premier systme d'encodage informatique.
  1971/07: Le Projet Gutenberg est la premire bibliothque numrique.
  1974: L'internet fait ses dbuts.
  1990: Le web est invent par Tim Berners-Lee.
  1991/01: L'Unicode est un systme d'encodage pour toutes les langues.
  1993/11: Mosaic est le premier logiciel de navigation sur le web.
  1994: Travlang est un site consacr aux langues et aux voyages.
  1994/04: La Human-Languages Page est un catalogue de ressources
           linguistiques.
  1994/10: Le World Wide Web Consortium offre des outils pour un web
           multilingue.
  1995: L'Internet Dictionary Project lance des dictionnaires de
        traduction gratuits.
  1995: NetGlos est un glossaire multilingue pour la terminologie de
        l'internet.
  1995: Global Reach est une socit de conseil pour la localisation
        des sites.
  1995: L'Ethnologue est disponible gratuitement sur le web.
  1995/12: La Kotoba Home Page explique comment afficher plusieurs
           langues.
  1996/04: OneLook Dictionaries offre un point commun pour consulter
           des dictionnaires.
  1997/01: L'UNL (universal networking language) est un projet de
           mtalangage numrique.
  1997: Le Logos Dictionary est mis en ligne gratuitement.
  1997/12: AltaVista lance AltaVista Translation, appel aussi Babel
           Fish.
  1999: WordReference.com propose des dictionnaires bilingues gratuits.
  1999: Wordfast propose son premier logiciel de traduction.
  1999/12: WebEncyclo est la premire grande encyclopdie francophone
           en ligne.
  1999/12: Britannica.com est la premire grande encyclopdie
           anglophone en ligne.
  2000/02: yourDictionary.com est un portail pour les dictionnaires.
  2000/07: La moiti des usagers de l'internet est non anglophone.
  2000/09: Le Grand dictionnaire terminologique (GDT) est bilingue
           franais-anglais.
  2001/01: Wikipdia est la premire grande encyclopdie collaborative
           multilingue.
  2001/01: L'UNL est dsormais dvelopp au sein de la Fondation UNDL.
  2001/04: La Human-Languages Page devient le portail iLoveLanguages.
  2004/01: Le Projet Gutenberg Europe propose une interface
           multilingue.
  2007/03: IATE est la base terminologique multilingue europenne.
  2009: La nouvelle dition (16e) de l'Ethnologue recense 6.909
        langues.



REMERCIEMENTS


Ce livre doit beaucoup  toutes les personnes ayant accept de rpondre
 mes questions au fil des ans. Certains entretiens sont disponibles en
ligne sur le NEF (Net des tudes franaises), Universit de Toronto
<www.etudes-francaises.net/entretiens/>. D'autres entretiens ont t
directement inclus dans ce livre ou alors ils ont inspir des ides
dveloppes dans ces pages.

Merci  Nicolas Ancion, Alex Andrachmes, Guy Antoine, Silvaine Arabo,
Arlette Attali, Marc Autret, Isabelle Aveline, Jean-Pierre Balpe,
Emmanuel Barthe, Robert Beard, Michael Behrens, Michel Benot, Guy
Bertrand, Olivier Bogros, Christian Boitet, Bernard Boudic, Bakayoko
Bourahima, Marie-Aude Bourson, Lucie de Boutiny, Anne-Ccile
Brandenbourger, Alain Bron, Patrice Cailleaud, Tyler Chambers, Pascal
Chartier, Richard Chotin, Alain Clavet, Jean-Pierre Cloutier, Jacques
Coubard, Luc Dall'Armellina, Kushal Dave, Cynthia Delisle, milie
Devriendt, Bruno Didier, Catherine Domain, Helen Dry, Bill Dunlap,
Pierre-Nol Favennec, Grard Fourestier, Pierre Franois Gagnon,
Olivier Gainon, Jacques Gauchey, Raymond Godefroy, Muriel Goiran,
Marcel Grangier, Barbara Grimes, Michael Hart, Michael Kellogg, Roberto
Hernndez Montoya, Randy Hobler, Eduard Hovy, Christiane Jadelot,
Grard Jean-Franois, Jean-Paul, Anne-Bndicte Joly, Michael Kellogg,
Brian King, Geoffrey Kingscott, Steven Krauwer, Galle Lacaze, Michel
Landaret, Hlne Larroche, Pierre Le Loarer, Claire Le Parco, Annie Le
Saux, Fabrice Lhomme, Philippe Loubire, Pierre Magnenat, Xavier
Malbreil, Alain Marchiset, Maria Victoria Marinetti, Michael Martin,
Tim McKenna, Emmanuel Mnard, Yoshi Mikami, Jacky Minier, Jean-Philippe
Mouton, John Mark Ockerbloom, Caoimhn  Donnale, Jacques Pataillot,
Alain Patez, Nicolas Pewny, Marie-Joseph Pierre, Herv Ponsot, Olivier
Pujol, Anissa Rachef, Peter Raggett, Patrick Rebollar, Philippe Renaut,
Jean-Baptiste Rey, Philippe Rivire, Blaise Rosnay, Bruno de Sa
Moreira, Pierre Schweitzer, Henk Slettenhaar, Murray Suid, June
Thompson, Zina Tucsnak, Franois Vadrot, Christian Vandendorpe, Robert
Ware, Russon Wooldridge et Denis Zwirn.


Copyright  2010 Marie Lebert. Tous droits rservs.







End of the Project Gutenberg EBook of Les langues sur le web, by Marie Lebert

*** END OF THIS PROJECT GUTENBERG EBOOK LES LANGUES SUR LE WEB ***

***** This file should be named 32065-8.txt or 32065-8.zip *****
This and all associated files of various formats will be found in:
        http://www.gutenberg.org/3/2/0/6/32065/

Produced by Al Haines

Updated editions will replace the previous one--the old editions will be
renamed.

Creating the works from public domain print editions means that no one
owns a United States copyright in these works, so the Foundation (and
you!) can copy and distribute it in the United States without permission
and without paying copyright royalties. Special rules, set forth in the
General Terms of Use part of this license, apply to copying and
distributing Project Gutenberg-tm electronic works to protect the
PROJECT GUTENBERG-tm concept and trademark. Project Gutenberg is a
registered trademark, and may not be used if you charge for the eBooks,
unless you receive specific permission. If you do not charge anything
for copies of this eBook, complying with the rules is very easy. You may
use this eBook for nearly any purpose such as creation of derivative
works, reports, performances and research. They may be modified and
printed and given away--you may do practically ANYTHING with public
domain eBooks. Redistribution is subject to the trademark license,
especially commercial redistribution.



*** START: FULL LICENSE ***

THE FULL PROJECT GUTENBERG LICENSE
PLEASE READ THIS BEFORE YOU DISTRIBUTE OR USE THIS WORK

To protect the Project Gutenberg-tm mission of promoting the free
distribution of electronic works, by using or distributing this work
(or any other work associated in any way with the phrase "Project
Gutenberg"), you agree to comply with all the terms of the Full Project
Gutenberg-tm License (available with this file or online at
http://www.gutenberg.org/license).


Section 1.  General Terms of Use and Redistributing Project Gutenberg-tm
electronic works

1.A.  By reading or using any part of this Project Gutenberg-tm
electronic work, you indicate that you have read, understand, agree to
and accept all the terms of this license and intellectual property
(trademark/copyright) agreement.  If you do not agree to abide by all
the terms of this agreement, you must cease using and return or destroy
all copies of Project Gutenberg-tm electronic works in your possession.
If you paid a fee for obtaining a copy of or access to a Project
Gutenberg-tm electronic work and you do not agree to be bound by the
terms of this agreement, you may obtain a refund from the person or
entity to whom you paid the fee as set forth in paragraph 1.E.8.

1.B.  "Project Gutenberg" is a registered trademark.  It may only be
used on or associated in any way with an electronic work by people who
agree to be bound by the terms of this agreement.  There are a few
things that you can do with most Project Gutenberg-tm electronic works
even without complying with the full terms of this agreement.  See
paragraph 1.C below.  There are a lot of things you can do with Project
Gutenberg-tm electronic works if you follow the terms of this agreement
and help preserve free future access to Project Gutenberg-tm electronic
works.  See paragraph 1.E below.

1.C.  The Project Gutenberg Literary Archive Foundation ("the Foundation"
or PGLAF), owns a compilation copyright in the collection of Project
Gutenberg-tm electronic works.  Nearly all the individual works in the
collection are in the public domain in the United States.  If an
individual work is in the public domain in the United States and you are
located in the United States, we do not claim a right to prevent you from
copying, distributing, performing, displaying or creating derivative
works based on the work as long as all references to Project Gutenberg
are removed.  Of course, we hope that you will support the Project
Gutenberg-tm mission of promoting free access to electronic works by
freely sharing Project Gutenberg-tm works in compliance with the terms of
this agreement for keeping the Project Gutenberg-tm name associated with
the work.  You can easily comply with the terms of this agreement by
keeping this work in the same format with its attached full Project
Gutenberg-tm License when you share it without charge with others.
This particular work is one of the few copyrighted individual works
included with the permission of the copyright holder.  Information on
the copyright owner for this particular work and the terms of use
imposed by the copyright holder on this work are set forth at the
beginning of this work.

1.D.  The copyright laws of the place where you are located also govern
what you can do with this work.  Copyright laws in most countries are in
a constant state of change.  If you are outside the United States, check
the laws of your country in addition to the terms of this agreement
before downloading, copying, displaying, performing, distributing or
creating derivative works based on this work or any other Project
Gutenberg-tm work.  The Foundation makes no representations concerning
the copyright status of any work in any country outside the United
States.

1.E.  Unless you have removed all references to Project Gutenberg:

1.E.1.  The following sentence, with active links to, or other immediate
access to, the full Project Gutenberg-tm License must appear prominently
whenever any copy of a Project Gutenberg-tm work (any work on which the
phrase "Project Gutenberg" appears, or with which the phrase "Project
Gutenberg" is associated) is accessed, displayed, performed, viewed,
copied or distributed:

This eBook is for the use of anyone anywhere at no cost and with
almost no restrictions whatsoever.  You may copy it, give it away or
re-use it under the terms of the Project Gutenberg License included
with this eBook or online at www.gutenberg.org

1.E.2.  If an individual Project Gutenberg-tm electronic work is derived
from the public domain (does not contain a notice indicating that it is
posted with permission of the copyright holder), the work can be copied
and distributed to anyone in the United States without paying any fees
or charges.  If you are redistributing or providing access to a work
with the phrase "Project Gutenberg" associated with or appearing on the
work, you must comply either with the requirements of paragraphs 1.E.1
through 1.E.7 or obtain permission for the use of the work and the
Project Gutenberg-tm trademark as set forth in paragraphs 1.E.8 or
1.E.9.

1.E.3.  If an individual Project Gutenberg-tm electronic work is posted
with the permission of the copyright holder, your use and distribution
must comply with both paragraphs 1.E.1 through 1.E.7 and any additional
terms imposed by the copyright holder.  Additional terms will be linked
to the Project Gutenberg-tm License for all works posted with the
permission of the copyright holder found at the beginning of this work.

1.E.4.  Do not unlink or detach or remove the full Project Gutenberg-tm
License terms from this work, or any files containing a part of this
work or any other work associated with Project Gutenberg-tm.

1.E.5.  Do not copy, display, perform, distribute or redistribute this
electronic work, or any part of this electronic work, without
prominently displaying the sentence set forth in paragraph 1.E.1 with
active links or immediate access to the full terms of the Project
Gutenberg-tm License.

1.E.6.  You may convert to and distribute this work in any binary,
compressed, marked up, nonproprietary or proprietary form, including any
word processing or hypertext form.  However, if you provide access to or
distribute copies of a Project Gutenberg-tm work in a format other than
"Plain Vanilla ASCII" or other format used in the official version
posted on the official Project Gutenberg-tm web site (www.gutenberg.org),
you must, at no additional cost, fee or expense to the user, provide a
copy, a means of exporting a copy, or a means of obtaining a copy upon
request, of the work in its original "Plain Vanilla ASCII" or other
form.  Any alternate format must include the full Project Gutenberg-tm
License as specified in paragraph 1.E.1.

1.E.7.  Do not charge a fee for access to, viewing, displaying,
performing, copying or distributing any Project Gutenberg-tm works
unless you comply with paragraph 1.E.8 or 1.E.9.

1.E.8.  You may charge a reasonable fee for copies of or providing
access to or distributing Project Gutenberg-tm electronic works provided
that

- You pay a royalty fee of 20% of the gross profits you derive from
     the use of Project Gutenberg-tm works calculated using the method
     you already use to calculate your applicable taxes.  The fee is
     owed to the owner of the Project Gutenberg-tm trademark, but he
     has agreed to donate royalties under this paragraph to the
     Project Gutenberg Literary Archive Foundation.  Royalty payments
     must be paid within 60 days following each date on which you
     prepare (or are legally required to prepare) your periodic tax
     returns.  Royalty payments should be clearly marked as such and
     sent to the Project Gutenberg Literary Archive Foundation at the
     address specified in Section 4, "Information about donations to
     the Project Gutenberg Literary Archive Foundation."

- You provide a full refund of any money paid by a user who notifies
     you in writing (or by e-mail) within 30 days of receipt that s/he
     does not agree to the terms of the full Project Gutenberg-tm
     License.  You must require such a user to return or
     destroy all copies of the works possessed in a physical medium
     and discontinue all use of and all access to other copies of
     Project Gutenberg-tm works.

- You provide, in accordance with paragraph 1.F.3, a full refund of any
     money paid for a work or a replacement copy, if a defect in the
     electronic work is discovered and reported to you within 90 days
     of receipt of the work.

- You comply with all other terms of this agreement for free
     distribution of Project Gutenberg-tm works.

1.E.9.  If you wish to charge a fee or distribute a Project Gutenberg-tm
electronic work or group of works on different terms than are set
forth in this agreement, you must obtain permission in writing from
both the Project Gutenberg Literary Archive Foundation and Michael
Hart, the owner of the Project Gutenberg-tm trademark.  Contact the
Foundation as set forth in Section 3 below.

1.F.

1.F.1.  Project Gutenberg volunteers and employees expend considerable
effort to identify, do copyright research on, transcribe and proofread
public domain works in creating the Project Gutenberg-tm
collection.  Despite these efforts, Project Gutenberg-tm electronic
works, and the medium on which they may be stored, may contain
"Defects," such as, but not limited to, incomplete, inaccurate or
corrupt data, transcription errors, a copyright or other intellectual
property infringement, a defective or damaged disk or other medium, a
computer virus, or computer codes that damage or cannot be read by
your equipment.

1.F.2.  LIMITED WARRANTY, DISCLAIMER OF DAMAGES - Except for the "Right
of Replacement or Refund" described in paragraph 1.F.3, the Project
Gutenberg Literary Archive Foundation, the owner of the Project
Gutenberg-tm trademark, and any other party distributing a Project
Gutenberg-tm electronic work under this agreement, disclaim all
liability to you for damages, costs and expenses, including legal
fees.  YOU AGREE THAT YOU HAVE NO REMEDIES FOR NEGLIGENCE, STRICT
LIABILITY, BREACH OF WARRANTY OR BREACH OF CONTRACT EXCEPT THOSE
PROVIDED IN PARAGRAPH F3.  YOU AGREE THAT THE FOUNDATION, THE
TRADEMARK OWNER, AND ANY DISTRIBUTOR UNDER THIS AGREEMENT WILL NOT BE
LIABLE TO YOU FOR ACTUAL, DIRECT, INDIRECT, CONSEQUENTIAL, PUNITIVE OR
INCIDENTAL DAMAGES EVEN IF YOU GIVE NOTICE OF THE POSSIBILITY OF SUCH
DAMAGE.

1.F.3.  LIMITED RIGHT OF REPLACEMENT OR REFUND - If you discover a
defect in this electronic work within 90 days of receiving it, you can
receive a refund of the money (if any) you paid for it by sending a
written explanation to the person you received the work from.  If you
received the work on a physical medium, you must return the medium with
your written explanation.  The person or entity that provided you with
the defective work may elect to provide a replacement copy in lieu of a
refund.  If you received the work electronically, the person or entity
providing it to you may choose to give you a second opportunity to
receive the work electronically in lieu of a refund.  If the second copy
is also defective, you may demand a refund in writing without further
opportunities to fix the problem.

1.F.4.  Except for the limited right of replacement or refund set forth
in paragraph 1.F.3, this work is provided to you 'AS-IS,' WITH NO OTHER
WARRANTIES OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO
WARRANTIES OF MERCHANTIBILITY OR FITNESS FOR ANY PURPOSE.

1.F.5.  Some states do not allow disclaimers of certain implied
warranties or the exclusion or limitation of certain types of damages.
If any disclaimer or limitation set forth in this agreement violates the
law of the state applicable to this agreement, the agreement shall be
interpreted to make the maximum disclaimer or limitation permitted by
the applicable state law.  The invalidity or unenforceability of any
provision of this agreement shall not void the remaining provisions.

1.F.6.  INDEMNITY - You agree to indemnify and hold the Foundation, the
trademark owner, any agent or employee of the Foundation, anyone
providing copies of Project Gutenberg-tm electronic works in accordance
with this agreement, and any volunteers associated with the production,
promotion and distribution of Project Gutenberg-tm electronic works,
harmless from all liability, costs and expenses, including legal fees,
that arise directly or indirectly from any of the following which you do
or cause to occur: (a) distribution of this or any Project Gutenberg-tm
work, (b) alteration, modification, or additions or deletions to any
Project Gutenberg-tm work, and (c) any Defect you cause.


Section  2.  Information about the Mission of Project Gutenberg-tm

Project Gutenberg-tm is synonymous with the free distribution of
electronic works in formats readable by the widest variety of computers
including obsolete, old, middle-aged and new computers.  It exists
because of the efforts of hundreds of volunteers and donations from
people in all walks of life.

Volunteers and financial support to provide volunteers with the
assistance they need are critical to reaching Project Gutenberg-tm's
goals and ensuring that the Project Gutenberg-tm collection will
remain freely available for generations to come.  In 2001, the Project
Gutenberg Literary Archive Foundation was created to provide a secure
and permanent future for Project Gutenberg-tm and future generations.
To learn more about the Project Gutenberg Literary Archive Foundation
and how your efforts and donations can help, see Sections 3 and 4
and the Foundation web page at http://www.pglaf.org.


Section 3.  Information about the Project Gutenberg Literary Archive
Foundation

The Project Gutenberg Literary Archive Foundation is a non profit
501(c)(3) educational corporation organized under the laws of the
state of Mississippi and granted tax exempt status by the Internal
Revenue Service.  The Foundation's EIN or federal tax identification
number is 64-6221541.  Its 501(c)(3) letter is posted at
http://pglaf.org/fundraising.  Contributions to the Project Gutenberg
Literary Archive Foundation are tax deductible to the full extent
permitted by U.S. federal laws and your state's laws.

The Foundation's principal office is located at 4557 Melan Dr. S.
Fairbanks, AK, 99712., but its volunteers and employees are scattered
throughout numerous locations.  Its business office is located at
809 North 1500 West, Salt Lake City, UT 84116, (801) 596-1887, email
business@pglaf.org.  Email contact links and up to date contact
information can be found at the Foundation's web site and official
page at http://pglaf.org

For additional contact information:
     Dr. Gregory B. Newby
     Chief Executive and Director
     gbnewby@pglaf.org

Section 4.  Information about Donations to the Project Gutenberg
Literary Archive Foundation

Project Gutenberg-tm depends upon and cannot survive without wide
spread public support and donations to carry out its mission of
increasing the number of public domain and licensed works that can be
freely distributed in machine readable form accessible by the widest
array of equipment including outdated equipment.  Many small donations
($1 to $5,000) are particularly important to maintaining tax exempt
status with the IRS.

The Foundation is committed to complying with the laws regulating
charities and charitable donations in all 50 states of the United
States.  Compliance requirements are not uniform and it takes a
considerable effort, much paperwork and many fees to meet and keep up
with these requirements.  We do not solicit donations in locations
where we have not received written confirmation of compliance.  To
SEND DONATIONS or determine the status of compliance for any
particular state visit http://pglaf.org

While we cannot and do not solicit contributions from states where we
have not met the solicitation requirements, we know of no prohibition
against accepting unsolicited donations from donors in such states who
approach us with offers to donate.

International donations are gratefully accepted, but we cannot make
any statements concerning tax treatment of donations received from
outside the United States.  U.S. laws alone swamp our small staff.

Please check the Project Gutenberg Web pages for current donation
methods and addresses.  Donations are accepted in a number of other
ways including checks, online payments and credit card donations.
To donate, please visit: http://pglaf.org/donate


Section 5.  General Information About Project Gutenberg-tm electronic
works.

Professor Michael S. Hart is the originator of the Project Gutenberg-tm
concept of a library of electronic works that could be freely shared
with anyone.  For thirty years, he produced and distributed Project
Gutenberg-tm eBooks with only a loose network of volunteer support.

Project Gutenberg-tm eBooks are often created from several printed
editions, all of which are confirmed as Public Domain in the U.S.
unless a copyright notice is included.  Thus, we do not necessarily
keep eBooks in compliance with any particular paper edition.

Each eBook is in a subdirectory of the same number as the eBook's
eBook number, often in several formats including plain vanilla ASCII,
compressed (zipped), HTML and others.

Corrected EDITIONS of our eBooks replace the old file and take over
the old filename and etext number.  The replaced older file is renamed.
VERSIONS based on separate sources are treated as new eBooks receiving
new filenames and etext numbers.

Most people start at our Web site which has the main PG search facility:

http://www.gutenberg.org

This Web site includes information about Project Gutenberg-tm,
including how to make donations to the Project Gutenberg Literary
Archive Foundation, how to help produce our new eBooks, and how to
subscribe to our email newsletter to hear about new eBooks.

EBooks posted prior to November 2003, with eBook numbers BELOW #10000,
are filed in directories based on their release date.  If you want to
download any of these eBooks directly, rather than using the regular
search system you may utilize the following addresses and just
download by the etext year.

http://www.ibiblio.org/gutenberg/etext06

    (Or /etext 05, 04, 03, 02, 01, 00, 99,
     98, 97, 96, 95, 94, 93, 92, 92, 91 or 90)

EBooks posted since November 2003, with etext numbers OVER #10000, are
filed in a different way.  The year of a release date is no longer part
of the directory path.  The path is based on the etext number (which is
identical to the filename).  The path to the file is made up of single
digits corresponding to all but the last digit in the filename.  For
example an eBook of filename 10234 would be found at:

http://www.gutenberg.org/1/0/2/3/10234

or filename 24689 would be found at:
http://www.gutenberg.org/2/4/6/8/24689

An alternative method of locating eBooks:
http://www.gutenberg.org/GUTINDEX.ALL

*** END: FULL LICENSE ***
