Technolangue : Traitement Automatique des Langues (TAL).

, par  Hamid , popularité : 4%

Présentation

Ce domaine, également connu sous le nom de "traitement automatique des langues" (TAL) ou "ingénierie linguistique", vise à fournir des technologies utilisées dans de nombreuses applications qui traitent l’information sous forme écrite ou orale, monolingue ou multilingue.

Son objectif principal est de mettre en place de manière pérenne une infrastructure de production et diffusion de ressources linguistiques, d’évaluation des technologies de la langue écrite et orale, de participation aux instances nationales et internationales de normalisation et de standardisation et de veille informationnelle sur le domaine.

Les ministères concernés sont le Ministère chargé de la Recherche et des Nouvelles Technologies, le Ministère délégué à l’Industrie et le Ministère de la Culture et de la Communication.

Définition

L’expression « technologies de la langue » désigne l’ensemble des produits et services qui ont pour objet le Traitement Automatique des Langues (TAL).

Le TAL s’effectue sur des données linguistiques (textes écrits, corpus oraux, lexiques, phrases, etc.) et met en oeuvre des outils et des techniques de traitement qui sont de trois ordres :

 linguistiques (description et explicitation des connaissances de la langue relevant des niveaux de la phonétique/phonologique, de la morphologie, de la syntaxe, de la sémantique),
 formels (expression et représentation de ces connaissances dans un formalisme susceptible d’être implémenté par la machine),
 informatiques (élaboration de techniques et de stratégies informatiques de traitement effectif).

Nous utilisons l’expression « Traitement Automatique des Langues » mais préférons parler des « traitements automatiques des langues » (d’autres parlent également d’industrie des langues, d’ingénierie linguistique, etc). En effet, on ne saurait parler « du » traitement mais « des » traitements automatiques des langues. Il en existe une multitude : extraction, résumé, analyse, traduction, etc.

L’ère de l’information

L’information joue aujourd’hui un rôle de plus en plus important dans toutes les activités du monde contemporain. En effet, de nombreux facteurs, agissant de manière synergique, ont contribué au cours de ces trente dernières années, à accroître son influence dans tous les domaines. Simultanément, l’internationalisation des marchés et le développement des Nouvelles Technologies de l’Information et de la Communication (NTIC) ont favorisé le multilinguisme et l’augmentation du volume d’information.

Dans ce contexte, les aspects d’acquisition, de gestion, d’analyse, d’exploitation, etc. des informations, multilingues ou non, pour la plupart sous formes textuelles ou orales, sont au centre des grands débats du monde de la recherche et de l’économie. La société de l’information donne par ailleurs au support de l’information, la langue elle-même, une importance nouvelle sur le plan de son traitement informatique.

Le domaine des technologies de la langue est ainsi devenu un des domaines-clés qui propose des voies de recherche susceptibles d’apporter des solutions à ces problèmes et répond ainsi aux besoins actuels de ce que les experts dénomment la « société de l’information ».

Sources :
 http://www.technolangue.net/
 http://web.limsi.fr/