EC
Introduction au TAL
Description
LT41GM22 – Introduction au traitement automatique des langues
Mme TODIRASCU
Ce cours propose une initiation dans le domaine du Traitement Automatique des langues (maitrise des outils, applications, ressources).
Les applications en TAL les plus répandues : chatbots, traduction automatique, calcul de la coréférence, extraction d’information. Les approches en TAL : approche à base de règles, approche statistique, approche par apprentissage profond. Ressources utiles pour construire des applications TAL : lexiques, corpus, modèles de langues (plongements lexicaux).
Compétences requises
Etudiants doivent être capable de :
-
formuler des commandes en ligne de commande (invité de commandes)
-
maîtriser des notions de base en linguistique (morphologie, syntaxe, sémantique)
Compétences visées
- maîtrise d'un outil d'étiquetage automatique et d'analyse automatique en dépendances;
- connaître les approches en TAL (symbolique, statistique, apprentissage profond);
- connaître les resources nécessaires pour les diverses applications TAL;
- connaître le fonctionnement des applications TAL (traduction, extraction de terminologie, chatbots) - Macrocompétences: Développer, se servir de façon autonome des outils et des ressources numériques avancés (outils d’annotation, concordanciers, bases lexicales, terminologiques etc) pour un projet professionnel ou de recherche en Sciences du langage
Modalités d'organisation et de suivi
6 séances de 2 heures (septembre octobre). Jeudi 14h-16h (semaine 1-7)
Syllabus
Objectifs d'apprentissage
A la fin de cet enseignement les étudiants seront capables de
-
appliquer une chaîne de traitement sur un texte sans annotation afin d’obtenir une annotation automatique à granularité variable
-
comprendre le fonctionnement des approches en TAL (à base de règles, statistiques, par apprentissage profond)
-
configurer des outils de TAL pour sa propre étude
Informations complémentaires
12/09/2024 | 2 TD | A la fin de ce cours les étudiants seront capable de identifier les applications les plus repandues en TAL identifier les enjeux du TAL connaître les étapes d’une chaîne de traitement complète pour ajouter plusieurs couches d’annotation comprendre les avantages et limites des approches en TAL |
19/09/2024 | 2 TD | Maîtriser des outils pour la segmentation, la tokenisation, la catégorisation des textes reconnaître les défis que le développement de ces outils posent S’approprier les divers approches (à base de règle, statistique, modèle de langue) et ressources pour réaliser ces tâches |
26/09/2024 | 2TD | Maîtriser des outils pour l’analyse morpho-syntaxique et lemmatisation Identifier les enjeux du dévelopement de ces outils S’approprier les divers approches (à base de règle, statistique, modèle de langue) et ressources pour réaliser ces tâches |
3/10/2024 | 2TD | Apprendre les différences entre l’analyse en constituents et l’analyse en dépendances syntaxiques maîtriser les outils d’analyse automatique syntaxique (un outil par type d’analyse) |
10/10/2024 | 2TD | Apprendre les enjeux de l’analyse sémantique automatique identifier le fonctionnement des plongements lexicaux apprendre à utiliser les modèles de langues de type transformer utiliser quelques ressources (bases lexico-sémantiques) |
17/10/2024 | 2TD | Identifier les étapes de développement d’une application TAL en contexte industriel Développer une mini-chaîne de traitement |
24/10/2024 | 1TD | Examen écrit |