EC
Collecte de données et constitution de corpus écrits : numérisation, crowdsourcing
Description
LT36GM05/LT36GM10 – Linguistique des corpus
Mme TODIRASCU
Les corpus : définition et exemples (Frantext, Scientext). Critères de constitution de corpus. Corpus bruts vs corpus annotés. Exploitation de corpus à l’aide de concordanciers (SketchEngine, TXM). Le langage CQL.
Compétences visées
- connaître les notions de base en linguistique de corpus (corpus écrits vs corpus oraux, mesures statistiques, lexique du corpus, collocatif);
- savoir constituer son propre corpus selon des critères bien définis;
- exploiter les annotations d'un corpus
- maîtriser des concordanciers (Sketch Engine, TXM, Frantext)
Modalités d'organisation et de suivi
12 heures en présentiel