% INF8883 — Séminaire de maîtrise en informatique III : Traitement automatique du langage naturel % UQAM — Département d'informatique % Plan de cours — Automne 2019 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Coordination ------------ Sadat, Fatiha PK-4625 poste 3885 Description du cours ==================== Ce séminaire a pour but de favoriser l'accès à divers domaines spécialisés ou nouveaux en informatique ainsi que d'initier à la recherche. Objectif du cours ================= Ce cours vise à initier l'étudiant à la recherche dans le domaine du Traitement Automatique du Langage Naturel. Le traitement automatique du langage naturel ou de la langue naturelle (abr. TALN) ou des langues (abr. TAL) est une discipline de l'intelligence artificielle, qui concerne l'application de programmes et techniques informatiques à tous les aspects du langage humain. Cette discipline est parfois nommé ingénierie linguistique. Plus précisément, Le TALN concerne la conception de systèmes et techniques informatiques permettant de manipuler le langage humain dans tous ses aspects. Contenu du cours ================ Ce cours vise à introduire les principaux concepts et stratégies liés au traitement automatique d'une langue naturelle et ses variantes. Plus particulièrement, ce cours a pour objectifs d'étudier ce qui suit : Les essentiels du traitement linguistiques dont la morphologie, syntaxe, sémantique, extraction de l'information, entités nommées, expressions multi-mots ou polylexicales, la désambigüisation lexicale, etc. Une Introduction aux modèles de langues, à l'approche distributionnelle et au prolongement de mots (word embeddings) ainsi que quelques applications du TALN seront abordés dans ce cours. Comme applications du TALN, nous citons la traduction automatique, la recherche d'information, la génération des résumés automatiques, système de question-réponse, etc. Modalités d'évaluation ====================== Description Pondération ---------------------------------------- ------------- Projet de session (2 à 3 parties) 60% Présentation d'un article de recherche 30% Participation 10% Médiagraphie ============ - Gregory Grefenstette: Cross-Language Information Retrieval. Springer; édition Mar 31 1998. - M. Boughanem, J. Savoy: Recherche d'information : Etat des lieux et perspectives. Lavoisier, Paris, 2008. - Christopher D. Manning, Hinrich SchÃŒtze: Foundations of Statistical Natural Language Processing. Disponible sur le web : - Manning Christopher D., Raghavan Prabhakar, and Schutze Hinrich: Introduction to Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto : Modern Information Retrieval , C. J. van RIJSBERGEN: Information Retrieval. Butterworths, London (UK), 1979. - G. Salton: Automatic Text Processing. Addison-Wesley, Reading (MA), 1989. - W. B. Frakes, R. Baeza-Yates: Information Retrieval: Data Structures & Algorithms. Prentice Hall, Englewood Cliffs (NJ), 1992. - Ayse Goker , John Davies: Information Retrieval: Searching in the 21st Century. - Mitkov, R. 2005: The Oxford handbook of computational linguistics. Oxford : Oxford University Press. - Salton, G. et McGill, M. 1983 : Introduction to Modern Information Retrieval. New-York: McGraw-Hill. - D. Grossman and O. Frieder: Information Retrieval - Algorithms and Heuristics. Springer, 2004 (second edition). - FUCHS C.: Linguistique et traitements automatiques des langues, 1993. - Gerald Gazdar, Chris Mellish: Natural Language Processing in Prolog. An Introduction to Computational Linguistics. Addison-Wesley, Workingham (UK). - Pierre Nugues: An Introduction to Language Processing with Perl and Prolog. Springer, Berlin, 2006. - N. Indurkhya, F. Damerau: Handbook of Natural Language Processing. Chapman & Hall/CRC Press, 2nd Ed., BocaRaton, 2010 - Erik Hatcher, Otis Gospodnetic: Lucene in Action. Manning. - Ian H. Witten, Alistair Moffat, Timothy C. Bell: Managing Gigabytes. Compresing and Indexing Documents and Images. Morgan Kaufmann, 1989. - Daniel Jurafsky and James H. Martin : SPEECH and LANGUAGE PROCESSING - An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Second Edition 2009 - Erik Hatcher, Otis Gospodnetic: Lucene in Action. Manning. - Ian H. Witten, Alistair Moffat, Timothy C. Bell: Managing Gigabytes. Compressing and Indexing Documents and Images. Morgan Kaufmann, 1989. - D'autres références pertinentes seront données durant la session.