% INF7546 — Traitement automatique du langage naturel % UQAM — Département d'informatique % Plan de cours — Automne 2021 * Horaires, locaux et enseignants: Responsable(s) du cours ======================= Sadat, Fatiha PK-4625 Groupes: 050 Description =========== Objectifs --------- Ce cours vise à présenter aux étudiants la problématique du traitement automatique du langage naturel, de la langue naturelle ou des langues (TALN ou TAL). Cette discipline de l'intelligence artificielle concerne la conception de systèmes et les techniques informatiques permettant de manipuler le langage humain dans tous ses aspects. Sommaire du contenu ------------------- Traitement linguistique: morphologie, syntaxe, sémantique, extraction de l'information, entités nommées, expressions multi-mots ou polylexicales, désambiguisation lexicale, et analyse des données massives. Introduction aux modèles de langues, à l'approche distributionnelle et au prolongement de mots. Applications du TALN: recherche et extraction de l'information, traduction automatique, systèmes de question-réponse, analyse des sentiments et des émotions, génération de résumés automatiques. Modèles basés sur les règles, les statistiques et les réseaux neuronaux. Modalité d'enseignement ----------------------- Ce cours ne comporte pas de séance de laboratoire. Modalités d'évaluation ====================== Description sommaire. Date Pondération ------------------------- -------------- ------------- Projet (2 parties) à déterminer 60% Présentation à déterminer 30% Participation en classe \- 10% Remarques --------- Les travaux doivent être réalisés d'une façon individuelle. La qualité du français constitue un critère d'évaluation (pour un maximum de 10%). L'étudiant doit obtenir une moyenne cumulée de 60% aux deux parties du projet; dans le cas contraire, il se verra attribuer un échec. L'étudiant ne remettant aucun des travaux se verra attribuer un échec. Médiagraphie ============ Obligatoire ----------- - Site web du cours (à déterminer en classe), incluant entre autres les diapositives et le matériel distribués et/ou utilisés en classe. Recommandé ---------- - Daniel Jurafsky and James H. Martin : SPEECH and LANGUAGE PROCESSING - An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Second Edition 2009 (http://www.cs.colorado.edu/\~martin/slp2.html) - Christopher D. Manning, Hinrich SchÃŒtze: Foundations of Statistical Natural Language Processing. Disponible sur le web : http://www-nlp.stanford.edu/fsnlp/ - Manning Christopher D., Raghavan Prabhakar, and Schütze Hinrich: Introduction to Information Retrieval. - Gregory Grefenstette: Cross-Language Information Retrieval. Springer; édition Mar 31 1998. Ressources complémentaires -------------------------- - M. Boughanem, J. Savoy: Recherche d'information : Etat des lieux et perspectives. Lavoisier, Paris, 2008. - M. Ihadjadene Les systèmes de recherche d'informations, modèles conceptuels ; - Ricardo Baeza-Yates, Berthier Ribeiro-Neto : Modern Information Retrieval , - C. J. van RIJSBERGEN: Information Retrieval. Butterworths, London (UK), 1979. (http://www.iro.umontreal.ca/\~nie/IR-book/Preface.html) ou (http://www.dcs.gla.ac.uk/Keith/Preface.html) - G. Salton: Automatic Text Processing. Addison-Wesley, Reading (MA), 1989. - W. B. Frakes, R. Baeza-Yates: Information Retrieval: Data Structures & Algorithms. Prentice Hall, Englewood Cliffs (NJ), 1992. - Ayse Goker , John Davies: Information Retrieval: Searching in the 21st Century. - Mitkov, R. 2005: The Oxford handbook of computational linguistics. Oxford : Oxford University Press. - Salton, G. et McGill, M. 1983 : Introduction to Modern Information Retrieval. New-York: McGraw-Hill. - D. Grossman and O. Frieder: Information Retrieval - Algorithms and Heuristics. Springer, 2004 (second edition). - FUCHS C.: Linguistique et traitements automatiques des langues, 1993. (http://cat.inist.fr/?aModele=afficheN&cpsidt=3726134) - Gerald Gazdar, Chris Mellish: Natural Language Processing in Prolog. An Introduction to Computational Linguistics. Addison-Wesley, Workingham (UK). - Pierre Nugues: An Introduction to Language Processing with Perl and Prolog. Springer, Berlin, 2006. - N. Indurkhya, F. Damerau: Handbook of Natural Language Processing. Chapman & Hall/CRC Press, 2nd Ed., Boca Raton, 2010 - Erik Hatcher, Otis Gospodnetic: Lucene in Action. Manning. - Ian H. Witten, Alistair Moffat, Timothy C. Bell: Managing Gigabytes. Compresing and Indexing Documents and Images. Morgan Kaufmann, 1989.