INF7710 — Théorie et applications de la fouille d’associations (UQAM)

INF7710 - Théorie et applications de la fouille d’associations

Plan de cours Hiver 2020

Horaires, locaux et enseignants
Version PDF du plan de cours

Responsable(s) du cours

Coordination

Valtchev, Petko
PK-4415
poste 1919
valtchev.petko@uqam.ca
https://professeurs.uqam.ca/professeur/valtchev.petko/

Enseignement

Valtchev, Petko
PK-4415
poste 1919
valtchev.petko@uqam.ca
https://professeurs.uqam.ca/professeur/valtchev.petko/

Description du cours

La découverte d’associations est un aspect fondamental de la fouille de données. Ce cours met l’accent sur les bases théoriques de l’approche et sur les liens avec des problématiques de la théorie de la normalisation en bases de données, l’analyse formelle de concepts et les fonctions Booléennes. - Problème générique de découverte d’associations et de la fouille de motifs fréquents. - Variantes : motifs fermés, motifs maximaux, motifs clés ou générateurs. - Structures algébriques mises en jeux : treillis Booléen, classes d’équivalence, correspondances de Galois, treillis de concepts, contextes. - Approches de fouille de motifs : algorithmes par niveaux, algorithmnes verticaux, algorithmes hybrides. - Représentations compactes pour les associations : base canonique, bases génériques et informatives. - Famille réduites de motifs : motifs indérivables, motifs delta-libres, motifs sans disjonction, motifs k-libres. - Applications de la fouille d’associations.

Objectif du cours

Ce cours vise à approfondir les connaissances de l’étudiant sur un domaine en pleine expansion qu’est la fouille de données. Le cours se focalise sur la découverte d’associations et de motifs fréquents qui est une discipline fondamentale de la fouille de données. L’accent est mis sur la présentation des diverses instanciations du problème général de la fouille ainsi que sur les fondements théoriques de l’approche et leurs liens avec des problématiques de la théorie de la normalisation en bases de données et l’analyse formelle de concepts.

Le but du cours est de permettre à l’étudiant de se familiariser avec la fouille de données en général à travers l’étude plus approfondie d’une des disciplines pertinentes, soit la fouille d’associations. Les objectifs concrets du cours peuvent être énoncés comme suit :

Contenu du cours

Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et, de préférence, un cours d’introduction à l’intelligence artificielle. Les sujets abordés sont :

Modalités d’évaluation

Description sommaire Date Pondération
Résumé d’article de recherche 1 Semaine 4 15%
Résumé d’article de recherche 2 Semaine 8 15%
Travail de session : 1re partie - Proposition de sujet Semaine 11 10%
Travail de session : 2e partie - Présentation orale Semaine 15 25%
Travail de session : 3e partie - Mémoire sur le sujet choisi Semaine 16 35%

Le travail de session est réalisé par groupe de deux étudiants. Une liste de sujets potentiels et des recommandations seront fournis pendant la session. La qualité du français constitue un critère d’évaluation (pour un maximum de 10%). En cas de retard dans la remise des travaux, une pénalité de 5% par jour ouvrable sera appliquée. Un retard de plus d’une semaine ne sera pas accepté.

Les règlements concernant le plagiat seront strictement appliqués. Pour plus de renseignements, consultez le site suivant : http://www.sciences.uqam.ca/etudiants/integrite-academique.html

Médiagraphie

VC TAN, P.-N., STEINBACH, M., KARPATNE, A. et KUMAR, V. – Introduction to Data Mining, 2e – PEARSON (2018) http://www-users.cs.umn.edu/~kumar/dmbook/

VC GODIN, R. – Systèmes de gestion de bases de données par l’exemple – LOZE-DION (2006) http://www.info2.uqam.ca/~godin/livreEd2.html

VC HAN J., KAMBER, M. et PEI, J. – Data Mining : Concepts and Techniques, 3e – MORGAN KAUFMANN (2011).

VC BERRY, M. et LINOFF, G. – Mastering Data Mining – JOHN WILEY & SONS (2000).

VC HAND, D., MANNILA, H. et SMYTH, P. – Principles of Data Mining – MIT PRESS (2000).

VC CARPINETO, C. et ROMANO, G. – – Concept Data Analysis : Theory and Applications – WILEY (2004).

VC GANTER, B. et WILLE R. – – Formal Concept Analysis, Mathematical Foundations. – SPRINGER-VERLAG (1999).

AC FAYYAD, U., PIATETSKY-SHAPIRO, G. et SMYTH, P. – – From Data Mining to Knowledge Discovery in Databases – AI MAGAZINE 17(3): 37-54, 1996.

AC AGRAWAL, R., IMIELINSKI, T. et SWAMI, A. – Mining association rules between sets of items in large databases – PROCEEDINGS OF THE ACM SIGMOD INTERNATIONAL CONFERENCE ON THE MANAGEMENT OF DATA, WASHINGTON (DC), USA, PAGES 207–216, 1993.

AC AGRAWAL, R., MANNILA, H., SRIKANT, R., TOIVONEN, H. et VERKAMO, A. – Fast Discovery of Association Rules – U. FAYYAD, G. PIATETSKY-SHAPIRO, AND P. SMYTH, ÉDS, ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PAGES 307–328. AAAI PRESS, MENLO PARK (CA), USA, 1996.

AC D’autres références (selon les sujets abordés) seront remises durant la session.

L’autorisation de reprendre un examen en cas d’absence est de caractère exceptionnel. Pour obtenir un tel privilège, l’étudiant-e doit avoir des motifs sérieux et bien justifiés.

Il est de la responsabilité de l’étudiant-e de ne pas s’inscrire à des cours qui sont en conflit d’horaire, tant en ce qui concerne les séances de cours ou d’exercices que les examens. De tels conflits d’horaire ne constituent pas un motif justifiant une demande d’examen de reprise.

Dans le cas d’une absence pour raison médicale, l’étudiant-e doit joindre un certificat médical original et signé par le médecin décrivant la raison de l’absence à l’examen. Les dates d’invalidité doivent être clairement indiquées sur le certificat. Une vérification de la validité du certificat pourrait être faite. Dans le cas d’une absence pour une raison non médicale, l’étudiant-e doit fournir les documents originaux expliquant et justifiant l’absence à l’examen ; par exemple, lettre de la Cour en cas de participation à un jury, copie du certificat de décès en cas de décès d’un proche, etc. Toute demande incomplète sera refusée. Si la direction du programme d’études de l’étudiant-e constate qu’un étudiant a un comportement récurrent d’absence aux examens, l’étudiant-e peut se voir refuser une reprise d’examen. L’étudiant-e absent-e lors d’un examen doit, dans les cinq (5) jours ouvrables suivant la date de l’examen, présenter une demande de reprise en utilisant le formulaire prévu, disponible sur le site Web du département à l’adresse suivante : http://info.uqam.ca/politiques/.

L’étudiant-e doit déposer le formulaire dûment complété au secrétariat de la direction de son programme d’études : PK-3150 pour les programmes de premier cycle, PK-4150 pour les programmes de cycles supérieurs.

Pour plus de détails sur la politique d’absence aux examens du Département d’informatique, consultez le site web suivant : http://info.uqam.ca/politiques/.

PLAGIAT Règlement no 18 sur les infractions de nature académique. (extraits)

Tout acte de plagiat, fraude, copiage, tricherie ou falsification de document commis par une étudiante, un étudiant, de même que toute participation à ces actes ou tentative de les commettre, à l'occasion d'un examen ou d'un travail faisant l'objet d'une évaluation ou dans toute autre circonstance, constituent une infraction au sens de ce règlement.

La liste non limitative des infractions est définie comme suit :

Les sanctions reliées à ces infrations sont précisées à l'article 3 du Règlement no 18.

Les règlements concernant le plagiat seront strictement appliqués. Pour plus de renseignements, veuillez consulter les sites suivants : http://www.sciences.uqam.ca/etudiants/integrite-academique.html et https://r18.uqam.ca/

Politique no 16 visant à prévenir et combattre le sexisme et les violences à caractère sexuel

Pour consulter la politique no 16 : http://instances.uqam.ca/wp-content/uploads/sites/47/2018/05/Politique_no_16.pdf

Services offerts :

Pour obtenir de l’aide, faire une divulgation ou une plainte : Bureau d’intervention et de prévention en matière de harcèlement 514 987-3000, poste 0886

Pour la liste des services offerts en matière de violence sexuelle à l’UQAM et à l’extérieur de l’UQAM : http://harcelement.uqam.ca

CALACS Trêve pour Elles – point de services UQAM : 514 987-0348 calacs@uqam.ca http://trevepourelles.org

Soutien psychologique (Services à la vie étudiante) : 514 987-3185 Local DS-2110

Service de la prévention et de la sécurité : 514 987-3131

Les étudiants qui ont une lettre signée de leur conseillère ou conseiller de l’Accueil et de soutien aux étudiants en situation de handicap (ASESH), dans laquelle il est fait état de leur inscription au ASESH à titre d’étudiant(e) en situation de handicap, sont invités à remettre ce document à leurs professeur(e)s et chargé(e)s de cours dès le début de la session afin que les aménagements dans le respect des exigences académiques soient déterminées de concert avec chacun des professeur(e)s et chargé(e)s de cours. Les étudiants qui ont une déficience et qui ne seraient pas inscrits au ASESH sont priés de se présenter au AB-2300. 

Étudiants avant une déficience de type visuelle, auditive, motrice, trouble d’apprentissage, trouble envahissant du développement et trouble de santé mentale:

Les étudiant(e)s qui ont une lettre d’Attestation des mesures d’aménagements académiques obtenue auprès d’une conseillère, d’un conseiller de l’ACCUEIL ET SOUTIEN AUX ÉTUDIANTS EN SITUATION DE HANDICAP (ASESH) doivent rencontrer leurs enseignant(e)s au début de la session afin que des mesures d’aménagement en classe ou lors des évaluations puissent être mises en place. Ceux et celles qui ont une déficience ou une incapacité mais qui n’ont pas cette lettre doivent contacter l’ASESH au (514) 987-3148 ou se présenter au AB-2300 le plus tôt possible.