PRÉSENTATION
Responsable d’équipe : Bertrand CUISSART
L’équipe considère l’ensemble de la chaîne de traitement des données comme son objet d’étude et porte son attention sur l’exercice de cette discipline sous contrôle. A cela, s’ajoute la capacité d’intégrer des contraintes extérieures qu’elles soient légales, déontologiques ou physiques. Nos travaux s’articulent autour de trois thèmes : la maîtrise de la donnée, le pilotage de la recherche du modèle optimal et l’intelligibilité du modèle résultant.
Mots-clés : Résolution des contraintes, Optimisation, Problèmes sur les graphes, Fouille de données, Traitement Automatique des Langues.
THÉMATIQUES DE RECHERCHE
L’apprentissage à partir des données étant modélisé sous la forme d’une optimisation, sa résolution suppose l’accès à une représentation fiable de la réalité visée. CoDaG s’intéresse aux cas où cette référence pose problème en se concentrant sur trois travaux : l’évaluation non supervisée, la mesure de l’accord inter-annotateurs et l’utilisation d’ontologies pour mesurer la qualité des données.
La programmation par contraintes, l’optimisation et la fouille de données se trouvent au cœur du processus de traitement de données. D’un côté, les méthodes de contraintes et d’optimisation combinatoire permettent de déclarer et de solutionner des tâches de fouille de données. De l’autre côté, les données peuvent fournir une information capable d’améliorer un processus de résolution de contraintes. En conséquence, le développement de méthodes hybridant ces trois domaines suscite un intérêt croissant au sein des communautés concernées.
CoDaG s’intéresse à la prise en compte interactive des préférences utilisateur dans le processus de traitement de données. Cette interaction peut être en deux sens. On peut envisager une interaction du système vers l’utilisateur : l’utilisateur apprend une nouvelle connaissance à partir des résultats retournés par le système. Dans l’autre sens, une interaction de l’utilisateur vers le système : le système apprend les préférences de l’utilisateur selon un compromis entre critères construit sur ses retours. La forme que peuvent prendre les retours de l’utilisateur ainsi que leur exploitation restent des sujets d’étude ouverts.
- Le traitement de données biologiques et chimiques
- L’analyse de données sportives
- Les humanités numériques
EN SAVOIR PLUS
ALEC Céline – Maître de conférences à l’Université de Caen Normandie
BRETTO Alain – Professeur des universités à l’Université de Caen Normandie
CREMILLEUX Bruno – Professeur des universités à l’Université de Caen Normandie
CUISSART Bertrand – Maître de conférences à l’Université de Caen Normandie
LAMOTTE Jean-Luc – Professeur des universités à l’Université de Caen Normandie
MATHET Yann – Maître de conférences (HDR) à l’Université de Caen Normandie
OUALI Abdelkader – Maître de conférences à l’Université de Caen Normandie
REYNAUD Justine – Maître de conférences à l’Université de Caen Normandie
RIOULT François – Maître de conférences (HDR) à l’Université de Caen Normandie
WIDLÖCHER Antoine – Maître de conférences à l’Université de Caen Normandie
ZIMMERMANN Albrecht – Maître de conférences à l’Université de Caen Normandie
BRUTUS Philippe – Chercheur associé
BENGUIGUI Nicolas – Chercheur associé
KASTNER Lise – Doctorante
LEHEMBRE Etienne – Doctorant
LEJMI Maroua – Doctorante
LIBREAU Clément – Doctorant
LOUDNI Samir – Chercheur associé
MORTELIER Alexis – Doctorant
MORADI Neda – Doctorante
SAHBI Aya Nour-Elimane – Doctorante
SOUPLY Marc – Doctorant
NEO-REEDUC (Normandy region – FEDER, 2023-2025)
Paprica (PHC Utique, 2022-2023)
CodeGNN (ANR IA, 2022-2026)
Involvd (ANR IA, 2021-2025)
Herelles (ANR IA, 2020-2025)
Orange Labs, RMAN SYNC, Roullier (financial support for thesis and internships: 2018-2023)
Schism (Normandy region, 2021-2022)
INCA (Normandy region, 2019-2022)
RHuNes (CNRS + Maupertuis programme, 2021)
AIMS (FEDER, 2017-2020)
CPER Numnie (2016-2020), with the Hultech team
AGAC (Normandy region, 2017-2019), with the Image team
PepTraq (Normandy region, 2017-2019), with the MAD team
REUs (FUI, 2016-2019)
CIFRE convention with Huawei (2016-2019)
Imprimerie Nationale (2018)
Nareca (ANR Contint, 2013-2018)
QCM-BioChem a follow-up of Decade (CNRS MASTODONS, 2017-2018)
Minomics – Mining Omics data for chemistry (Normandy region, 2015-2017)
Prefute (CNRS PEPS, 2015-2016)
Hybride (ANR blanche, 2011-2016)
Adn’Tox (FEDER, 2012-2015)
L’équipe possède une forte attractivité au niveau applicatif. Cette caractéristique permet notamment de développer des collaborations interdisciplinaires sur le long terme, naturellement inspiratrices d’innovation. Voir la partie « Projets » et nos publications.
VIE D’ÉQUIPE
Les séances du groupe de travail sont listées ici.
Voir la page « Groupes de travail ».
FAITS MARQUANTS
2023:
Nouveau projet : Projet NEOREEDUC – Réalité mixte pour une nouvelle approche de la rééducation motrice. 1er janvier 2023 au 31 décembre 2025. Projet Région Normandie Collaboratif Innovation (22E05784) avec la Société NeoXperience (www.neoxperiences.com)
Suite au succès de l’école thématique de l’an dernier, François Rioult et Albrecht Zimmermann organisent une école de perfectionnement sur « l’analyse des données sportives complexes » fin juin (26/06/23–29/06/23). Le programme propose un mélange passionnant de présentatrices/présentateurs, de sports et de problématiques analytiques. https://complex-sports-data.sciencesconf.org
2022:
Le projet DSChem vise à organiser, au niveau national, un groupe de travail ouvert à tous et dont les échanges permettront d’identifier rapidement les besoins informatiques en traitement d’information chimique et les compétences à mobiliser pour y répondre. Cette initiative vient d’être labellisée comme un « atelier » du GDR MaDICS.
L’atelier « Machine Learning and Data Mining for Sports Analytics » a été accepté à la conférence ECML/PKDD 2022.
Plusieurs membres de l’équipe CODAG sont partie prenante de la conférence ECML/PKDD 2022 : Journal Track co-chair, Workshop & Tutorial co-chair, PhD Forum co-chair, area chair, membres du comité de programme.
François Rioult a été invité à participer à l’émission de Radio Phénix « C’est pas faux » pour discuter de la valeur scientifique des données numériques.
Lancement du projet AMPERE (2022/2025)
L’école thématique « BigSportsData : Analyse de données sportives massives », organisée par François Rioult et Albrecht Zimmermann a eu lieu du 27/06 au 30/06.
L’équipe CODAG accueille 6 nouveaux doctorants cette année : Djawad Bekkoucha (thèse HAISCODE), Steve Gendarme (thèse CIFRE), Maroua Lejmi (thèse en co-tutelle), Lise Kastner (thèse sur le projet AMPERE), Neda Moradi (thèse en co-tutelle), Aya Nour Elimane Sahbi (thèse ministérielle).
L’équipe CODAG accueille deux nouveaux membres : Jean-Luc Lamotte, professeur des Universités en Informatique, et Nicolas Benguigui, professeur des Universités en STAPS.
2021:
We are co-organizer of the 8th Machine Learning and Data Mining for Sports Analytics (MLSA 21).
RHuNes project is accepted!
February 3rd 2021: kick-off of the ANR Involvd project.
Our proposal of « Big Sports Data » summer school (postponed in 2022) is accepted by CNRS.
2021: we got a paper at DAMI.
Welcome to Soufia Bennai (ATER), Hajar Rehioui-Karine (postdoctoral researcher), Maksim Koptelov (postdoctoral researcher), Aymeric Beauchamp, Chaima Boughanmi, Triss Jacquiot, Etienne Lehembre (internships).
2020:
November 2020: ANR Herelles project is launched.
David Batista Soares defended his Ph.D thesis on November 12th 2020. It is entitled « How to do the nature and the structure of information affect the optimal pricing algorithm to guarantee market efficiency and minimize fundamental prices volatility? ».
Maksim Koptelov defended his Ph.D thesis on September 30th 2020. It is entitled « Link prediction in bipartite multi-layer networks, with an application to drug-target interaction prediction ».
ANR InvolvD (2021-2025), ANR Herelles (2020-2024) and RIN Schism (2020-2022) projects are accepted!
We are publicity and public relation co-chair at ECML/PKDD 2020, poster chair at IDA 2020, co-organizer of the 2nd Workshop on Evaluation and Experimental Design in Data Mining and Machine Learning and the 7th Machine Learning and Data Mining for Sports Analytics (MLSA 20) at ECML/PKDD 2020.
We are invited at a Dagstuhl seminar and the SML 2020 workshop.
We got collaborations and contracts with Orange Labs and Rman Sync compagnies.
Tenured associate professor position in computer science (Computational sciences and data science for digital humanities), University of Caen Normandie. The position is now closed.
January 2020: we take part of the executive committee (deputy-head) of the GDR MaDICS.
2020: we got papers at ECML/PKDD, DSAA (video), SAC (video) conferences, AIJ, Wiley Interdiscip. Rev. Data Min. Knowl. Discov., Discrete Mathematics and Linear and Multilinear Algebra journals.
2020: welcome to Hayfa Azibi (PhD student), Mina Rafla (PhD, student), Justine Reynaud (Associate Professor) and Marc Souply (PhD student).
Tenured associate professor position in data science (constraints, data mining), University of Caen Normandie. The position is now closed.
Rafic Nader defended his Ph.D thesis on June 28th 2019. It is entitled “A study concerning the positive semi-definite property for similarity matrices and for doubly stochastic matrices with some applications”.
Anthony Palmieri defended his Ph.D thesis on May 15th 2019. It is entitled “Nouvelles Techniques pour les Constraint Games”.
Noureddine Aribi (University of Oran) has been an invited professor at University of Caen in April 2019. We worked on unsupervised declarative approaches.
March 2019: short visit of Marc Plantevit (LRIS, Lyon). We have exchanged on augmented graphs and biological networks.
RIN INCA (2019-2022) project is accepted.
CPER Numnie supports (engineer) our work on text mining techniques to discover relations in texts.
We are publicity and public relation co-chair at ECML/PKDD 2019, co-organizer of the 1st Workshop on Evaluation and Experimental Design in Data Mining and Machine Learning at SDM 2019 and the 6th Machine Learning and Data Mining for Sports Analytics (MLSA 19) at ECML/PKDD 2019.
2019: we got the best paper at AI TEST 2019, papers at IJCAI, ICTAI, KES, IEA/AIE conferences, Linear Algebra and its Applications, TCS, Constraints journals.
2019: welcome to Anaëlle Baledent (PhD student, together with Hultech team), Nida Meddouri (ATER), Abdelkader Ouali (Associate Professor).
June 2018: short visit of Ian Davidson, University of California, Davis, US. We exchanged on several declarative approaches for pattern sets.
May 2018: Project CNRS Mastodons QCM-BioChem (Quality in Consensualizing and Mining biological and chemical datasets) is launched.
Mohamad Badaoui defended his Ph.D thesis on March 30th 2018. It is entitled “G-graphs and Expander graphs”.
2018: we got collaborations and contracts with Inprimerie Nationale and Roullier compagnies.
We are co-organizer of the 5th Machine Learning and Data Mining for Sports Analytics (MLSA 18), we take part in the organization of SML 2018.
2018: we got papers at CP, ECML/PKDD, KDD, PAKDD, IDA, ICTAI, CICLing conferences, DAMI, Journal Medicinal Chemistry.
2018: welcome to Wiem Belhedi (post-doc), David Condaminet (engineer), Arnold Hien (PhD student), Ludovic Jean-Baptiste (engineer), Nhat Vinh VO (post-doc).
François Rioult defended his Habilitation thesis on December 7th 2017. It is entitled “Fouille de données : motifs minimaux, redescription d’espace et analyse du (e-)sport”.
September 2017: AGAC project is launched.
Bamba Kane defended his Ph.D thesis on September 6th 2017. It is entitled “Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique”.
Abdelkader Ouali defended his Ph.D thesis on July 3rd 2017. It is entitled “Méthodes hybrides parallèles pour la résolution de problèmes d’optimisation combinatoire : application au clustering sous contraintes”.
May 2017: project CNRS Mastodons Decade is launched. Collaborative research on knowledge discovery and decision support to therapeutic chemistry.
May 2017: project FEDER AIMS “Automated Integrated Monitoring System” is launched.
We are co-organizer of the 4th Machine Learning and Data Mining for Sports Analytics (MLSA 17).
2017: we got papers at PAKDD, UAI, IJCAI, ICTAI, ICIP conferences, AIJ, Autom. Softw. Eng., Constraints, Machine Learning journals, co-editor of a DAMI special issue on sports analytics.
2017: welcome to Pegah Alizadeh (post-doc), Emna Hachicha (post-doc), Maksim Koptelov (PhD student).
November 2016: project FUI REUs is launched.
Samir Loudni defended his Habilitation thesis on October 5th 2016. It is entitled “Contributions à la résolution des WCSP et approches déclaratives pour la fouille de données”.
September 2016: we started a collaboration with Huawei.
2016: CPER/Numnie supports our work on text annotation (engineer) and sport analytics (post-doc).
We are tutorial/workshops co-chair à ECML/PKDD 2016.
We gave a tutorial on Preference-based Pattern Mining at ECML/PKDD 2016 (see here), ICFCA 2017 (see here) and BDA 2017 (see here).
2016: we got papers at CP, CPAIOR, IJCAI, IDA, Interspeech conferences, AIJ, Statistical Analysis and Data Mining journals.
2016: welcome to David Batista Soares (PhD student), Anthony Palmieri (PhD student).
May 2015: project CNRS PEPS Préfute is launched.
Guozhu Dong, head of the Data Mining Research Lab., Wright State University, Dayton, US, has been an invited professor at University of Caen in May 2015.
April 2015: Minomics project is launched.
2015: we got papers at AIME, CP, ICTAI, PAKDD, IDA, SAC, DocEng conferences, J. Biomedical Semantics, . J. of Chemical Information Modeling, Constraints, Electronic Notes in Discrete Mathematic, JIIS, TCS, Computer Vision and Image Understanding, Discrete Applied Mathematics, Computational Linguistics – Best paper at COSI 2015.
2015: welcome to Gaël Lejeune (post-doc), Valentin Lemière (PhD student), Rafic Nader (PhD student), Albrecht Zimmermann (associate professor).
Activity research report and research program in 2015 (in French).