Skip to Content

Thierry Charnois

Portrait de Thierry Charnois

Présentation

Prénom Nom
Thierry Charnois
Téléphone
+33 (0)2 31 56 73 72
Statut
Chercheur associé
Equipes d'appartenance
codag
Courriel
thierry.charnois@unicaen.fr
N° Bureau
S2-303
Responsabilités

Membre élu au conseil scientifique de l’université de Caen (depuis 2008), au CA de l’IUT de Caen (2003–07), commission de spécialiste 27e section (Caen, 2004–08), comité de sélection 27e section (membre extérieur : Angers, 2009 ; Paris IV, 2011), responsable scientifique demande subvention FEDER (2010), demande d’habilitation licence professionnelle (2005–07).

 

URL laboratoire
https://www.greyc.fr/users/charnois
URL complémentaire
https://charnois.users.greyc.fr/

Activités scientifiques

Thèmes de recherche

Mes travaux de recherche concernent le traitement automatique des langues (TAL), et la fouille de données textuelles. Ces travaux s’organisent autour de la problématique de l’accès à l’information dans les textes à partir d’une analyse linguistique. Parce qu’il s’agit de traiter du matériau linguistique nous adoptons une démarche interdisciplinaire à la croisée de la linguistique dans ses dimensions lexicales, phrastiques, discursives, et de l’informatique pour ses capacités à produire des représentation formelles et à réaliser des traitements automatiques. Soulignons que l’accès à l’information est ici vue comme un accès au "sens" à partir d’une modélisation linguistique relative à l’application visée, plutôt qu’un accès aux formes de surface comme l’utilisent actuellement les méthodes prédominantes des moteurs de recherche. En retour, cette modélisation vise à améliorer notre compréhension des phénomènes sémantiques traitées ; leur formalisation et leur expérimentation sur corpus rendant possible l’évaluation des connaissances linguistiques qu’elles soient au niveau des modèles ou des ressources nécessaires à l’application visée.

 

L’aboutissement de cette dialectique entre modélisation et formalisation dans nos travaux débouche actuellement sur la volonté d’intégrer les méthodes de fouille de données au TAL, notamment pour acquérir automatiquement des ressources linguistiques et alimenter à moindre coût les systèmes de TAL.

Une telle hybridation vise d’une part à repenser la manière dont les processus de TAL peuvent tirer bénéfice de méthodes de fouille spécifiquement adap- tées au texte, et d’autre part à renforcer les processus de fouille, en fonction des spécificités de la donnée textuelle, par une prise en compte d’informations de nature linguistique visant notamment à sélectionner l’information la plus pertinente.

 

Coopérations, collaborations

 

Projets et contrats de recherche récents ou en cours

 

ANR Bingo2 Knowledge discovery for and by inductive queries in post- genomic applications. Partenaires : laboratoires CGMC et LIRIS (Lyon), LHC (Saint-Etienne) et GREYC (Caen). De janvier 2008 à décembre 2011.

 

Projet européen PHC Barrande : bilateral Programme Hubert Curien project "Heterogeneous Data Fusion for Genomic and Proteomic Knowledge Discovery"; projet impliquant les laboratoires CGMC (Lyon), GREYC (Caen) et le Department of Cybernetics, Czech Technical University (Prague, République tchèque). De janvier 2008 à décembre 2009.

 

ANR Annodis Annotation discursive : corpus de référence pour le français et outils d’aide à l’annotation et à l’exploitation. Partenaires : laboratoires CLLE-ERESS (Toulouse 2), IRIT (Toulouse 1) et GREYC (Caen). De janvier 2008 à décembre 2010

 

ANR Ontopitex Modèles linguistiques et ontologies. Extraction informatique et caractérisation d’opinions et de jugements d’évaluation dans les textes. Partenaires : laboratoires LaLIC (Université Paris IV), CRISCO (Caen), GREYC (Caen) et les sociétés Noopsis (Caen) et TecKnow- Metrix (Grenoble). De fin 2009 à fin 2012.

 

ANR ProDescartes Corpus Descartes. Projet d’édition en ligne des œuvres et de la correspondance de Descartes. Partenaires : équipe Identité et Subjectivité (Caen), Centres d’Etudes Cartésiennes (Université Paris IV), GREYC (Caen) et la société Noopis (Caen). Début 2010 à fin 2012.

 

Mots-clefs
Traitement automatique des langues et fouille de données

Productions, ressources

Publications


  • Habilitation
  •  
  • Thierry Charnois. Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues. Habilitation à Diriger des Recherches, Université de Caen, 1er décembre 2011 (pdf)
  •  
  • Chapitre d’ouvrage
  •  
  • Thierry Charnois et Patrice Enjalbert. Compréhension automatique. In P. Enjalbert, editor, Sémantique et traitement automatique du langage naturel, Traité IC2, série Cognition et traitement de l’information, chapitre 7, Hermès Sciences, Lavoisier, pages 267–308, 2005.
  •  
  • Revues d’audience internationale avec comité de lecture
  •  
  • Thierry Charnois, Marc Plantevit, Christophe Rigotti and Bruno Crémilleux. Fouille de données séquentielles pour l’extraction d’information dans les textes. Revue internationale TAL, 50(3) : 59–87, 2009.
  •  
  • Marc Plantevit, Thierry Charnois, Jiří Kléma, Christophe Rigotti and Bruno Crémilleux. Combining Sequence and Itemset Mining to Discover Named Entities in Biomedical Texts : A New Type of Pattern. International Journal of Data Mining, Modelling and Management, 1(2) : 119–148, 2009.
  •  
  • Brigitte Biébow, Thierry Charnois, and Sylvie Szulman. ISDN supplementary services specifications : from informality to knowledge representation. In Annals of Telecommunications 51(9-10), 1996.
  •  
  • Publications à des revues d’audience nationale avec comité de lecture
  •  
  • Stéphane Ferrari, Thierry Charnois, Yann Mathet, François Rioult, et Dominique Legallois. Analyse de discours évaluatif, modèle linguistique et applications. Revue des Nouvelles Technologies de l’Information, E17 : 71–93, 2009.
  •  
  • Colloques d’audience internationale avec comité de lecture et actes
  •  
  • Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Sequential Pattern Mining to Discover Relations between Genes and Rare Diseases. To appear In proceedings of the 25th IEEE International Symposium on Computer-Based Medical Systems (CBMS'2012). Roma, Italy. July 2012.

 

  • Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois. What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ? To appear in Proceedings of the 13th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2012), Springer LNCS (Long paper), New Delhi, India, 11-17 March 2012.
  •  
  • Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Discovering linguistic patterns using sequence mining. To appear in Proceedings of the 13th International Confe- rence on Intelligent Text Processing and Computational Linguistics (CICLing 2012), Springer LNCS (Long paper), New Delhi, India, 11-17 March 2012.
  •  
  • Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois. Fouille de données pour la stylistique : cas des motifs séquentiels émergents. To appear in Proceedings of the 11th International Conference on the Statistical Analysis of Textual Data (Long paper), Liege, Belgium, 13 - 15 June 2012.
  •  
  • Peggy Cellier, Sébastien Ferré, Mireille Ducassé, and Thierry Charnois. Partial Orders and Logical Concept Analysis to Explore Patterns Extracted by Data Mining. In 19th International Conference on Conceptual Structures (ICCS'2011). Derby, United Kingdom, 29 - 29 July, 2011.

  • Dominique Legallois, Peggy Cellier and Thierry Charnois. Calcul de réseaux phrastiques pour l'analyse et la navigation textuelle.  In Actes de la 18e conférence sur le traitement automatique des langues naturelles (TALN’11), 6 pages, actes électroniques, Montpellier, juillet 2011.
  •  
  • Peggy Cellier, Thierry Charnois, Marc Plantevit and Bruno Crémilleux, Recursive Sequence Mining to Discover Named Entity Relations, In Proceedings of the the 9th International Symposium on Intelligent Data Analysis, (IDA 2010), pages 537-548 LNCS, Tucson, USA, May 2010.
  •  
  • Peggy Cellier, Thierry Charnois and Marc Plantevit. Sequential Patterns to Discover and Characterise Biological Relations, In Proceedings of the 11th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2010), pages 537–548, LNCS, Iasi, Romania, March, 2010.
  •  
  • Peggy Cellier, Thierry Charnois. Fouille de données séquentielle d’itemsets pour l’apprentissage de patrons linguistiques. In Actes de la 17e conférence sur le traitement automatique des langues naturelles (TALN’10), 6 pages, actes électroniques, Montréal, Canada, juillet 2010.
  •  
  • Agata Jackiewicz, Thierry Charnois et Stéphane Ferrari. Jugements d’évaluation et constituants périphériques. In Actes de la 16ème conférence sur le traitement automatique des langues naturelles (TALN’09), 10 pages, actes électroniques, Senlis, France, juin 2009.
  •  
  • Marc Plantevit et Thierry Charnois. Motifs séquentiels pour l’extraction d’information : illustration sur le problème de la détection d’interactions entre gènes. In Traitement Automatique des Langues Naturelles (TALN’09), 10 pages, actes électroniques, Senlis, France, juin 2009.
  •  
  • Thierry Charnois, Nicolas Durand and Jiří Kléma. Automated Information Extraction from Gene Summaries. In Proceedings of the ECML/PKDD Workshop on Data and Text Mining for Integrative Biology, pages 4–15, Berlin, Germany, September 2006.
  •  
  • Frédérik Bilhaut, Thierry Charnois, Patrice Enjalbert, and Yann Mathet. Passage Extraction in Geographical Documents. In Proceedings of New Trends in Intelligent Information Processing and Web Mining (IIPWM’03), pages 121–130, Zakopane, Pologne, June 2003.
  •  
  • Thierry Charnois, Yann Mathet, Patrice Enjalbert, and Frédérik Bilhaut. Geographic Reference Analysis for Geographic Document Querying. In Kornai A. and Sundheim B., editors, Proceedings of the Workshop on the Analysis of Geographic References, Human Language Technology Conference (NAACL-HLT), Association for Computational Linguistics, pages 55–62, Edmonton, Canada, May 2003.
  •  
  • Frédérik Bilhaut, Lydia-Mai Ho Dac, Andrée Borillo, Thierry Charnois, Patrice Enjalbert, Anne Le Draoulec, Yann Mathet, Hélène Miguet, Marie-Paule Péry-woodley et Laure Sarda. Indexation discursive pour la navigation intradocumentaire : cadres temporels et spatiaux dans l’information géographique. In Actes de la 10e Conférence Traitement Automatique du Langage Naturel (TALN’03), pages 315–320, Batz-sur-Mer, France, juin 2003.
  •  
  • Tassadit Amghar, Delphine Battistelli and Thierry Charnois. Reasoning on French Aspecto-Temporal Information in French within Conceptual Graphs. In Proceedings of the 14th IEEE International Conference on Tools with Artificial Intelligence (ICTAI’2002), pages 315–324, Washington D.C., USA, November 2002.
  •  
  • Tassadit Amghar, Delphine Battistelli, and Thierry Charnois. Représenter le temps en langue dans le formalisme des graphes conceptuels, une approche baséee sur les schèmes sémantico-cognitifs. In Actes de la 8e Conférence Traitement Automatique du Langage Naturel (TALN’2001), pages 43–52, Tours, France, juillet 2001.
  •  
  • Tassadit Amghar, Thierry Charnois, and Delphine Battistelli. Aspecto-temporal data and lexical representations in french within simple conceptual graphs on the basis of semantico-cognitive schemes. In Harry S. Delugach and Gerd Stumme, editors, Conceptual Structures : Broadening the Base, 9th International Conference on Conceptual Structures, ICCS 2001, volume 2120 of Lecture Notes in Computer Science, Springer, pages 29–43, Stanford, CA, USA, July 2001.
  •  
  • Thierry Charnois. Maximal isojoin for representing software textual specifications and detecting semantic anomalies. In Gerd Stumme, editor, Working with Conceptual Structures, 8th International Conference on Conceptual Structures, ICCS’2000, pages 189–200, Darmstadt, Germany, July 2000.
  •  
  • Thierry Charnois. A natural language processing approach for avoidance of feature interactions. In Petre Dini, Raouf Boutaba, and Luigi Logrippo, editors, Feature Interactions in Telecommunications Networks IV, (FIW 97, IEEE Fourth International Workshop on Feature Interactions and Distributed Systems), pages 347–363. IOS Press, June 1997.
  •  
  • Colloques d’audience nationale avec comité de sélection et actes
  •  
  • StéphaneFerrari,ThierryCharnois,AgataJackiewicz,PierreGardinet Antoine Widlöcher. Jugements d’évaluation : des constituants détachés à d’autres formes régulières. In Actes des 6e Journées de la Linguistique de Corpus, Lorient, France, septembre, 2009.
  •  
  • Jean-Luc Manguin, Marc Plantevit et Thierry Charnois. Constitution d’un corpus pré-annoté de résumés d’articles en biologie génétique. In G. Williams, editor, Actes des 6e Journées de la Linguistique de Corpus, Lorient, France, septembre 2009.
  •  
  • Stéphane Ferrari, Yann Mathet, Thierry Charnois et Dominique Legallois. Analyse d’opinion : discours évaluatif et classification de documents – Retour d’expérience sur deux approches. In M. Roche and P. Poncelet, editor, Actes de FODOP08, Atelier FOuille des Données d’OPinions associé à INFORSID’08, pages 23–36. 27 mai 2008, Fontainebleau, France, mai 2008.
  •  
  • Thierry Charnois, Antoine Doucet, Yann Mathet et François Rioult. Trois approches du greyc pour la classification de textes. In Défi fouille de texte 2008, pages 171–180, juin 2008.
  •  
  • Mathieu Vernier, Yann Mathet, François Rioult, Thierry Charnois, Stéphane Ferrari et Dominique Legallois. Classification de textes d’opinions : une approche mixte n-grammes et sémantique. In Troisième DÉfi de Fouille de Textes (DEFT’07), plate-forme AFIA 2007, pages 95–109, AFIA, Assiciation Française d’Intelligence Artificielle, Grenoble, France, juillet 2007.
  •  
  • AntoineWidlöcher,FrédérikBilhaut,NicolasHernandez,FrançoisRioult, Thierry Charnois, Stéphane Ferrari et Patrice Enjalbert. Une approche hybride de la segmentation thématique : collaboration du traitement automatique des langues et de la fouille de texte. In Deuxième DÉfi de Fouille de Textes (DEFT’06), Semaine du Document Numérique (SDN’2006), Fribourg, Suisse, septembre 2006.
  •  
  • Thierry Charnois. Une base de connaissances terminologique pour la détection d’anomalies sémantiques dans les textes de spécialité. In Journées Ingénierie des Connaissances et Apprentissage Automatique (IC’97), Roscoff, France, mai 1997.
  •