publication . Conference object . 2010

Titrage automatique de documents électroniques par extraction de syntagmes nominaux

Lopez , Cédric; Prince , Violaine; Roche , Mathieu;
Open Access English
  • Published: 08 Apr 2010
  • Publisher: HAL CCSD
Abstract
National audience; Le titrage automatique est un des domaines clé de l'accessibilité des sites WEB tel que défini. Nous proposons dans cet article une approche permettant le titrage automatique de textes (messages de type mails, forum, etc.). À partir de l'étude morpho-syntaxique des titres de notre corpus, nous proposons une approche de titrage automatique. Celle-ci se compose de quatre étapes : l'acquisition du corpus, la détermination des phrases candidates pour le titrage, l'extraction des syntagmes nominaux parmi les phrases candidates et enfin le choix du titre (ChTITRES). Les résultats de l'évaluation par une dizaine d'utilisateurs montrent que les titres...
Subjects
free text keywords: [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing, [ INFO.INFO-TT ] Computer Science [cs]/Document and Text Processing, Syntagmes nominaux, titrage automatique, statistiques

BAXENDALE B. (1958). Man-made index for technical literature - an experiment. IBM Journal of Research and Development, p. 354-361.

BELHAOUES M. (2009). Titrage automatique de pages web. Stage Recherche, Universite´ Montpellier II.

BOURIGAULT D. (1994). Lexter, un logiciel d'extraction de terminologie. application a` l'acquisition des connaissances a` partir de textes. The`se de l'Ecole des Hautes Etudes en Sciences Sociales, Paris., p. 120-130.

DAILLE B. (1996). Study and implementation of combined techniques for automatic extraction of terminology. The Balancing Act : Combining Symbolic and Statistical Approaches to language, p. 29-36.

FERRET O., GRAU B. & AL. (2001). Utilisation des entite´s nomme´es et des variantes terminologiques dans un syste`me de question-re´ponse. TALN.

HO-DAC L.-M., JACQUES M.-P. & REBEYROLLE J. (2004). Sur la fonction discursive des titres. S. Porhiel and D. Klingler (Eds). L'unite´ texte, Pleyben, Perspectives., p. 125-152.

JACQUES M. & REBEYROLLE J. (2004). Titres et structuration des documents. Actes International Symposium : Discourse and Document, p. 125-152.

PE N˜ALVER VICEA M. (2003). Le titre est-il un de´signateur rigide ? Dialnet, Vol. 2, p. 251-258. [OpenAIRE]

REN X. & PERRAULT F. (1992). The typology of unknown words : An experimental study of two corpora. COLING 92.

SALTON G. & BUCKLEY C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing and Management 24, p. 513 a` 523.

SCHMID H. (1994). Probabilistic part-of-speech tagging using decision trees. Proceedings of the International Conference on New Methods in Language Processing, p. 44-49.

VINET M.-T. (1993). L'aspet et la copule vide dans la grammaire des titres. Persee, 100, 83-101.

YOUSFI-MONOD M. & PRINCE V. (2006). Compression de phrases par e´lagage d' arbre morpho-syntaxique. TSI : Technique et Science Informatiques 25, 4, p. 447- 456.

ZIDOUNI A., GLOTIN H. & QUAFAFOU M. (2009). Recherche d'entite´s nomme´es dans les journaux radiophoniques par contextes hie´rarchique et syntaxique. CORIA 2009 - Confe´rence en Recherche d'Information et Applications, p.2˜.

Powered by OpenAIRE Open Research Graph
Any information missing or wrong?Report an Issue
publication . Conference object . 2010

Titrage automatique de documents électroniques par extraction de syntagmes nominaux

Lopez , Cédric; Prince , Violaine; Roche , Mathieu;