61 |
The Book Structure Extraction Competition with the Resurgence software for part and chapter detection at Caen University
|
|
|
|
In: Proceeding INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval ; INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval ; https://hal.archives-ouvertes.fr/hal-01069909 ; INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval, Dec 2011, Saarbrücken, Germany. p. 128-139 (2011)
|
|
BASE
|
|
Show details
|
|
62 |
Multilingual document alignment method without assumption of parallelism ; Alignement de documents multilingues sans présupposé de parallélisme
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-01075742 ; Traitement du texte et du document. Université de Caen, 2011. Français (2011)
|
|
BASE
|
|
Show details
|
|
63 |
Sydonie : a Model for Documents and Web Engineering ; Sydonie : modèle de document et ingénierie du Web
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01070899 ; Traitement du texte et du document. Université de Caen, 2011. Français (2011)
|
|
Abstract:
The Web has evolved, in the past few years, from a document centered approach, to become a web of applications. In this regard, multilingual composite documents management has become a focus point for Content Management Systems (CMS). This thesis offers a new approach, inspired by the Functional Requirements for Bibliographic Records report (FRBR). We propose tree-based model to describe relations between a digital document's various versions, translations and formats. The proposed approach allows composite documents to be rendered according to a user's preferences, using content negotiation and relationships between documents at the highest level of the tree. We created a web development framework called Sydonie (SYst'eme de gestion de DOcuments Num ́eriques pour l'Internet et l'E ́dition), a research and industrial project. The proposed model has been implemented and validated within the Sydonie framework. Using both industry and academic work in the field of web engineering, Sydonie offers new ways to develop web applications. Finally, we propose a model for web aplications to interact with documents' metadata. The architec- ture we propose helps web developpers to implement metadata management in web applications more easily. ; Cette thèse de doctorat est articulée autour des ré flexions sur les évolutions du web et de l'approche des documents numériques. Elle se concrétise dans la mise au point d'un framework reprenant nos propositions de modèle de document, d'interactions et d'ingénierie du web. Nous appelons ce framework Sydonie pour SYstème de gestion de DOcuments Numériques pour l'Internet et l'édition. Il est distribué en logiciel libre. Nous proposons un modèle de document inspiré des spécifications fonctionnelles des notices bibliographiques, consignées dans le rapport sur les FRBR (Functional Requirements for Bibliographic Records). Notre modèle propose de regrouper, sous la forme d'un arbre, les différentes versions linguistiques et divers formats de fichier d'un même document. Ce modèle règle élégamment la sélection de la vue du document la plus appropriée à un utilisateur grâce à la négociation de contenu. Pour un document composite, il permet, de plus, d'inclure les composants sous la forme la plus appropriée. Notre réflexion sur les processus mis en oeuvre pour le développement d'applications web, complétée par les études réalisées dans le domaine de l'ingénierie du web, nous permettent de proposer, au sein du framework Sydonie, une architecture logicielle qui apporte des solutions souples et extensibles pour le développement d'applications web. Enfin, nous avons étudié les mécanismes à proposer pour rendre la gestion des métadonnées plus accessible aux développeurs web. Nous utilisons le modèle de document sous forme d'arbre pour proposer un modèle de gestion des métadonnées au sein des applications web.
|
|
Keyword:
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; application web; Content Management System web en- gineering; digital document; document numérique; framework; ingénierie du web; logiciel libre; metadata; métadonnées; Open Source Software; Système de gestion de contenu; web application
|
|
URL: https://tel.archives-ouvertes.fr/tel-01070899/document https://tel.archives-ouvertes.fr/tel-01070899/file/These-JeanMarc-Lecarpentier-2011.pdf https://tel.archives-ouvertes.fr/tel-01070899
|
|
BASE
|
|
Hide details
|
|
64 |
Les N-grammes de caractères comme moyen de comparaison à grande échelle de corpus multilingue
|
|
|
|
In: JéTou 2011, Toulouse, 7â€"8 avril 2011 ; https://hal.archives-ouvertes.fr/hal-01069645 ; JéTou 2011, Toulouse, 7â€"8 avril 2011, Apr 2011, Toulouse, France. pp.147-151 (2011)
|
|
BASE
|
|
Show details
|
|
65 |
Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères
|
|
|
|
In: TALN 2011 ; https://hal.archives-ouvertes.fr/hal-01070769 ; TALN 2011, Jun 2011, Montpellier, France. pp.53-64 (2011)
|
|
BASE
|
|
Show details
|
|
66 |
Évaluation de G-LexAr pour la traduction automatique statistique
|
|
|
|
In: TALN'11 ; https://hal.archives-ouvertes.fr/hal-01070023 ; TALN'11, Jun 2011, Montpellier, France. pp.261-266 (2011)
|
|
BASE
|
|
Show details
|
|
67 |
Stratégie d'exploration de corpus multi-annotés avec GlozzQL
|
|
|
|
In: Actes de la 18e Conférence Traitement Automatique des Langues Naturelles (TALN'11), volume 2, papiers courts ; https://hal.archives-ouvertes.fr/hal-01021846 ; Actes de la 18e Conférence Traitement Automatique des Langues Naturelles (TALN'11), volume 2, papiers courts, Jun 2011, Montpellier, France. pp.143--148 (2011)
|
|
BASE
|
|
Show details
|
|
68 |
A Contextual Classification Strategy for Polarity Classification of Direct Quotations from Financial News
|
|
|
|
In: International Conference On Recent Advances in Natural Language Processing (RANLP 2011) ; https://hal.archives-ouvertes.fr/hal-01069030 ; International Conference On Recent Advances in Natural Language Processing (RANLP 2011), Sep 2011, Hissar, Bulgaria. pp434-440 (2011)
|
|
BASE
|
|
Show details
|
|
69 |
Vers une prise en charge approfondie des phénomènes itératifs par TimeML
|
|
|
|
In: Actes de la 18ème conférence Traitement Automatique des Langues Naturelles (TALN 2011) ; https://hal.archives-ouvertes.fr/hal-01069658 ; Actes de la 18ème conférence Traitement Automatique des Langues Naturelles (TALN 2011), Jun 2011, Montpellier, France. 6 p (2011)
|
|
BASE
|
|
Show details
|
|
70 |
Une approche holiste et unifiée de l'alignement et de la mesure d'accord inter-annotateurs
|
|
|
|
In: Actes de la 18e Conférence Traitement Automatique des Langues Naturelles (TALN'11) ; https://hal.archives-ouvertes.fr/hal-01070879 ; Actes de la 18e Conférence Traitement Automatique des Langues Naturelles (TALN'11), Jun 2011, Montpellier, France. pp.247--258 (2011)
|
|
BASE
|
|
Show details
|
|
71 |
De l'analyse syntaxique automatique à l'analyse automatique de discours dans les collections multilingues de documents numériques composites
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-03463410 ; Traitement du texte et du document. Université de Caen Basse-Normandie, 2011 (2011)
|
|
BASE
|
|
Show details
|
|
72 |
Évaluation de G-LexAr pour la traduction automatique statistique
|
|
|
|
In: TALN'11 ; https://hal.archives-ouvertes.fr/hal-01070023 ; TALN'11, Jun 2011, Montpellier, France. pp.261-266 (2011)
|
|
BASE
|
|
Show details
|
|
73 |
Bilingual Lexicon Induction: Effortless Evaluation of Word Alignment Tools and Production of Resources for Improbable Language Pairs
|
|
|
|
In: Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10) ; The Seventh conference on International Language Resources and Evaluation (LREC'10) ; https://hal.archives-ouvertes.fr/hal-00488768 ; The Seventh conference on International Language Resources and Evaluation (LREC'10), May 2010, Valletta, Malta. pp.252-256 (2010)
|
|
BASE
|
|
Show details
|
|
74 |
Automatic Discovery of Word Semantic Relations using Paraphrase Alignment and Distributional Lexical Semantics Analysis
|
|
|
|
In: ISSN: 1351-3249 ; EISSN: 1469-8110 ; Natural Language Engineering ; https://hal.archives-ouvertes.fr/hal-01067880 ; Natural Language Engineering, Cambridge University Press (CUP), 2010, 16 (4), pp.Pages 439-467. ⟨10.1017/S135132491000015X⟩ (2010)
|
|
BASE
|
|
Show details
|
|
75 |
Language-Independent Clone Detection Applied to Plagiarism Detection
|
|
|
|
In: Source Code Analysis and Manipulation (SCAM), 2010 10th IEEE Working Conference on ; https://hal.archives-ouvertes.fr/hal-01067165 ; Source Code Analysis and Manipulation (SCAM), 2010 10th IEEE Working Conference on, Sep 2010, Timisoara, Romania. pp.77 - 86, ⟨10.1109/SCAM.2010.19⟩ (2010)
|
|
BASE
|
|
Show details
|
|
76 |
A proposal for a multilingual epidemic surveillance system
|
|
|
|
In: User Centric Media ; https://hal.archives-ouvertes.fr/hal-01067792 ; User Centric Media, Springer, pp 343-348, 2010, Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, ⟨10.1007/978-3-642-12630-7_43⟩ (2010)
|
|
BASE
|
|
Show details
|
|
77 |
The structure of unseen trigrams and its application to language models: A first investigation
|
|
|
|
In: Proceedings of the 4th International Universal Communication Symposium ; The 4th International Universal Communication Symposium (IUCS 2010) ; https://hal.archives-ouvertes.fr/hal-00606385 ; The 4th International Universal Communication Symposium (IUCS 2010), Oct 2010, Beijing, China. pp.273-280, ⟨10.1109/IUCS.2010.5666011⟩ (2010)
|
|
BASE
|
|
Show details
|
|
78 |
Filtering news for epidemic surveillance: towards processing more languages with fewer resources
|
|
|
|
In: 4th International worshop on cross-lingual information access CLIA 2010 ; https://hal.archives-ouvertes.fr/hal-01067156 ; 4th International worshop on cross-lingual information access CLIA 2010, Aug 2010, Pekin, China. 8 p (2010)
|
|
BASE
|
|
Show details
|
|
79 |
An efficient any language approach for the integration of phrases in document retrieval
|
|
|
|
In: ISSN: 1574-020X ; EISSN: 1574-0218 ; Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-01067894 ; Language Resources and Evaluation, Springer Verlag, 2010, 44 (1-2), pp 159-180. ⟨10.1007/s10579-009-9102-3⟩ (2010)
|
|
BASE
|
|
Show details
|
|
80 |
Multilingual Composite Document Management Framework For The Internet: An FRBR Approach
|
|
|
|
In: ACM DocEng2010 ; https://hal.archives-ouvertes.fr/hal-01066908 ; ACM DocEng2010, Sep 2010, Manchester, United Kingdom. pp.4 Pages (2010)
|
|
BASE
|
|
Show details
|
|
|
|