1 |
Daniel@FinTOC’2 Shared Task: Title Detection and Structure Extraction
|
|
|
|
In: st Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation @COLING’2020 ; 1st Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation @COLING’2020 ; https://hal.archives-ouvertes.fr/hal-03024867 ; 1st Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation @COLING’2020, Dec 2020, Barcelone, Spain (2020)
|
|
BASE
|
|
Show details
|
|
2 |
FNP-FNS-41 - Daniel@FinTOC’2 Shared Task: Title Detection and Structure Extraction ...
|
|
|
|
BASE
|
|
Show details
|
|
3 |
Model-driven Web Page Segmentation for Non Visual Access
|
|
|
|
In: 16th International Conference of the Pacific Association for Computational Linguistics (PACLING 2019) ; https://hal.archives-ouvertes.fr/hal-02309612 ; 16th International Conference of the Pacific Association for Computational Linguistics (PACLING 2019), Oct 2019, Hanoï City, Vietnam (2019)
|
|
BASE
|
|
Show details
|
|
4 |
Which granularity to bootstrap a multilingual method of document alignment: character N-grams or word N-grams?
|
|
|
|
In: EISSN: 1877-0428 ; Procedia - Social and Behavioral Sciences ; https://hal.archives-ouvertes.fr/hal-01074838 ; Procedia - Social and Behavioral Sciences, Elsevier, 2013, pp.473 - 481 (2013)
|
|
BASE
|
|
Show details
|
|
5 |
Parallel areas detection in multi-documents for multilingual alignment ; Détection de zones parallèles à l’intérieur de multi-documents pour l’alignement multilingue
|
|
|
|
In: 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013) ; https://hal.archives-ouvertes.fr/hal-01074950 ; 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France (2013)
|
|
BASE
|
|
Show details
|
|
6 |
Anonymisation semi-automatique de corpus d'interactions éléments pour une méthode interactive
|
|
|
|
In: JOurnées Communication et Apprentissage Instrumentés en Réseau ; https://edutice.archives-ouvertes.fr/edutice-00720211 ; JOurnées Communication et Apprentissage Instrumentés en Réseau, Sep 2012, Amiens, France (2012)
|
|
BASE
|
|
Show details
|
|
7 |
Stratégies pour l'anonymisation systématique d'un corpus d'interactions plurilingues
|
|
|
|
In: Intercompréhension ; https://edutice.archives-ouvertes.fr/edutice-00718390 ; Intercompréhension, Jun 2012, Grenoble, France. pp.1-21 ; http://ic2012.u-grenoble3.fr/OpenConf/papers/58.pdf (2012)
|
|
BASE
|
|
Show details
|
|
8 |
The Book Structure Extraction Competition with the Resurgence software for part and chapter detection at Caen University
|
|
|
|
In: Proceeding INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval ; INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval ; https://hal.archives-ouvertes.fr/hal-01069909 ; INEX'10 Proceedings of the 9th international conference on Initiative for the evaluation of XML retrieval: comparative evaluation of focused retrieval, Dec 2011, Saarbrücken, Germany. p. 128-139 (2011)
|
|
Abstract:
ISBN: 978-3-642-23576-4 ; International audience ; The GREYC Island team participated in the Structure Extraction Competition part of the INEX Book track for the second time, with the Resurgence software. We used a minimal strategy primarily based on top-down document representation with two levels, part and chapter. The main idea is to use a model describing relationships for elements in the document structure. Frontiers between high-level units are detected, parts and then chapters. Page is also used. The periphery center relationship is calculated on the entire document and reflected on each page. The strong points of the approach are that it deals with the entire document; it handles books without ToCs, and titles that are not represented in the ToC (e. g. preface); it is not dependent on lexicon, hence tolerant to OCR errors and language independent; it is simple and fast.
|
|
Keyword:
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
|
|
URL: https://hal.archives-ouvertes.fr/hal-01069909
|
|
BASE
|
|
Hide details
|
|
9 |
Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères
|
|
|
|
In: TALN 2011 ; https://hal.archives-ouvertes.fr/hal-01070769 ; TALN 2011, Jun 2011, Montpellier, France. pp.53-64 (2011)
|
|
BASE
|
|
Show details
|
|
10 |
Analyses et partages de corpus de discussions avec calico-leçons tirées d'une expérience récente
|
|
|
|
In: EPAL - Echanger Pour Apprendre en Ligne ; https://hal.archives-ouvertes.fr/hal-02010626 ; EPAL - Echanger Pour Apprendre en Ligne, Jun 2011, Grenoble, France ; https://epal-2018.sciencesconf.org/ (2011)
|
|
BASE
|
|
Show details
|
|
11 |
De l'analyse syntaxique automatique à l'analyse automatique de discours dans les collections multilingues de documents numériques composites
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-03463410 ; Traitement du texte et du document. Université de Caen Basse-Normandie, 2011 (2011)
|
|
BASE
|
|
Show details
|
|
12 |
Multilingual Lexical Database Generation from parallel texts in 20 European languages with endogenous resources
|
|
|
|
In: Poster Proceedings of the ACL-COLING-2006 International Conference ; https://hal.archives-ouvertes.fr/hal-00256180 ; Poster Proceedings of the ACL-COLING-2006 International Conference, 2006, Australia (2006)
|
|
BASE
|
|
Show details
|
|
13 |
De l’analyse des discours à l’analyse structurale des réseaux sociaux : une étude diachronique d’un forum éducatif
|
|
|
|
BASE
|
|
Show details
|
|
14 |
Multilingual Lexical Database Generation from parallel texts with endogenous resources
|
|
|
|
In: PAPILLON-2005 Workshop on Multilingual Lexical Databases ; https://hal.archives-ouvertes.fr/hal-00250960 ; PAPILLON-2005 Workshop on Multilingual Lexical Databases, 2005, France (2005)
|
|
BASE
|
|
Show details
|
|
15 |
Multilingual Lexical Database Generation from parallel texts with endogenous resources
|
|
|
|
In: http://www.mt-archive.info/Coling-ACL-2006-Giguet.pdf (2005)
|
|
BASE
|
|
Show details
|
|
16 |
Multilingual Lexical Database Generation from parallel texts with endogenous resources
|
|
|
|
In: http://acl.ldc.upenn.edu/P/P06/P06-2035.pdf (2005)
|
|
BASE
|
|
Show details
|
|
17 |
Modélisation de l'activité expérimentale du chercheur en traitement des langues sur corpus multilingues
|
|
|
|
In: Journée " Articuler les traitements sur corpus " ; https://hal.archives-ouvertes.fr/hal-00250959 ; Journée " Articuler les traitements sur corpus ", 2005, France (2005)
|
|
BASE
|
|
Show details
|
|
18 |
UniTHEM, un exemple de traitement linguistique à couverture multilingue
|
|
|
|
In: Conférence internationale sur le document électronique CIDE8 ; https://hal.archives-ouvertes.fr/hal-00256129 ; Conférence internationale sur le document électronique CIDE8, 2005, Liban. pp.115-132 (2005)
|
|
BASE
|
|
Show details
|
|
19 |
Alignement d'unités textuelles de taille variable
|
|
|
|
In: 4èmes Journées de la Linguistique de Corpus ; https://halshs.archives-ouvertes.fr/halshs-00202140 ; 4èmes Journées de la Linguistique de Corpus, Sep 2005, Lorient, France. pp.197-205 (2005)
|
|
BASE
|
|
Show details
|
|
20 |
Multilingual Sentence Categorization according to Language ...
|
|
|
|
BASE
|
|
Show details
|
|
|
|