41 |
A New Proposal for Evaluating Web Page Cleaning Tools
|
|
|
|
In: ISSN: 1405-5546 ; EISSN: 2007-9737 ; Computación y sistemas ; https://hal.archives-ouvertes.fr/hal-02467732 ; Computación y sistemas, Instituto Politécnico Nacional IPN Centro de Investigación en Computación, 2018, ⟨10.13053/CyS-22-4-3062⟩ (2018)
|
|
BASE
|
|
Show details
|
|
42 |
Diachronic Corpus Analysis of "Poker" ; Analyse Diachronique de Corpus : le cas du poker
|
|
|
|
In: JADT '18 Proceedings of the 14th International conference on statistical analysis of textual data ; Journées d'Analyse statistique des Données Textuelles (JADT) 2018 ; https://hal.archives-ouvertes.fr/hal-02467662 ; Journées d'Analyse statistique des Données Textuelles (JADT) 2018, Jun 2018, Rome, Italie (2018)
|
|
BASE
|
|
Show details
|
|
43 |
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017
|
|
|
|
In: 24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) : Analyse d'opinion et langage figuratif dans des tweets ; https://hal.archives-ouvertes.fr/hal-02362125 ; 24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) : Analyse d'opinion et langage figuratif dans des tweets, Jun 2017, Orléans, France. pp. 65-76 (2017)
|
|
BASE
|
|
Show details
|
|
44 |
Character Based Pattern Mining for Neology Detection
|
|
|
|
In: Proceedings of the First Workshop on Subword and Character Level Models in NLP ; https://hal.archives-ouvertes.fr/hal-02467738 ; Proceedings of the First Workshop on Subword and Character Level Models in NLP, Sep 2017, Copenhagen, France. pp.25-30, ⟨10.18653/v1/W17-4103⟩ (2017)
|
|
BASE
|
|
Show details
|
|
45 |
Ambiguity Diagnosis for Terms in Digital Humanities
|
|
|
|
In: Language Resources and Evaluation Conference ; https://hal.inria.fr/hal-01423650 ; Language Resources and Evaluation Conference, May 2016, Portorož, Slovenia (2016)
|
|
BASE
|
|
Show details
|
|
46 |
Towards diagnosing ambiguity of candidate terms ; Vers un diagnostic d'ambiguïté des termes candidats d'un texte
|
|
|
|
In: Traitement Automatique des Langues Naturelles 2015 ; https://hal.archives-ouvertes.fr/hal-01169996 ; Traitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France (2015)
|
|
BASE
|
|
Show details
|
|
47 |
Multilingual Event Extraction for Epidemic Detection
|
|
|
|
In: ISSN: 0933-3657 ; Artificial Intelligence in Medicine ; https://hal.archives-ouvertes.fr/hal-01294127 ; Artificial Intelligence in Medicine, Elsevier, 2015, 65 (2), pp.131--143. ⟨10.1016/j.artmed.2015.06.005⟩ (2015)
|
|
BASE
|
|
Show details
|
|
48 |
Intrinsic and extrinsic evaluation of boilerplate removal tool ; Évaluation intrinsèque et extrinsèque du nettoyage de pages Web
|
|
|
|
In: Traitement Automatique des Langues Naturelles 2015 ; https://hal.archives-ouvertes.fr/hal-01170005 ; Traitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France (2015)
|
|
BASE
|
|
Show details
|
|
49 |
Apports de l'analyse automatique multilingue pour la veille épidémiologique
|
|
|
|
In: Journées internationales d’Analyse statistique des Données Textuelles ; https://hal.archives-ouvertes.fr/hal-01075057 ; Journées internationales d’Analyse statistique des Données Textuelles, Jun 2014, Paris, France (2014)
|
|
BASE
|
|
Show details
|
|
50 |
Vers une approche « rhétorique » en TAL : application à la veille épidémiologique multilingue
|
|
|
|
In: SEPTET, Des mots aux actes ; https://hal.archives-ouvertes.fr/hal-01074771 ; SEPTET, Des mots aux actes, Editions Anagrammes, 2013, [13 p.] (2013)
|
|
BASE
|
|
Show details
|
|
51 |
Any Language Early Detection of Epidemic Diseases from Web News Streams
|
|
|
|
In: Healthcare Informatics (ICHI), 2013 IEEE International Conference on ; https://hal.archives-ouvertes.fr/hal-01073195 ; Healthcare Informatics (ICHI), 2013 IEEE International Conference on, Sep 2013, philadelphie, United States. pp.159 - 168, ⟨10.1109/ICHI.2013.94⟩ (2013)
|
|
BASE
|
|
Show details
|
|
52 |
DAnIEL, parsimonious yet high-coverage multilingual epidemic surveillance ; DAnIEL : Veille épidémiologique multilingue parcimonieuse
|
|
|
|
In: 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013) ; https://hal.archives-ouvertes.fr/hal-01074881 ; 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France. p.787-788 (2013)
|
|
BASE
|
|
Show details
|
|
53 |
Added-Value of Automatic Multilingual Text Analysis for Epidemic Surveillance
|
|
|
|
In: 14th Conference on Artificial Intelligence in Medicine ; https://hal.archives-ouvertes.fr/hal-01074535 ; 14th Conference on Artificial Intelligence in Medicine, May 2013, Murcia, Spain. pp.284 - 294, ⟨10.1007/978-3-642-38326-7_40⟩ (2013)
|
|
BASE
|
|
Show details
|
|
54 |
Parallel areas detection in multi-documents for multilingual alignment ; Détection de zones parallèles à l’intérieur de multi-documents pour l’alignement multilingue
|
|
|
|
In: 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013) ; https://hal.archives-ouvertes.fr/hal-01074950 ; 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France (2013)
|
|
Abstract:
National audience ; This article broaches a central issue of the automatic alignment : diagnosing the parallelism ofdocuments. Previous research was concentrated on the analysis of documents which are parallelby nature such as corpus of regulations, technical documents or simple sentences. Inversions anddeletions/additions phenomena that may exist between different versions of a document hasoften been overlooked. To the contrary, we propose a method to diagnose in context the parallelareas allowing the detection of deletions or inversions between documents to align. This originalmethod is based on the freeing from word and sentence as well as the consideration of the textformatting. The implementation is based on the detection of repeated character strings and theidentification of parallel segments by image processing. ; Cet article aborde une question centrale de l’alignement automatique, celle du diagnosticde parallélisme des documents à aligner. Les recherches en la matière se sont jusqu’alorsconcentrées sur l’analyse de documents parallèles par nature : corpus de textes réglementaires,documents techniques ou phrases isolées. Les phénomènes d’inversions et de suppressions/ajoutspouvant exister entre les différentes versions d’un document sont ainsi souvent ignorées. Nousproposons donc une méthode pour diagnostiquer en contexte des zones parallèles à l’intérieurdes documents. Cette méthode permet la détection d’inversions ou de suppressions entre lesdocuments à aligner. Elle repose sur l’affranchissement de la notion de mot et de phrase, ainsique sur la prise en compte de la Mise en Forme Matérielle du texte (MFM). Sa mise en oeuvre estbasée sur des similitudes de répartition de chaînes de caractères répétées dans les différentsdocuments. Ces répartitions sont représentées sous forme de matrices et l’identification deszones parallèles est effectuée à l’aide de méthodes de traitement d’image.
|
|
Keyword:
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; appariement de N-grammes de caractères; area detection and alignment; character N-grams matching; corpus de multidocuments; détection et alignement de zones; multidocuments corpora
|
|
URL: https://hal.archives-ouvertes.fr/hal-01074950/document https://hal.archives-ouvertes.fr/hal-01074950 https://hal.archives-ouvertes.fr/hal-01074950/file/ACTN-LECLUZE-2013-1.pdf
|
|
BASE
|
|
Hide details
|
|
55 |
Multilingual epidemic surveillance : a parsimonious caracter-based approach ; Veille épidémiologique multilingue : une approche parcimonieuse au grain caractèrefondée sur le genre textuel
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-01074940 ; Traitement du texte et du document. Université de Caen, 2013. Français (2013)
|
|
BASE
|
|
Show details
|
|
56 |
Daniel_corpus : a corpus for evaluating multilingual epidemic surveillance systems (2089 annotated documents in 5 languages). ...
|
|
|
|
BASE
|
|
Show details
|
|
57 |
Pour une approche cibliste en TAL : le cas de l'analyse automatique de la presse
|
|
|
|
In: Colloque international : Rhétorique et Traduction ; https://hal.archives-ouvertes.fr/hal-01071938 ; Colloque international : Rhétorique et Traduction, Jan 2012, Orléans, France ; https://www.septet-traductologie.com/manifestations-scientifiques/2007-2018/rhetorique-et-traduction/ (2012)
|
|
BASE
|
|
Show details
|
|
58 |
DAnIEL: Language Independent Character-Based News Surveillance
|
|
|
|
In: Advances in Natural Language Processing: 8th International Conference on NLP, JapTAL 2012 ; https://hal.archives-ouvertes.fr/hal-01071903 ; Isahara, Hitoshi and Kanzaki, Kyoko. Advances in Natural Language Processing: 8th International Conference on NLP, JapTAL 2012, Springer, pp.64-75, 2012, 978-3-642-33982-0. ⟨10.1007/978-3-642-33983-7_7⟩ (2012)
|
|
BASE
|
|
Show details
|
|
59 |
Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères
|
|
|
|
In: TALN 2011 ; https://hal.archives-ouvertes.fr/hal-01070769 ; TALN 2011, Jun 2011, Montpellier, France. pp.53-64 (2011)
|
|
BASE
|
|
Show details
|
|
60 |
A proposal for a multilingual epidemic surveillance system
|
|
|
|
In: User Centric Media ; https://hal.archives-ouvertes.fr/hal-01067792 ; User Centric Media, Springer, pp 343-348, 2010, Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, ⟨10.1007/978-3-642-12630-7_43⟩ (2010)
|
|
BASE
|
|
Show details
|
|
|
|