L’extraction d’entités nommées : une opportunité pour le secteur culturel ?
Non-structured descriptive metadata provide additional benefits for end-user comprehension. However, their unstructured nature minimize their usefulness in an automated, digital context. This article explores the potential and the limits of Named Entity Recognition (NER) and Term Extraction (TE) in unstructured data searches in order to extract some meaningful concepts. These concepts allow us to benefit from improved retrieval and navigation, but they also play a very important role in digital humanities research. Using a case study to promote NER and TE experiments, based on the descriptive fields of the historical archives of Quebec City, the authors assess four third-party entity extractors. In an effort to address both NER and TE to assess named entities, they use a quantitative approach based on precision, recall and F-score calculated on the "gold standard corpus". A second more qualitative approach then leads us to consider the relevance of TE and to address the issue of multilingualism.
Published in 2015 in Information, Données et Documents.
- metadata
- research
Read this article online
- Request a digital copy of this article.
- Comment on this article.
Cite this article in your work
Cite this article easily using its BibTeX entry:
@article{hengchen_docsi_2015,
author = {Hengchen, Simon and van Hooland, Seth and Verborgh, Ruben and De Wilde, Max},
title = {L'extraction d'entités nommées~: une opportunité pour le secteur culturel ?},
journal = {Information, Données et Documents},
year = 2015,
month = jun,
number = 2,
volume = 52,
pages = {70--79},
}
Alternatively, pick a reference of your choice below:
- ACM
- Simon Hengchen, Seth van Hooland, Ruben Verborgh, and Max De Wilde. 2015. L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données et Documents 52, 2 (June 2015), 70–79.
- APA
- Hengchen, S., van Hooland, S., Verborgh, R., & De Wilde, M. (2015). L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données Et Documents, 52(2), 70–79.
- IEEE
- S. Hengchen, S. van Hooland, R. Verborgh, and M. De Wilde, “L’extraction d’entités nommées : une opportunité pour le secteur culturel ?,” Information, Données et Documents, vol. 52, no. 2, pp. 70–79, Jun. 2015.
- LNCS
- Hengchen, S., van Hooland, S., Verborgh, R., De Wilde, M.: L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données et Documents. 52, 70–79 (2015).
- MLA
- Hengchen, Simon, et al. “L’Extraction d’Entités Nommées : Une Opportunité Pour Le Secteur Culturel ?” Information, Données Et Documents, vol. 52, no. 2, June 2015, pp. 70–79.
Discuss this article
- Discover all publications by Ruben Verborgh.
- Find related articles on Google Scholar.
- Post your questions or comments below.