[Profile picture of Ruben Verborgh]

Ruben Verborgh

L’extraction d’entités nommées : une opportunité pour le secteur culturel ?

Simon Hengchen, Seth van Hooland, Ruben Verborgh, and Max De Wilde

Non-structured descriptive metadata provide additional benefits for end-user comprehension. However, their unstructured nature minimize their usefulness in an automated, digital context. This article explores the potential and the limits of Named Entity Recognition (NER) and Term Extraction (TE) in unstructured data searches in order to extract some meaningful concepts. These concepts allow us to benefit from improved retrieval and navigation, but they also play a very important role in digital humanities research. Using a case study to promote NER and TE experiments, based on the descriptive fields of the historical archives of Quebec City, the authors assess four third-party entity extractors. In an effort to address both NER and TE to assess named entities, they use a quantitative approach based on precision, recall and F-score calculated on the "gold standard corpus". A second more qualitative approach then leads us to consider the relevance of TE and to address the issue of multilingualism.

BibTeX other citation formats

Published in 2015 in Information, Données et Documents.

Keywords:

Read this article online

Cite this article in your work

Cite this article easily using its BibTeX entry:

@article{hengchen_docsi_2015,
  author = {Hengchen, Simon and van Hooland, Seth and Verborgh, Ruben and De Wilde, Max},
  title = {L'extraction d'entités nommées~: une opportunité pour le secteur culturel ?},
  journal = {Information, Données et Documents},
  year = 2015,
  month = jun,
  number = 2,
  volume = 52,
  pages = {70--79},
}

Alternatively, pick a reference of your choice below:

ACM
Simon Hengchen, Seth van Hooland, Ruben Verborgh, and Max De Wilde. 2015. L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données et Documents 52, 2 (June 2015), 70–79.
APA
Hengchen, S., van Hooland, S., Verborgh, R., & De Wilde, M. (2015). L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données Et Documents, 52(2), 70–79.
IEEE
S. Hengchen, S. van Hooland, R. Verborgh, and M. De Wilde, “L’extraction d’entités nommées : une opportunité pour le secteur culturel ?,” Information, Données et Documents, vol. 52, no. 2, pp. 70–79, Jun. 2015.
LNCS
Hengchen, S., van Hooland, S., Verborgh, R., De Wilde, M.: L’extraction d’entités nommées : une opportunité pour le secteur culturel ? Information, Données et Documents. 52, 70–79 (2015).
MLA
Hengchen, Simon, et al. “L’Extraction d’Entités Nommées : Une Opportunité Pour Le Secteur Culturel ?” Information, Données Et Documents, vol. 52, no. 2, June 2015, pp. 70–79.

Discuss this article