Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?

Finding coreferences in corpora is a difficult task for which the identification of singletons is an important issue. Solving this issue would allow for improving the process of corpus annotation and the identification of referential chains. To achieve this, it is important to determine whether or n...

Full description

Saved in:
Bibliographic Details
Main Authors: Hélène Manuélian, Catherine Schnedecker
Format: Article
Language:English
Published: Presses universitaires de Caen 2022-05-01
Series:Discours
Subjects:
Online Access:https://journals.openedition.org/discours/11729
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1832581849326551040
author Hélène Manuélian
Catherine Schnedecker
author_facet Hélène Manuélian
Catherine Schnedecker
author_sort Hélène Manuélian
collection DOAJ
description Finding coreferences in corpora is a difficult task for which the identification of singletons is an important issue. Solving this issue would allow for improving the process of corpus annotation and the identification of referential chains. To achieve this, it is important to determine whether or not singletons have linguistic properties of their own. After an overview of the question, the article presents a corpus study. Based on the results of the study, it is possible to “profile” the mentions of a referent remaining in the singleton state. A thousand mentions were studied in different genres and types of texts. The results suggest that the genre/text type and the ontological category of the referent predict the repetition or the absence of repetition of a referent in a text.
format Article
id doaj-art-5af2488339e9440288266de28c858100
institution Kabale University
issn 1963-1723
language English
publishDate 2022-05-01
publisher Presses universitaires de Caen
record_format Article
series Discours
spelling doaj-art-5af2488339e9440288266de28c8581002025-01-30T09:53:12ZengPresses universitaires de CaenDiscours1963-17232022-05-012910.4000/discours.11729Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?Hélène ManuélianCatherine SchnedeckerFinding coreferences in corpora is a difficult task for which the identification of singletons is an important issue. Solving this issue would allow for improving the process of corpus annotation and the identification of referential chains. To achieve this, it is important to determine whether or not singletons have linguistic properties of their own. After an overview of the question, the article presents a corpus study. Based on the results of the study, it is possible to “profile” the mentions of a referent remaining in the singleton state. A thousand mentions were studied in different genres and types of texts. The results suggest that the genre/text type and the ontological category of the referent predict the repetition or the absence of repetition of a referent in a text.https://journals.openedition.org/discours/11729annotationcorpuscoreferencetext genrereference chainsingletons
spellingShingle Hélène Manuélian
Catherine Schnedecker
Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
Discours
annotation
corpus
coreference
text genre
reference chain
singletons
title Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
title_full Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
title_fullStr Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
title_full_unstemmed Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
title_short Identifier les « singletons » dans des corpus français annotés en coréférence : peut-on prévoir l’absence de reprise coréférentielle ?
title_sort identifier les singletons dans des corpus francais annotes en coreference peut on prevoir l absence de reprise coreferentielle
topic annotation
corpus
coreference
text genre
reference chain
singletons
url https://journals.openedition.org/discours/11729
work_keys_str_mv AT helenemanuelian identifierlessingletonsdansdescorpusfrancaisannotesencoreferencepeutonprevoirlabsencedereprisecoreferentielle
AT catherineschnedecker identifierlessingletonsdansdescorpusfrancaisannotesencoreferencepeutonprevoirlabsencedereprisecoreferentielle