语言学

莫利ère是他作品的作者

我们有长汤çonné Molière de ne pas avoir écrit ses pièces, dont le vé可乐作者是乌鸦。但’é莫利语言èRe和他的同时代人à Molière ce qui lui est dû.

Florian Cafiero和Jean-Baptiste Camps 对于Science n°507
本文保留用于科学用户
想象中的病人,molière

现在一百年前,宝èTe和小说家Pierre Louÿs lançait une polémique :他的几篇文章,特别是1919年10月16日在法国日报çais 时间, 争辩说’auteur d’Amphitryon. n’était pas MolièRe,但他杰出的当代皮埃尔科尔伊尼尔。从那以后,汤çon n’a cessé对父亲的重量é des pièces signées de Molière. Comment un comédien présumé sans grande éducation litté,这很忙é在国王和武士主任的家庭代客之间éâtre, aurait-il pu é写这么多厨师’œuvre ?

在此期间é紧随其后,几本书在这个问题上发表了几本书ème, défendant l’idée que Molière n’était en fait que l’COM的主要演员édies qu’它被分配给他。真正的G.énie litté皮埃尔科克居住会休息é dans l’阴影,利用IP的收入èce sans ternir sa réputation d’auteur sérieux, et sans s’暴露这些COM的争议édies souvent polé本来可能会引起。 

Très discutée, cette thè在d时曾拍过了新的维度ébut des annéES 2000,Dominique Labb的定量语言学é, de l’格勒诺布布尔和Cyril Labbé, de l’université格勒诺布尔1,认为IP的词汇表è这些乌鸦和molièRe太接近了这些œuvres aient été é由两个不同的作者批评érents, et, par consé那个康吉将有écrit les pièces de Molière. La nouvelle a été世界出版社恢复,évoquée ou défendue dans diffé报告和纪录片和一个même donné son sujet à un téléfilm.

但受欢迎程度é de cette thè不得隐藏很多réactions défavorables qu’elle a suscité在题字搜索世界中的esé语言学。要尝试决定问题,我们有récemment réaliséMoli文本的新分析èRe,乌鸦和他们的同时代人。 D.’après leurs ré来自的苏丹’être publiés, la théorie niant à Molière la paternité de ses pièces est erronée.

莫利ère ou l’Imposteur ?

争论离开à penser que Molière n’aurait pas écrit ses pièces sont d’历史第一。它没有发生在我们任何手稿,而不是mê我是一封信,一个纸条或草稿,那’它可以分配给他。他’agit là d’作为多产和c的作者的单一案例élèbre. Le moliérist georges林业,’université巴黎 - 索邦讷,注意事项说明’auteurs du XVIIe siècle, alors jugés de peu d’importance, étaient très rarement archivés,但更频繁étrururs。没有草案或pi手稿èces de Corneille n’a ainsi été conservé。根,他到了我们’un acte d’un projet de piè这终于被遗弃了é。如果他的后代l’ont précieusement gardé, c’可能是因为这个pièce n’a jamais été imprimée,那个草案é是唯一剩下的痕迹。没有什么令人震惊,所以,à找不到Moli的手的任何东西ère.

莫利ère

莫利的肖像èRe,它的真名Jean-Baptiste Poquelin(1622-1673),雕刻詹姆斯可能白白出版物ée在肖像库中:用记忆_,d’Arthur Thomas Malkin(伦敦,1833年)。

©shutterstock.com/georgios kollidas.

其他élément ayant prêté au soupçon : Molière aurait commencé à jouer les pièces de Corneille après un voyage à鲁昂在1643年,并将被置于à écrire ses chefs-d’œuvre après un sé在1658年的一天ême ville. Or Rouen é是Corneille的封口。这些诺曼陆地旅行他们会有été l’occasion d’ententes secrè两名男子之间? sp.écialistes de Molièdoust,不是家伙ère impressionnés par la coïncident。这是可能的,但无处可证é, que MolièRe和Corneille遇到了és sur place. Et l’没有痕迹’两名男子之间的任何协议。在他的信函中,康吉似乎’ailleurs indiffé在1658年的部队通过。第三è我是全国城市,鲁昂était régulièrement visitée由th的部队éâtre, qui n’y allaient pas né必然看到Corneille。

最后主要论点 : l’é莫利人才的迟交ère. Celui-ci é他所有的领导者都崩溃了’œuvre passé l’â37岁,哪个n’a pas manqué d’é雷。根据海马Wouters,比利时律师和作者éâ这将是唯一的案例« où un auteur médiocre jusqu’à40年不仅仅是深刻的,而是尤其是他时间最美丽的羽毛之一 »。如果这种情况确实很少见’histoire littéraire, elle n’est cependant pas inédite –Marcel Proust,James Conrad或Umberto Eco拥有ébuté des carrières litté就在迟到,并且有été couronnés d’un succès certain.

返回文本

过错’档案可以证明l’imposture supposée,历史争议似乎是领导à僵局。带来新的éléments aux dé蝙蝠,研究人员有écidé de s’inté拧紧文本自己ê我的。如果是文本标志és de la main de Molière é它可以靠近皮埃尔科克的近距离ê成为后者的标志’作者。 d的发现é多米尼克和西里尔劳格的分享é est simple : deux textes écrits par un mê我的作者有更多的词汇,而不是两个文本é由不同的作者写作é。作为基地的fréquence d’他们的表现在文本中的每个单词,他们计算é une « 互伸缩的距离 », qui mesure la différence entre deux textes dans le choix du vocabulaire. Si la 互伸缩的距离 séparant deux pièces est inférieure à一定的阈值,这意味着’elles ont été écrites par le même auteur.

皮埃尔科尔伊尔

雕刻肖像Pierre Corneille by Thomas Woolnoth

©shutterstock.com/georgios kollidas.

D’aprè■使用Dominique和Cyril Labb的计算é, les œuvres attribuées àCorneille和许多PIèces de Molière太接近了été é两个人的兄弟é年金。它会穿à相信Corneille有é暴击大多数领导者’œuvre signés de Molière (l’hypothè是否莫利ère aurait écrit les pièces de Corneille é这么多不可能,不可能以时间的正常原因)。

分析习惯’éCriture和Language Tics

自该创始工作以来,技术écouvrir l’auteur d’un texte ont évolué。他们的使用,都是照思主义者寻求à识别焊接ère un poème jamais signé只有智能服务émasquer l’auteur d’一个匿名信,s’est également étendu.

这些M.é方法是基于’习性统计分析’é写作和语言选择。在é写文本,我们留下了不由自主的足迹,即背叛我们的身份é :每个人都与FR一起使用équence particuliè单词,表达或语法结构。抬起它们é我们可以获得一个优秀的身份证ée de qui a écrit un texte.

自几年以来ées, la dé最常见的是ée pour révéler l’auteur d’文本是基于’人工智能。我们r.éunit d’abord une sé我们知道的文本的文字î提交人以确定性。我们进入了îne alors l’ordinateur à reconnaî这些文本的作者与最好的公关éCILICATION。然后我们提供匿名文本,机器公关édit l’最有可能的作者。

但要构建文本的类型档案D’作者,仍然需要être d’accord sur les piè这些作者有réellement rédigées. Or, dans notre débat, tout le monde n’est pas d’accord sur qui a écrit quoi. La théorie des « comédiens poètes », dé特别地由多米尼克标签竞争é,想要,如在展示中’humour d’aujourd’hui, dont on connaît l’interprè你很少是作者或作者,我们会在 XVIIe sièCLE提出了COMé主要和进入è无法引用剧作家。大约90 % des comédies de l’é选择会有été signées par un prête-nom. Si l’on veut prendre au sé这种可能性é我们必须采用另一种方法。

过错’总信任à l’自动学习D.’一台机器,同时确保最大限度的稳定性é我们的结论,我们使用过é, parallèlement, six méthodes différentes considérées可靠地区分’auteur d’un texte. Testé在三十大com的毒品上édies en vers écrites aprèCorneille和Moli的死亡è六位作者,其中三个éthodes pré在100中说好作家 占病例的%,两个93 % et une dans 87 % des cas.

Fréquences des mots

首先ère méThode简单à compter le nombre d’出现的每个单词出现ît dans les textes étudiés. On considè作为一个文本« sac de mots ». Les fréquences d’这个包中的每个单词的外观因’un texte à l’其他。这些fr的分布é签名 : à每个作者他的公关éfé至于词汇’il utilise.

我们有时可以考虑é某些变化周围’un mê我的话并不重要。用« galère » ou « galères », « vois » ou « voit » peut paraître indiffé什么是怨恨étant de dire « galère » plutôt que « navire », d’utiliser le verbe « voir » plutôt que « regarder »。共轭,多个等等只会是’意外与所选术语相比。在这种情况下,我们不在这个词上,但是在 引理 :使用« vois », « voit » ou « voyons » est alors considéré在计算中的用途« voir », un usage de « galères » comme un usage de « galère », 等等。但这是第二个ème méthode consistant à éStuder Lemmas,Intéressante en soi, s’est révélée一点不那么可靠(93 %)在我们的校准阶段’étude des mots.

选择的条款,无意识的表达

É研究其int中的词汇égralité peut toutefois géné一些偏见。我们的某些话的工作Dépend bien sû我们是谁,但也是我们在谈论的。如果是’on étudie des textes d’作者在近近风格,THèmes abordéS可以在词汇中产生比差异更多的变化érences de style des é楣。但是的语言éâ经典是极端的êmement codifiée,特别是对于知识产权èces é批评诗歌。在我们的案例中,对李的恐惧ées aux sujets n’est donc pas infondée.

然后可以想到两个相反的解决方案。我们可以选择不是’intéresser qu’用最大的照顾选择的词语 : ceux qui sont placés à韵。他们要求一个réflexion particuliè并且通常是très révélateurs de l’auteur d’un texte. Cette méthode axée关于押韵é关于我们的r的语料库测试ésultats corrects à 87 %. À l’反向,我们可以专注于最无意中选择的单词。这 单词工具 (« et », « de », « or », « mais »......)不太可能因主题而异é他们是特别的èrement fré还有什么允许’获得可靠的统计数据。他们长été considérés comme l’最相关的索引éterminer l’auteur d’文本,以及我们的语料库测试,résultats étaient corrects à 93 %.

命令élé在句子中,语法

五分之一ème méthode s’intéresse à l’ordre des éléments d’一句话。句子« 美丽的侯爵夫,你美丽的眼睛让我死了’amour » et « D’爱死让我,美丽的侯爵夫,你美丽的眼睛 »完全是mêmes mots, les mêmes lemmes, les mê我的工具。他们éthodes précédentes les considè因此与完全相同的一样。然而它是indé差异风格的罪行è真的在这两圈之间。

保持从中’information sur l’enchaî言语,我们可以考虑é文字不喜欢« sac de mots »但作为一袋« n - 表现ères ». Cette dernière expression dé只需签署傲慢înement d’un nombre n de caractères. Supposons que l’on dé组成pr短语écé5克角色的牙齿ères。注意到每个空间,我们将获得第一个ère :美丽,SHE_,LLE_M,LE_MA,E_MAR,_MARQ等 而第二,我们会有 : D’amo, ’amou,mour_等我们r.é然后通过单词工作,但是在这种类型的s中呼叫我们的计算équences.

最后的ère option explorée :作者的语法。É仅根据简单的结构缩减句子,à l’逆,根据特定的转弯èrement alambiquées,构成了风格的独特特征’une personne – l’单词工具最可靠的一个。为了衡量这些变化,我们注释了每个文本的语法性质,grâce à人工智能SPécialement entraînée sur des pièces de l’époque. Puis on étudie à quelle fré三种语法自然(类型)的继承« 个人代词/动词Concumugé / nom commun ») apparaissent.

如果四个和四是八,玉米绒n’a pas écrit Molière

我们已经应用了é ces six méthodes à un ensemble de comédies en vers écrites par MolièRe,Corneille及其同时代人。 L.’港口主要分析é sur 37 piè这些来自Pierre Corneille,他的FRè莫斯·莫利托马斯康星èRe,Jean de Rotrou和Paul Scarron。跟随每个’他们之间,所有IPèces de Molière ont été considéré由我们的算法如那些’un mê我作者,并清楚地区出来ées des pièces de Corneille – alors que d’其他作者,如甲群,似乎 ê我更接近莫里ère.

父母树é des pièces de Molière

父母树é des pièces de Molière和他的同时代人。

F. Cafiero和J.-B.营地

他第比尔ît donc plus qu’improbable que Molière ait servi de prête-nom à Corneille ou à d’autres dramaturges célè他的时间。过错énie pouvant le détrôner dans les cœurs和spirits,françAIS应该再次呆了一段时间« la langue de Molière ».

主题

杂志

订阅和ACC.édez à plus de 20 ans d'archives !

12号éros + 4 hors-série
在纸张版本+ numérique

+ ACC.ès illimité à plus de 20 ans d'archives

我是'abonne

订阅和ACC.édez à plus de 20 ans d'archives !

12号éros + 4 hors-série
在纸张版本+ numérique

+ ACC.ès illimité à plus de 20 ans d'archives

我是'abonne

我们的上一篇出版物

回到顶部