研究人员开发多媒体诱发词误解的语料库

一种新的英语'耳朵滑倒的新语料
MaríaLuisaGarcíaLecumberri和Martin Cooke,位于巴斯克大学的语言和语音研究小组的实验室之一。信用:NuriaGonzález。UPV / EHU.

完全安静的环境实际上是非常罕见的。大多数时候,有一些环境噪音存在,包括交通、机械或谈话。母语使用者对某一特定语言和说话的语境有丰富的经验,他们有很强的能力重建被噪音掩盖的部分信息。然而,有时仍然会出现错误。包括García Lecumberri博士、Ikerbasque研究教授Martin Cooke和合作者在内的一个研究小组发现了3207个“一致的”困惑。这些困惑据说是一致的,因为在每一种情况下,都有相当多的听众表示同意。这种类型的混淆在语音感知模型的构建中极为重要,因为任何能够犯同样错误的模型都很可能经历与人类听众相同的过程。

研究研究涉及超过300,000个单独的刺激演示到212个不同的听众条件。由此产生的语料库是英语唯一的同类语料库,可在以下网址获得http://spandh.dcs.shef.ac.uk/eccc/。对于每一种混淆,语料库都包含语音和声音的波形,一组听众听到的记录,以及音位转录。不同类型的混淆在语料库中出现的频率不同。在最简单的情况下,很明显,噪音掩盖了混淆词的某些部分,迫使听者提出一个最符合可听到片段的词(例如,“木制的”→“木制的”;“pánico”→“pan”)或用一个音代替另一个音(“ten”→“pen”;“眉毛→法拉”)。在其他情况下,听者似乎合并了噪声本身的元素(“钱包”→“允许的”;“ciervo”→“热带美洲雨季”)。最后,研究人员发现了一些奇怪的情况,产生的词和混淆之间几乎没有联系(“modern”→“suggest”;“guardan→博罗”)。 In these cases, the interaction of the speech and noise signals is complex, and therefore interesting.

García Lecumberri博士说:“这些研究有助于揭示潜在的机制,我们更好地了解这些过程,我们越多,我们就可以帮助技术和临床水平听力受损的人理解问题。“本集团还引发了类似于同一网页的西班牙语的类似语料库。”西班牙语和英语混淆之间存在相似之处和差异:西班牙语是一种高度变形的语言,导致更多的混乱词最终位置;英语有更多数量的单音琴字单词和一组更丰富的词汇最终辅音,导致这个位置的更多替代类型错误。“然而,两种语言都显示了类似的模式噪音类型,有些声音比其他声音保存得更好。


进一步探索

处理语言的能力随着年龄的增长而下降

更多信息:理查德·马科斯等人,噪声诱发的英语单词误解语料库,美国声学学会杂志(2016)。DOI:10.1121 / 1.4967185
期刊信息: 美国声学学会

由...提供巴斯克大学
引文:研究人员开发噪声引起的噪音误操作的多媒体语料库(2017年2月20日)从//www.puressens.com/news/2017-02-multimedia-corpus-noise-inducedumed-misperceptions.html
此文件受版权保护。除作私人学习或研究之公平交易外,未经书面许可,任何部分不得转载。本内容仅供参考之用。
1股票

反馈到编辑

用户评论