设为首页 加入收藏 中外合作办学属于公益性事业。国家对中外合作办学实行扩大开放、规范办学、依法管理、促进发展的方针。中外合作办学教育网 www.cfce.cn www.hzbx.cn
2018年9月10日全国教育大会,习近平总书记提出,要扩大教育开放,同世界一流资源开展高水平合作办学。
中外合作办学属于公益性事业,是中国教育事业的组成部分。
您的位置: 首页 > 新闻中心 > 各地动态 > 正文

语音与多模态智能信息处理实验室在2019 国际语音盛会上荣获大奖

2019-11-03 14:33 作者: 中外合作办学教育网 来源: 昆山杜克大学 浏览:
摘要:在近日结束的国际语音盛会 Interspeech 2019闭幕式上,DKU SMIIP Lab团队获得多项国际大奖。 大会宣布昆山杜克大学和联想研究院的 DKU-LENOVO 联合系统在今年的副语言语音属性评测中ComParE2019夺得冠军;在DIHARDII说话人日志挑战赛中获得第二名;在VoxSRC...

在近日结束的国际语音盛会 Interspeech 2019闭幕式上,DKU SMIIP Lab团队获得多项国际大奖。

大会宣布昆山杜克大学和联想研究院的 DKU-LENOVO 联合系统在今年的副语言语音属性评测中ComParE2019夺得冠军;在DIHARDII说话人日志挑战赛中获得第二名;在VoxSRC说话人识别挑战赛中荣获第三。

什么是Interspeech?

Interspeech是由国际语音通信协会ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。作为年度一次的语音界盛会,全球众多语音领域以及人工智能领域的知名学者、企业以及研发人员都会前往出席会议。

ComParE ,语音领域的重量级评测

ComParE (The Interspeech 2019 Computational Paralinguistics Challenge) 是INTERSPEECH 举办的一项重大比赛,目的是探索语音当中的副语言属性,即除了语言信息之外的其他特征信息。

ComParE 已经连续举办十年,是语音领域的重量级评测。比赛的目的是根据语音信号,识别或检测各类副语言语音属性,比如情感识别、哭声检测、嗓音病理识别、方言语种识别等。语音是语言的声音表现形式,里面不仅包含了语言语义信息,同时也传达了说话人、语种、性别、年龄、情感、信道、嗓音、病理、生理、心理等多种丰富的副语言语音属性信息。副语言语音属性识别,就是分析语音中除内容之外的各类信息。

今年 DKU SMIIP Lab 在昆山杜克大学电子与计算机工程系副教授李明的带领下联合 LENOVO AI Lab联合组队DKU_LENOVO 参加了其中的两个子项目赛事,分别是鲸鱼叫声检测任务和困倦等级评测任务。

在鲸鱼叫声检测任务中,实习生巫海维等采用最佳单系统使用基于卷积神经网络的深度特征,配合后端传统分类器,计算最终得分。在困倦等级评测任务中,我们采用的 Fisher Vector 和深度神经网络的融合系统。我们的参赛队伍DKU_LENOVO在鲸鱼叫声检测测试集上达到了94.8%的正确率,显著优于官方提供的86.6%的基线和其他单位系统。在鲸鱼叫声检测任务中超过巴黎大学和索邦大学联队,稳居第一。同时参赛的有20多家单位,包括 Idiap 研究所、卡耐基梅隆大学、慕尼黑大学、台湾清华大学等众多知名研究机构。

DIHARD II, 一项“困难的”说话人日志任务

DIHARD II 是一项“困难的”说话人日志任务,也就是针对那些具有挑战性的多说话人混合录音,识别“who speak when”,也就是识别哪一段语音是哪个说话人说的这一基础问题。本次比赛,美国南加州大学,捷克布尔理工大学、俄罗斯语音技术中心,网易有道、中科大、印度科学院,西班牙萨拉戈萨大学等著名高校均参加了此次比赛。在李明副教授的带领下,DKU SMIIP Lab的实习生林庆建等在此次国际测评中获得参赛队伍的第二名。

VoxSRC,说话人识别挑战赛

VoxSRC(VoxCelebSpeaker Recognition Challenge)是由 VoxCeleb 数据集官方发布的说话人识别挑战赛。这项挑战的目的是探索现有方法下如何从真实场景获得的语音中识别说话人。数据集来自 YouTube 上的名人访谈视频,包括专业编辑和红毯访谈的音频,以及在一系列背景噪音、笑声和其他环境下的对话音频。本次挑战赛包含给定数据集及开放数据集两个任务。

DKU SMIIPLab与天脉聚源(TVM)联队,在昆山杜克大学电子与计算机工程副教授李明的带领下,大数据研究中心SMIIPLab的研究助理覃晓逸,实习生蔡炜城等,采用基于深度神经网络模型提取说话人编码特征(speaker embedding)的系统参赛,在捷克布尔理工大学(BUT)、美国约翰霍普金斯大学(JHU),美国斯坦福研究所(SRI),微软(Microsoft),平安等众多强队中脱颖而出。在开放数据集任务上仅次于 BUT 和Microsoft,在本次参赛队伍中荣获第三名。

此前,SMIIP Lab团队还曾获2018 NIST SRE 声纹识别竞赛(Speaker Recognition Evaluation)国际第四名,东方语言语种识别竞赛(Oriental Language Recognition Challenge)短语音识别任务国际第二名,以及多目标说话人检测及鉴别竞赛(Multi-target speaker detection and identification Challenge Evaluation)国际第三名。

(责任编辑:中外合作办学教育网)
分享收藏

联系中外合作办学教育网:

中外合作办学微信公众号:CRSEDU

中外合作办学总编辑(何曜)QQ:6851451

中外合作办学学历认证QQ群:258264403

中外合作办学研讨会QQ群:312766271

中外合作办学机构QQ群:348193713

中外合作办学自主招生QQ群:397108797

新浪微博:中外合作办学

电子邮箱:crsedu#163.com(#换@)

教育部批准的中外合作办学本科名单

教育部备案的中外合作办学专科名单

推荐中外合作办学机构
上海纽约大学 宁波诺丁汉大学 西交利物浦大学 吉林大学—莱姆顿学院 上海交大密西根学院 中国人民大学中法学院 中山大学中法核工程与技术学院 北航中法工程师学院
最新文章
推荐文章
热点文章
中外合作办学教育网 打造中外合作办学教育信息服务平台!