科大讯飞语音识别技术取得重大进展 说话人识别勇夺国际大赛第一

在刚刚结束的“2008 NIST Speaker Recognition Evaluation”——国际说话人识别评测大赛上,科大讯飞语音实验室送评的识别系统获得综合指标第一名的优异成绩。这是继科大讯飞2006、2007年蝉联国际英文合成大赛(Blizzard Challenge 2006/2007)第一名后,在语音研究国际大赛上获得的又一殊荣。本次大赛表明科大讯飞已经在全球语音技术领域内取得了从语音合成到语音识别技术的全面领先地位,“能听会说”的完整解决方案将对科大讯飞为代表的我国语音产业发展具有重大战略意义! 
   说话人识别技术,又称话者识别或声纹识别,是语音识别技术的重要方向和应用领域。该技术通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),从而识别出说话人的身份。其可以广泛应用于军事、国家安全和各产业领域。
   作为国际上规模与影响力最大、由NIST(美国国家标准技术研究院)从1997年开始举办的历届说话人识别评测大赛(http://www.nist.gov/speech/tests/sre/),都是国际一流的科研单位和企业角逐说话人识别技术桂冠的竞技平台。本届大赛的参赛单位达到了创记录的43家,其中包括CMU(美国卡耐基-梅隆大学)、MIT(美国麻省理工学院),Stanford(美国斯坦福大学),BUT(捷克博诺技术大学)、Motorola研究中心、IBM研究院等世界著名语音研究机构,国内单位还有清华大学、中科院声学所和中科院自动化所参赛。
   科大讯飞一直以国际领先的语音合成技术而闻名,而语音识别研究此前一直在默默耕耘。此前业界普遍认为中国语音识别研究距离美国、日本等发达国家尚有不小差距。而经过近年来在语音识别技术上脚踏实地的坚持努力,科大讯飞已经积累了深厚的语音识别研究基础并组建了高水平研发团队。这次在时间紧、对手强的竞争压力下首次参赛就一举获得殊荣,大大激励了中国语音识别研究队伍的士气。在本次大赛的三项测试指标“识别等错误率(EER)、最小检测代价(minDCF)、检测代价(DCF)”中,科大讯飞语音实验室报送的USTC-iFly系统获得EER、minDCF两项第一名、DCF第三名的优异成绩。此外,科大讯飞语音实验室与新加坡信息研究所(IIR)等合作报送的I4U系统获得了EER、minDCF两项第二名,DCF第一名的优异成绩。科大讯飞这一突出表现也再次引起了全球语音界的瞩目。
   作为业界公认的“中文语音产业国家队”,长久以来科大讯飞一直坚持“产学研用”相结合的创新机制,其在语音合成技术上一直保持绝对领先的优势。研发的中英文语音合成、口语评测技术都处于国际领先水平,应用产品占据了主流应用领域70%以上的市场份额,并在牵头制定中文语音的国家标准。科大讯飞语音实验室是中国科技大学和科大讯飞公司联合建立的研究机构,在国家863项目和国家自然科学基金委的长期支持下,专门致力于语音及语言技术的研究与产业化。此次在在语音识别研究上的一个重大突破对科大讯飞语音产业的发展有着重要的战略意义。标志着科大讯飞已经在语音合成、语音识别、口语评测等语音关键技术上处于全方位国际领先水平,可以为各行业合作伙伴提供更为完整的“能听会说”语音解决方案。这一进展对巩固科大讯飞产业领导者地位和拉动语音技术在各行业深入应用都将起到积极促进作用。
   作为全国唯一以语音技术为主要产业化方向的“国家863计划成果产业化基地”、“国家规划布局内重点软件企业”和“国家火炬计划重点高新技术企业”,科大讯飞将继续致力于为各行业合作伙伴提供最优的技术、最完整的产品方案及最优质的服务,加大产业化力度,通过语音技术的进步为大众百姓更便捷的获取信息服务做出自己的努力。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注