返回顶部

CCF语音对话与听觉专业工作组年会顺利召开

 

        8月14日,CCF语音对话与听觉专业工作组年会在青海省西宁市伊尔顿国际大酒店顺利召开。 为了让与会者更多了解语音和语言处理领域最前沿动态和技术发展方向,大会邀请了14位著名专家作大会报告和特邀报告。 上午9:00-10:30,大会报告正式开始,Wakayama University Hideki Kawahara教授为与会者带来 “Revisiting phase-based attributes for better understanding of speech sounds”报告, Nara Institute of Science and Technology Satoshi Nakamura教授带来“End-to-end approach to ASR, TTS and Speech Translation”报告。 Panel讨论在吴志勇、凌震华的主持下,陶建华、颜永红、吴玺宏、鲍长春、康永国、王海坤、鄢志杰和陈伟的深入探讨下逐步深入, 与会者对“语音对话与听觉信息处理的机遇与挑战”有了更清晰更深远的认识。





        本次大会为特邀报告开启了三个分会场,下午14:00-15:30,三个分会场同时开始特邀报告。
        第一分会场以“语音感知与识别”为主题,由哈尔滨工业大学李海峰教授带来“感知认知与语音技术的未来”报告, 百度公司贾磊博士带来“一种流式多级截断的在线注意力模型(SMLTA)”的报告,中国科学院声学研究所李军锋研究院带来“超临场感声通信关键问题与展望”的报告, 天津大学王龙标教授带来“面向语音情感识别的鲁棒性特征提取算法研究”的报告。



        第二分会场以“音乐人工智能”为主题,由北京大学陈晓鸥研究院带来“基于旋律深度表示的音乐相似性度量”的报告, 华东理工大学陈宁副教授带来“面向翻唱歌曲检索的特征提取与相似度计算”的报告,上海纽约大学(NYU Shanghai)夏光宇助理教授 带来“Music understanding and generation via AI”的报告,北京唱吧科技股份有限公司魏耀都博士带来“K歌后期的关键技术”报告。



        第三分会场以“语音合成与转换技术前沿”为主题,由搜狗公司孟凡博资深研究员带来“搜狗语音与多模态技术分享”的报告, 中国科学技术大学凌震华副教授带来“基于深度学习的话者转换”的报告,微软何磊带来“Neural TTS in Microsoft”的报告, 清华大学吴志勇教授带来“One-Shot Voice Conversion with Global Speaker Embeddings”的报告。



        本次会议的大会报告和特邀报告内容具有前瞻性、新颖性,并具有交叉性,为语音和语言处理领域的研发人员提供很好的借鉴和参考。在此我们对各位特邀专家的到来表示衷心的感谢! 此外,专业工作组全体会议、增选新委员会议及NCMMSC常设机构会议均顺利进行。



        在此感谢所有组织人员及与会者的付出。