CIIS 2022 | 科大讯飞刘聪：构建可信人工智能的五大路径

2022-09-22 16:47 来源：南方网

　　9月17-18日，由中国人工智能学会主办的第十一届中国智能产业高峰论坛（CIIS 2022）在厦门举办，为期两天的活动共举办了十五个专题论坛和四场同期活动。CIIS 2022从产业应用需求角度出发，解构人工智能商业实践现状，探索智能产业未来发展路径，为区域经济发展、产业布局和智能生态建设注入了新动能，累计吸引了线上线下550万人次参加。

　　如何构建可信、可靠、可解释的人工智能成为本届论坛讨论焦点，在18日下午，特设“可信人工智能专题论坛”，重庆邮电大学校长高新波教授主持论坛。科大讯飞研究院执行院长、语音及语言信息处理国家工程研究中心副主任刘聪与澳大利亚科学院院士和新南威尔士皇家学院院士、京东探索研究院院长陶大程、北京航空航天大学教授徐迈、上海人工智能实验室主任助理乔宇、西安电子科技大学综合业务网理论与关键技术国家重点实验室副主任王楠楠等分别进行了主旨报告。

　　刘聪以《科大讯飞人工智能技术、产业及思考》为题，介绍了科大讯飞在“顶天立地”持续探索可信AI方面的相关进展，并提出了构建可信AI生态体系的五大路径。

　　人工智能第三次浪潮的新坐标

　　刘聪介绍了第三次人工智能浪潮中的新突破，从2015年机器的语音听写准确率首次超过人类速记员，到2017年医考机器人首次通过国家执业医师考试临床综合笔试，再到2021年Alphafold2掀起人工智能加速蛋白质设计的热潮，在高歌猛进过程中，人工智能发展存在诸多隐忧，比如：AI算法的鲁棒性不佳、AI算法容易受攻击、AI算法可解释性弱等问题比较普遍，同时还存在利用AI算法诈骗等伦理问题，这些问题亟待解决，受到广泛关注。

　　刘聪认为，人工智能第三次浪潮发展的新坐标，应该以源头核心技术突破为原动力，用系统性创新推动产业规模化落地，来探索可信、可靠和可解释的人工智能体系，换而言之，要从技术创新、系统性创新向可信AI创新跨越。

　　“顶天立地”持续探索可信AI

　　创办23年来，科大讯飞始终坚持“顶天立地”的发展战略，承建了语音及语言信息处理国家工程研究中心、国家新一代人工智能开放创新平台、认知智能国家重点实验室等国家级平台，在语音合成、语音评测、语音识别、智医助理机器人、机器翻译、机器阅读理解、常识推理等方向奠定了人工智能领域的里程碑。

　　核心算法的持续迭代进步是打造可信AI的基础，刘聪介绍了科大讯飞在AI核心技术领域的最新探索和成果。

　　以语音识别为例，通用场景下的准确率从2010年的60.2%提升到现在的98.33%以上。语音识别的研究逐渐进入深水区，未来主要朝着两大方向发展，一是复杂场景下的语音识别问题，二是多语种语音识别问题，对语音识别算法的鲁棒性和推广性提出了更高的挑战。对此，科大讯飞做了何种突破？

　　刘聪分享道，针对复杂场景语音识别的问题，讯飞提出了语音增强与识别一体化的建模方法，利用语音识别结果提高语音增强的自适应性，实现了复杂场景下的高鲁棒性语音识别关键技术突破。在语音识别领域，最难的是“鸡尾酒会问题”，也即在远场、高噪音、多人、自由对话的复杂场景中进行识别。科大讯飞参加了专门针对这个问题的“史上最难语音识别任务”——国际多通道语音分离和识别大赛CHiME并连续三年获得冠军，但最低错误率仍达30.5%，距离落地实用还有较大的提升空间。

　　针对多语种语音识别的问题，刘聪介绍，科大讯飞提出了基于语种相似性迁移学习的多语种语音识别技术，通过混合建模和迁移学习实现跨语种数据共享，提高低资源语种识别效果。目前已经实现了从中文语音识别扩展到覆盖全球60个语种的多语种语音识别，其中35个主要语种识别平均准确率达到90%。在2021年的美国国家标准与技术研究院（NIST）多语种识别比赛中，科大讯飞参加所有15个语种22项比赛并全部获得第一名。另外，刘聪还介绍了在个性化语音合成、复杂场景下的图文识别、多模态感知和认知智能等方面的最新技术突破。

　　在“应用立地”方面，刘聪提出，在不同行业的场景，对可信AI需求的侧重点不同，例如对教育、医疗这样的国计民生的领域，对AI的可解释性要求会更高。

　　例如在医疗场景，智医助理参加2017年国家执业医师考试临床综合笔试，以456分超过96.3%的人类考生，基于智医助理应用的大数据，形成涟漪效应，系统持续学习和进化，打造出“数据-知识双驱动”的可信AI系统，通过推广“人机协同”的应用模式，为基层医生决策过程提供具备高可信度、高解释性的智能辅助诊疗支持。在教育场景，以系统性创新助力“因材施教”，通过融合贯穿全学科OCR识别、知识图谱、多维度学情画像、语义理解等人工智能核心技术，充分打通过程学情记录、学情分析、智慧教学等全流程环节，为教学实现减负增效。

　　构建可信AI生态体系的五大路径

　　从“单语种单场景”到“多语种多场景”、从“单模态智能”到“多模态智能”、从“算法创新”到“软硬件一体化创新”，刘聪介绍，成立17年的讯飞研究院始终坚持“面向世界前沿的技术创新、基于系统性思维的模式创新、前后贯穿的机制创新”，在智能语音、自然语言处理、计算机视觉等几大主流AI领域形成了全面布局，保持多项人工智能关键核心技术国际领先，并构建起“研究+工程+平台+资源”的完整研发体系。

　　面对未来，对于可信人工智能技术和产业整体态势，刘聪提出了构建可信人工智能生态体系的五大路径：

　　第一，在单点技术同质化的情况下，系统性创新可以有效推动复杂场景落地，并有效提升可信AI的能力；

　　第二，区分不同行业场景，对可信AI的类型和需求不一样，应该用“可信”来反向引导AI技术的规划；

　　第三，在复杂行业场景下迈向可信AI，人机协同是必要环节之一，可以有效推进可信AI技术的进步；

　　第四，实现可信AI，对人才结构提出新要求，需要促进各领域人才（如AI工程专家、行业专家、基础理论专家等）深度融合，鼓励发展复合型人才；

　　第五，可信AI攻防问题将常态化存在，建设公共演进平台可以促进可信AI持续进步。

　　此外，刘聪还参加了该论坛中以“可信人工智能的内涵及未来发展趋势”为主题的圆桌环节，刘聪与上海人工智能实验室主任助理乔宇、上海交通大学人工智能研究院常务副院长杨小康、浙江大学上海高等研究院常务副院长吴飞、福建省闽江学者特聘教授（厦门大学）王菡子、云南大学教授陶大鹏等专家学者一起，共同深入探讨了人工智能发展的机遇和挑战，以及如何共建一个更加可信、可靠、可解释的人工智能产业生态。

编辑：陈海敏责任编辑：廖智晟

返回南方网首页返回科创专区频道

报纸

杂志

网站

移动端

出版社

党务政务网站

CIIS 2022 | 科大讯飞刘聪：构建可信人工智能的五大路径