全新AI语音芯片、双麦AIoT模组,科大讯飞硬核技术助力智能家电创
据艾瑞咨询的数据显示,2017 年中国智能家居市场规模为 3342.3 亿元,其中智能家电规模为2828.0亿元,占比87%。预计到 2020 年智能家电的市场规模将达到 5155.0 亿元。
智能家电的市场前景广阔,其中智能家电的快速发展离不开语音交互技术的突破。可从行业技术应用的实践上,语音识别面临三大挑战:
1、 误唤醒
在使用智能家电的过程中,有人曾遇到这样的情况:正听着音乐,机器突然停止,跳至唤醒指令页面。或没有唤醒机器,机器自主发声,把人吓着。
2、 高噪环境
由于应用场景环境复杂,可能会有噪音、混响等,这将会扰乱机器“收听”和分析。
3、 方言口音
中国省份较多,各地方言复杂,且语言本身的多样、多义性会导致机器的语音识别率、语义理解力不足,可能出现答非所问。
对此,科大讯飞采用领先的AI核心技术,从端+云对智能家电进行超强技术方案升级。在科大讯飞全球1024开发者节上,科大讯飞和合作伙伴推出专为家电设计的全新CSK400X 系列芯片。
科大讯飞芯片之路
科大讯飞AI研究院执行院长王智国表示,科大讯飞是一个开放创新平台,为AI芯片提供强有力的支撑:科大讯飞在AI的核心技术上,提供AI计算特点和需求,帮助进行芯片的软硬件设计;在行业经验上,提供行业专家的指导、专业人员保障;在产业生态上,开放产业生态和共享合作伙伴。除此之外,科大讯飞提供声学结构评估、场景深度优化、声学效果测试和提供个性化的AI应用定制服务。
科大讯飞基于核心技术而成的中英文语音合成芯片,已提供系列嵌入式语音合成芯片:例如XFS3031CNP 中文语音合成芯片、XFS5152CE 中英文语音合成芯片、XF-S4240 中文语音合成模块等。
在多年的AI芯片研发技术积累下,科大讯飞推出与联合生态合作伙伴为家电行业打造的专用语音芯片CSK400X系列。
CSK400X系列芯片算力达到128GOPS,与讯飞语音算法深度耦合,通过深度神经网络算法来解决家居的噪音问题,支持本地化远场交互,并支持200个命令词。
该系列芯片上植入了全栈语音能力,涵盖降噪、回声消除、语音分离、本地和云端语音识别、本地和云端语音合成,以及在线全双工交互能力。
1、前端可支持更多路麦克风组合,从2路到4路到7+1路;
2、支持200个唤醒词作为命令词;
3、基于神经网络的前端处理;噪音抑制性能卓越(-15db以上);回声、混响消除(-20db以上);
4、基于神经网络的唤醒识别算法;拾音距离超过10米,唤醒误触发的几率低,有效唤醒几率高(大于95%)
此外,CSK4002 还具备一定的可编程性、可复用性和可扩展性,其高计算力拓展到其他应用领域,例如视觉计算和图像识别等。
目前该芯片已经量产并应用于家电智能空调领域,很快能见到落地产品。
“云+端”双麦AIoT模组,赋能家电创新
除了 AI 芯片,科大讯飞一直致力于通过 AI 技术为家电赋能:
从2011年的单麦离线年多麦离线年的iFLYOS云端操作系统。
而在今年,基于最新家电专用语音芯片,科大讯飞为智能家电推出的“云+端”双麦AIoT模组集成方案,专为家电语音交互场景设计的神经网络语音唤醒和离线识别算法,达到实时、稳定、可靠的效果。
针对上述说的三大挑战,科大讯飞以20年的技术积累来逐一突破:
讯飞麦克风阵列算法可实现客厅、厨房等复杂噪音场景下,支持语音播报打断;高噪环境下,离线%;离线个命令词,复杂环境下平均识别率可达93%。双麦AIoT模组接入了iFLYOS云端操作系统,可调用280多个精品技能和海量精品内容。
该模组提供可靠丰富的交互方式,在线、离线均可控制;并提供全双工交互,语义上下文的理解。模组还提供多维度可定制的服务,例如可定制唤醒词,定制交互逻辑,发音人也可以定制,甚至如果你期望命令词是方言的话,该模组也可定制。通过多维度定制化的服务,科大讯飞助力家电厂商造自己个性化的产品。
除此之外,科大讯飞还对家电厂商采用讯飞方言云服务来提供全方位的方言服务,目前已支持24种方言的识别与合成。其中,对粤语、四川话、东北话、河南话、天津话、山东话、宁夏话等方言的识别准确率高达90%以上。
科大讯飞不仅提供方言识别与合成技术,科大讯飞与合作伙伴正在共同打造智能家电多语种的交互方案,助力中国智能家电开拓海外市场,预计2019年底完成支持英语方案,2020年第一节度完成俄罗斯、西班牙语的方案支持,后续将有泰、日、韩、德、意、阿等语言的支持计划。
高性价比离线方案
科大讯飞除了提供以上对联网的家电双麦AIoT模组,对于无需联网的家电产品,科大讯飞推出了高性价比的离线、本地化双麦模组(XFHEA-221-LX),主控为CSK4002,支持全双工交互,识别200个本地命令词,一次唤醒,多轮对话,同时支持识别过程中的播报打断,让人机交互更自然。
2、本地化单麦模组(XFHEA-121-LX),主控为CSK4001,支持音频播报,识别100个本地命令词。
3、合成芯片(XFS6001),主控为CSK4006,支持男、女声发音,支持中文、英文、中英语音合成,支持方言、英文、童声合成语音播报。
由此,多种方案覆盖多种家电离线场景,运用在线离线一体化技术助力智能家电创新。
我们看到拥有20年AI语音技术的科大讯飞,正以其先进前沿的AI技术协助家电厂商打造自身个性化的创新产品,正以开放共赢的心态来努力打造混合正交的商务生态。
正如科大讯飞轮值总裁胡郁所说:“每一个公司都有自己的人工智能、大数据、云计算,彼此正交的不同公司需要并能够建立紧密的合作。在新的生态下,知识、经验、数据、利益的分享变得更加重要,通过混合的方式建立新生态下的共赢合作是成功的关键。”