腾讯新闻算法负责人刘军宁:打破眼下推荐系统短程贪婪的历史局限
腾讯新闻《一线年腾讯ConTech技术大会上,腾讯新闻算法负责人刘军宁从技术角度切入,发表题目为《人机协同、信息破茧-腾讯ConTech技术实践与布局》的主旨演讲。
首先,刘军宁分享了他所观察到内容行业近年来三个值得注意的趋势特点:
第一个趋势特点,就是人机协同,相向进化。他觉得人工机能算法的应用,正在进入一种人机之间深度融合的握手阶段。人和机器之间彼此适应靠近,这当中不只是算法突破,人机结合的工具整体系统进化也至关重要,这是贯穿整个ConTech技术布局当中一个主线策略。
第二个趋势特点,是内容载体形态不断加速演化。媒体已经经历了纸媒、广播、电视、PC、互联网时代和手机信息六个时代,再到沉浸式小视频,历经各种变迁,接下来VR、AR 360度视觉向立体化的演化也会逐渐到来。与时俱进,快速适应新媒介形态,为内容生产、分发带来一些新需求。
第三个趋势特点,就是用户从沉浸式兴趣、娱乐式消费到逐渐对内容深层次的本质价值回归趋势。对内容价值,尤其是内容多元价值诉求的回升,刘军宁觉得内容归根结底要为人服务,有更深层次的价值。对内容信息、深层次价值的需求也是需要重点思考的方向之一。
基于上述变化趋势,刘军宁和团队规划了腾讯新闻ConTech技术的布局,这里面涵盖了从内容的生产、准入、处理、分发到整个线条。在技术线条的底层贯穿于全流程,他们正在打造一个全面立体的内容理解矩阵,这里面包括的内容理解,除了内容分类、安全相关度、版权等等识别维度以外,也在逐渐构建一些对内容深层次价值内涵理解的维度, 比如说内容的受众面、调性、知识价值、新闻性和世界脉络等等。
在内容生产方面,腾讯新闻打造了智能内容生产引擎青云系统,其负责承担内容生产加工中全部素材的检索、筛稿、文本纠错到摘要生成、自动写作、智能配图等等,辅助人工加工内容的工作,以达到人机结合,提升生产效率。在内容分发方面,腾讯新闻希望打造个性化的、以搜索智能语音助手为依托的下一代的智能内容分发系统。
刘军宁表示,ConTech技术布局背后的主线思路就是人机协同,“我们一直希望将人的经验、智慧赋能给机器,与此同时机器可以放大人的智能,在这个过程中机器替代人做一些事情,人可以逐步解放出来,从事一些更高端,甚至是创造性工作。”
现阶段人机结合是,重复性的工作机器可以代替人类,初级也基本上可以代替人类,中等难度的任务是可以部分替代,少量依然还是需要人工审核判断,很多深度的还需要人来做。
人和机器分工的边界在哪儿?机器要对自己的预测、识别、判断有自信度的判断,在机器结果自信度不高的时候,就需要求助于人。自信度判断,是系统设计当中特别重要的方面。
刘军宁介绍了一些腾讯新闻在人机协同实践上尝试的小例子。腾讯新闻应用深入学习迁移训练的技术,训练一个内容受众面的预估模型,可以在一个内容刚刚入库、还没有分发的时候就根据其内容特征预估受众面的大小。这个模型对原始内容进行处理,综合所有内容上的文本、图像、视频特征,以及迁移预训练当中的经验,来预估这个内容影响力大小。这对于面向未来场景的高效运营是非常重要的。刘军宁给出的两个例子,一个是体育方面的,一个是娱乐方面的,从中可以看到预测值跟真实值误差非常小。
接着是智能纠错的例子。人写文章的时候,校验稿件是非常枯燥的事情,那怎么才能把人从这项工作中解放出来呢?“将人类经验规则浓缩成规则体系,做错误检测和判别模型。”刘军宁介绍,目前的方案处于业界领先水平,每天可以处理来自腾讯内外的纠错请求达到101万篇。
介绍智能写作系统时,刘军宁表示,从原始系统中提取数据形成稿件,可以在天气、体育等领域快讯写作上,形成24小时不间断写作。目前已经完成了24亿字写作,替代了大量的人力。
最新的应用是自动生成短视频,在腾讯新闻青云生产引擎当中,研发了一个可以基于输入的图文,自动形成短视频的工具。“这是一个综合性算法能力的工具系统,综合了多项算法能力,包含了从图文中提取关键句进行图文生成,最终形成视频。”刘军宁说。像这样的短视频,青云系统每天可以生产1000条。
近年来,AI的进步,带动着数据个性化推荐系统的不断进步和演进,在刘军宁看来,个性化推荐系统已经刚刚经历了在深度学习的基础上从单模态到多模态、从单任务到多任务、从Pointwise到Listwise的探索和演进。
单模态和多模态是说,不只考虑行为,还要考虑内容文本特征、图像特征、视频特征和音频特征,所有信号都要考虑进来。单任务到多任务是什么意思?原来只能预估一个线下的点击率,显现在考虑结合内容点击后,消费完成度的预估,点赞率、评论率、复播率,多个任务联合共享。然后再联合其他形成最终分数排序。
多任务并不是有多个目标,打个比方像足球队有多项训练任务,包括体能、力量、技术,但目标只有赢球一个。多任务学习也一样,联合训练比单独训练的结果更好。
Pointwise到Listwise就是说原本的模型,可能只对一个推荐的候选人进行打分,依据这个打分系统对所有的内容排序形成最终推荐的List。Listwise不一样,它是要考虑最终的内容间的关系,它们组合起来是不是一个最佳组合,这不是内容独立打分,而是Listwise对整个内容的打分,选最好的推荐List。以上这些都是推荐系统近年来很大的突破和提升。
目前腾讯新闻在多模态和多任务、Listwise都已经走在了技术前沿。近期在多任务学习的共享网络上提出了自己的自主创新,很大提升了共享学习的效率,也带来了人均客户端时长19%以上的提升。但是推荐系统真的是一个非常有挑战的AI任务。目前的技术阶段到5年、10年后回头来看,“我相信处在早期初级阶段。因为目前的推荐系统基本上是谋当下的贪婪算法。”刘军宁说。
他认为,无论是它在试图最大化,还是在最大化一次曝光列表上的效果,都还只是一个近期短程的优化,还有待于从这个图当中,从Pointwise到Listwise,再到Sessionwise。用户为他喜欢的内容所包围,久而久之见到的世界已经是不真实、有偏的信息环境,新鲜的东西没有机会接触到,这对人的长期信息价值是有损伤的。
针对这个现状,腾讯新闻也会生成对抗网络,用深度强化学习等等技术手段,结合对内容价值深层次理解的推进和产品上的联动创新,探索优化更长程的用户体验,在内容分发上形成闭环,配合打开眼界,收获平台的价值使命。
刘军宁最后提到,人是最复杂的,优化像推荐系统这样人机交互的复杂体验,可能是AI面临的一个挑战任务之一。之前关于个性化推荐系统,是从短程效应评估的角度上得出的。如果站在历史的高度,要真正肩负起打开眼界,信息破茧的使命,就必须迈出现在推荐系统短程贪婪的历史局限。考虑更多长程效率,还要在更长的时间尺度上去理解人对信息和内容消费更本质的诉求,不能够只谋当下,还要谋未来、谋长程的用户体验和信息价值,相信这一天迟早会到来。