不明白不明白 不明白不想要为什么我的心
新华网南京4月21日电 2023中国网络媒体论坛于4月20日至22日在南京举行。21日上午,在“技术赋能·拓展融合发展新空间”平行论坛上,与会嘉宾展开深入讨论,共话行业未来。
微博COO、新浪移动CEO王巍在会上发表主旨演讲。
图为微博COO、新浪移动CEO王巍作主旨演讲。新华网 陈杰摄
以下为部分演讲实录:
尊敬的各位领导,各位同仁,大家上午好。今天很高兴能够参加2023中国网络媒体论坛。
刚才听到各位领导各位专家的发言,我也深有感触。在今年的全国两会上,“扎实推进媒体深度融合”被首次写入政府工作报告。作为媒体融合10年发展的亲历者,我有幸与新浪一同参与其中,并在实际业务中不断拓展融合发展的新空间。
接下来我想以微博为例,跟大家汇报一下全媒体时代新技术的发展,以及我们如何利用AI技术为微博赋能。
人工智能的发展正在呈现这样一个趋势:数据的海量化和多模态化,模型的复杂化和通用化,以及算力的高效化和规模化。具体来讲,我们看到最近的四个方向:一是数据的多模态融合;二是超大规模的图计算;三是AI研发的“哑铃模式”;四是模型从专业走向通用。
微博也遵循这样的趋势,在业务中逐步采用了符合潮流的新技术。今天分享微博在内容推荐方面的一些探索:
微博的推荐系统整体来说分4个架构,内容理解、用户理解、内容审核以及推荐系统。
北京冬奥会期间,我们通过内容理解和信息的检索技术,将谷爱玲夺金后的热门子话题进行分类召回,同时使用Bert的双向编码转换器,深度模型来生成“内容指纹”,对召回的图像视频也进行关联,形成了像“谷爱凌”“自由式滑雪”“青蛙公主”“斯坦福学霸”“520馅饼”等多个涉及体育、教育、美食等方面的关键话题词。
除此以外,还有“我们要想要成为谷爱玲”“每天睡够10个小时”“谷爱玲边吃馅饼边等分数”等这样的一些爆款题材。这些内容经过我们运营人员的人工审核,这一步非常关键,审核以后去服务于热点的聚合分发和推荐。
除了对微博内容的深入理解,还有一项很重要的工作就是内容审核过滤的保障。为了进一步贯彻落实“清朗”系列专项行动的要求,我们依托海量的微博内容,自研了预训练模型,对站内的数据进行深度情感分析,从而建立了包括粗俗冒犯、网暴预测等方面的识别能力,对可能遭受言论攻击的用户进行提前保护。
微博用户理解方面,我们其实使用的是超大规模模型,用于更好理解用户的阅读兴趣是什么。大家知道微博是一个社交媒体平台,它其实是天然的社交网络图谱,所以把图谱应用在我们的超大规模模型上面是比较契合的。
我们的用户和博文作为超大规模网络图形当中的节点,大概有10亿规模,用户和博文之间的关系、用户和用户之间的关系,建立一个百亿规模的关系模型,就可以更好理解用户的兴趣。
在理解了微博用户的兴趣和内容后,我们就通过推荐系统,将内容高效地分发给对这个内容感兴趣的用户。在这里我们采用的其实就是多场景的建模方式。我们把微博中大量的消费场景融合在一个模型里面,通过网络参数在场景中的共享,或者是场景自己独有的网络参数,来体现不同场景之间模型的差异性。
最后,我还想再补充说一下我们对于技术的态度。曾经有人说过算法没有价值观,但是我们认为算法价值观体现的是背后掌握算法的人的价值观,所以多年以来我们一直践行这样一个价值理念,用资深的运营团队审核团队努力去训练AI,努力使我们的算法具有正确的价值观。
在深层次AI来临的时代,我们也需要用人类反馈的增强学习这样的监督式学习来保证正确的价值观。我们也相信这样的价值理念能够让AI逐渐成为媒体发展的核心力量,为媒体融合拓展出新的空间,为社会创造更大的价值。