靠技术破解玄学的整体思路,其实就是AI方法论的最新实践,一方面体现在对多媒体信息的语义理解能力大大加强,另一方面靠流行的“大模型”思路,挖掘出更多深层的人货关系。然而,在应用这些AI能力之前,大规模的模型训练、部署和推理能力,是重要的基础,因此,基础设施的重要程度远超以往的机器学习。
会上分享的信息量很大,我帮大家拆解翻译一下,腾讯广告这次的系统升级可以理解为“123”,也就是“一大平台,两大模型,驱动三大指标”——在太极机器学习平台之上,构建“混元AI大模型"和"广告大模型"这两个大模型,让腾讯广告系统更加智能,助力广告主“起量、稳定性和成本”三大效果指标的达成。
大多数技术升级是“缝缝补补又三年”,为啥腾讯广告这次要大费周章且不计成本地从机器学习或者说大模型这个角度来做技术升级?
先从底层的太极机器学习平台的重要性说起。大家都知道,现在一天在系统上跑的广告数量,和十年前都不能在一个维度做对比了。这中间的广告营销数据体量可以说是浩如烟海,不仅体量大,维度还多。提升推荐的准确性,得在一个大规模的机器学习平台才能玩得转。另外,广告模型的在线更新、持续迭代等业务需求,也对底层的平台提出更大挑战。工欲善其事,必先利其器,这次蒋杰在会上介绍的太极机器学习平台,就好比是高端制造中量身打造的工业母机。
值得关注的是,太极有个核心组件——分布式参数服务器AngelPS。它可支持10TB级模型训练、TB级模型推理和分钟级模型发布上线,而且各种先进的硬件加速能力都能利用。它的存在,能大大提升模型的发布和上线速度,效率和稳定性都上去了,自然就不再是玄学,不再需要堆计划来搏起量概率。
大模型的前瞻性,之前的文章聊了很多,就不赘述了。那么混元AI大模型和广告大模型,这俩又都是干什么的呢?
混元AI大模型,是腾讯自研的多模态AI模型,它能把素材里的视频、音频、文本联合起来理解,像人一样去解读和分析一则素材的商品、参数、宣传点等。
听起来,这是个挺困难的任务,但大公司嘛,在这些基础研究上投入得起,混元AI大模型上线后,就横扫了跨模态检索领域5大权威测评集大满贯,在多模态理解领域国际权威榜单VCR、CLUE自然语言理解分类榜、CLUE总榜上都排第一。很多小伙伴可能感受不到这些奖项意味着什么,简单来说,有了混元AI大模型,广告素材里面的具体信息都被理解的明明白白,比如有几个人?是素人还是明星?在演什么情节?广告表达的情绪是什么?卖的是什么商品?广告系统都能了然于心。
而广告大模型,是一个千亿维参数的广告决策模型。在广告的精排过程中,它可以把更长期更细致的历史数据、更多场景与页面的上下文信息、更大规模的样本都用起来。有了这么大的模型,量变带来了质变,算法逐渐产生了超越人类经验发现商机的智慧曙光。比如说:新品上市,市场部不知道哪些用户会感兴趣怎么办?原有用户群逐渐饱和,如何探索新的市场空间?不同定价的产品,怎么自动找到合适的受众?这些问题,在广告大模型的支持下,应该说都能产生质变。
关于大模型,我们在《千亿参数的广告模型,是怎样炼成的?》一文中有过更详细的介绍,大家可以参考。
实际上,这些能力也好、模型也罢,核心都是在用最新的AI方法论,构建数字广告场景中的两个核心能力:一个是理解能力,另一个是运算能力。