6. 面向未来,坚定前行

1. 阿里妈妈广告引擎技术进入新时期

阿里妈妈作为国内互联网电商广告的标杆,过去几年正经历着快速变化。阿里妈妈内投广告产品从2019年的“三驾马车” (直通车、钻石展位、超级推荐)时代,迎来了2020年的爆发式创新(超级直播、超级互动、极速推等)时期,又在关键的2021年进入了以万相台为代表的“ 全域自动驾驶 ”时代。

在这个风起云涌的过程中,广告引擎作为承接广告流量、实现产品功能、满足客户诉求的核心系统,支撑着广告产品和算法技术的蓬勃发展。在当下流量红利逐渐减退、商家经营全面进入数智化,同时技术创新进入深水区、计算更加绿色低碳的新时期,阿里妈妈广告引擎技术正在经历着脱胎换骨的进化。

本文分享阿里妈妈内投广告引擎在工程架构上的最新发展,以及广告引擎中的召回、策略、创意技术的演进方向。

2. 轻装上阵,广告引擎的Serverless之路

从全图化到Serverless化

阿里妈妈广告引擎经过多年、多个阶段的迭代,已经逐渐走向了 全图化架构 —— 引擎的数十个模块基本都是基于C++算子 + 图(DAG)的迭代模式,多个模块的DAG组成了引擎整体的业务大图。

图1. 阿里妈妈广告引擎架构

然而,各个模块的DAG相对独立和静态,使得整个引擎的“业务大图”难以灵活变换和优化。主要原因在于,各个模块仍然在使用传统的“面向服务”的迭代模式,存在几个难以解决的问题:

  • 研发关注视角分散 :面向服务迭代,需要所有开发同学(包括算法同学)知晓并熟悉系统物理部署的各种细节(应用、机房、容量等),这无疑增加了业务同学不必要的关注成本,提高了迭代难度。

  • 研发交付粒度过粗 :尤其在重数据的模块,发布一个小功能也需要完整地更新一遍应用实例、重新拉取数据,大大降低了发布效率。而对于高速迭代的广告业务和算法来说,交付效率至关重要。

  • 跨模块复用难度大 :不同团队负责不同模块,久而久之容易形成不同模块技术框架和数据表达的高度个性化(存储选型随意、Schema不统一、Session滥用等),从而加大了跨模块开发和优化的难度。而代码的跨模块复用、跨业务复用更是无从谈起,无形中产生了大量不必要的重复建设。

    9293dd375d1e020672b3109d73bb11ba.png

图2. “面向服务”的迭代模式

因此,从面向服务的迭代模式进化到 Serverless 的迭代模式,来降低迭代成本、提升交付效率、实现能力复用,是我们的必然选择。

广告引擎Serverless化的挑战

云原生时代,Serverless从理念到基础设施愈发成熟,各大云厂商从传统的提供IaaS、PaaS基础设施,逐渐向提供SaaS、FaaS等云原生产品的方向延伸,而Serverless便是PaaS和FaaS的精髓所在。然而,目前Serverless的落地主要是以事件驱动任务、数据分析处理、微服务容器化等非重计算、对延迟不敏感的场景为主。而对于广告引擎这样低延迟、重数据、重计算的在线系统,Serverless的落地应用还并不多。

  • 低延迟 :考虑到流量规模和用户体验,广告引擎处理一次请求的延迟在百ms级,对系统的吞吐和性能要求极高。

  • 重数据 :系统中既有广告索引、模型这样的大内存数据,也有上百份的异构小数据,难以实现存储计算分离,在数据的安全构建、实时更新、平稳切换上存在着很大挑战。

  • 重计算 :海量广告检索、无处不在的模型计算、CPU/GPU/NPU多种硬件的异构计算,使得广告引擎的计算模式非常多样,算力需求持续增长。

让业务能力“漂移”起来

面对广告引擎低延迟、重数据、重计算的挑战,我们向Serverless演进的主要解法是:

  • 统一运行时 :所有模块选择统一的运行时框架,来托管PaaS层的能力,尤其是管理各种数据的分发,让业务开发同学能够 只关注业务逻辑 ,降低了迭代难度。这个统一的框架,从之前的ControlFlow(控制流)模式全面切换到DataFlow(数据流)模式,在业务编排上带来了性能优化的空间;同时,通过解耦业务逻辑表达(DAG描述)和运行时执行,框架底层可以引入对逻辑图的编译优化(算子融合/并行/调序等),使得运行时性能可以持续优化,确保引擎的高吞吐和 低延迟 。(工程框架和管控平台的全面升级,得益于阿里妈妈引擎平台兄弟团队的优秀工作)

  • 统一数据抽象 :将引擎依赖的各种数据统一抽象为Table(倒排/正排/KV等),业务开发只需要配置化地依赖Table,即可在自己的DAG中去直接消费。所有数据表在可视化的管控系统中进行管理,运行时框架负责数据表的拉取和切换,业务代码则直接拿到可用的数据表指针进行使用。这样就实现了数据调度对业务开发的透明,很大程度上解决了 重数据 依赖的问题,提升了交付效率。

  • 统一业务抽象 :在统一运行时框架、统一数据抽象之后,继续对业务编程接口和算子进行规范化:算子的输入输出均为标准Schema的数据Table、去除对Session的依赖,从接口上让算子功能内聚;同时合理抽象所有算子的颗粒度,算子粒度变小之后,复用性大大提升,实现了业务算子在引擎所有模块之间“ 漂移 ”的效果,让 重计算 的业务引擎变得灵动起来。在领域对象+业务算子标准化的基础上,还可以逐步实现业务子图、乃至业务解决方案的复用,使得业务能力的沉淀、新业务的快速组装成为可能。

图3. Serverless化的迭代模式

上述的解决方案看似朴素,实现起来难度极大,从顶层设计到实现细节都充满了挑战。目前我们已经在广告引擎的召回、策略等关键子系统,实现了Serverless的升级,今年即可实现整个引擎的全面Serverless化。

3. 厚积薄发,召回引擎持续打开想象空间

召回技术,持续精进

召回技术是搜推广领域的核心技术之一,它的挑战在于如何从海量物料中准确、快速地筛选出最匹配的候选集,决定了广告效果的天花板。阿里妈妈的召回技术经过了几代演进,从传统的基于关键词/人群的召回,到近些年主流的向量化召回,再到这两年最热门的基于模型的召回,始终引领着业界最前沿的探索方向。在最传统的关键词召回方向,我们深耕出了 层次竞买图 等新颖的召回技术。尤其是在基于模型的召回方向,无论是搜索广告的图学习(SMAD、DC-GNN)、双曲空间模型(AMCAD),还是展示广告的树检索(TDM)、 二向箔 (DVF),都在持续推高召回技术的天花板。(延展阅读: TDM到二向箔:阿里妈妈展示广告Match底层技术架构演进 从二值检索到层次竞买图——让搜索广告关键词召回焕然新生

持续演进的召回算法的背后,是大数据量、大计算量的挑战,依靠的是强大的工程引擎支撑。目前,阿里妈妈的广告引擎,已经积累了相当丰富的召回能力:

图4. 召回技术沉淀

召回架构,大道至简

沉淀这些召回能力的过程,也是我们对架构重新梳理和抽象的过程。从最简洁和共识的角度出发,我们把召回引擎重新定义成MatchServer、Trigger、Searcher三个逻辑角色:

  • MatchServer :负责整体召回流程的编排调度,包括调用Trigger获取各种召回信号、调用Searcher获取广告候选集、对召回结果进行统一的后处理。这里涉及多路调用和计算,在子图编排上有非常灵活的空间。

  • Trigger :输入User、Query、Context特征,输出各种召回信号(Token)。这里涉及大量分布式数据的查询、以及上文所述的各种召回算法。在一次流量中,MatchServer会调用多种Trigger来获取多种信号,是召回算法迭代的主阵地。

  • Searcher :输入各种召回信号,输出广告候选集(Ad)。这里涉及高性能的倒排/正排索引的检索、各种业务逻辑过滤、以及各种排序操作,是广告引擎中计算和数据最重的模块之一。

需要注意的是,MatchServer、Trigger、Searcher是逻辑架构层面的抽象。在Serverless的可“漂移”架构下,三者之间的算子,可以根据数据规模、本地/远程计算模式等实际情况进行灵活的组合,从而形成最合适的物理架构。

图5. 召回架构抽象

值得一提的是,在我们的抽象设计下,阿里妈妈搜索、展示、内容广告引擎的核心数据Schema是统一的,结合Serverless的统一基础设施,很容易让MatchServer、Trigger、Searcher的算子和子图进行低成本的 跨业务复用 。这也开创了将算法和业务能力进行平台化沉淀的先例。

一套架构,在离线复用

随着用户行为日益丰富、广告深度持续增长,基于在线引擎Trigger、Searcher的两阶段召回的计算开销越来越大,为了满足在线引擎严苛的延迟要求,Trigger、Searcher两阶段的检索不得不面临着截断,从而影响到了召回效果的全局最优、以及广告主的投放顺畅度。为了解决这个问题,阿里妈妈展示广告在近两年研发了基于Blink流批一体技术栈的“ 大规模无截断召回系统 TFMS ”,通过离线预计算的方式,为在线两阶段召回很好地补充了更丰富的召回候选集。(TFMS延展阅读:https://arxiv.org/abs/2102.09283)

在迭代TFMS的过程中,我们发现了两个优化方向:是否可以统一在线、离线两套召回的技术栈,降低迭代成本?以及是否可以让在线和离线的计算资源弹性复用?结合上文介绍的MatchServer、Trigger、Searcher的召回架构范式抽象,我们很快发现,在线和离线完全可以共享同一套系统架构、以及大部分的业务代码,然后便可以非常自然地共享计算资源,这与我们Serverless的理念是非常一致的。

图6. 在离线统一召回架构

在离线复用一套架构的想象空间在于,可以通过智能的 算力分配技术 ,自动化地调节在线和离线召回的计算资源,从而让系统资源在高利用率下能够保持安全稳定,同时产出最大的业务价值。

4. 使命召唤,策略引擎成为增长新驱动力

自动出价时代,策略技术持续演进

标准的广告排序公式可以表达为:eCPM = pCXR * bid,其中bid代表着广告出价。可以看出,一次广告请求中的召回、粗排、精排、重排的过程,正是pCXR和bid计算的准确性不断提升的过程,预估和出价越准确,广告主就越能够获得更适合自己的流量、投放效果和平台收益也就越高。因此,出价(Bidding)一直是广告机制策略体系中非常核心的技术。

近几年,随着阿里妈妈广告产品中客户诉求和优化目标表达的多样化,广告出价也早已超越了客户自主设置点击出价的阶段,已经发展出了基于点击/收藏/加购/成交等 多优化目标的自动出价 产品技术体系,尤其是万相台这样的“自动驾驶”广告产品,更是将自动出价技术的产品价值发挥到了最大。在这个过程中,阿里妈妈的自动出价算法技术,也从早期的oCPX,演进到当前的BCB、MCB,以及最新的USCB等技术。与此同时,机制策略的另一大关键技术——拍卖(Auction)技术,也从经典的GSP、uGSP,演进到最新的 Deep GSP 和Neural Auction等技术。可以看出,以出价和拍卖为代表的策略算法技术,在广告产品中扮演着越来越重要的角色。(延展阅读: 阿里妈妈展示广告智能拍卖机制的演进之路

策略算法演进的过程,也是策略工程体系升级的过程,从早期的以精排单阶段出价为主,到现在的粗排、精排、重排 多阶段出价 ;从基于公式的出价,到基于模型的出价;从离线简单数据反馈+在线简单出价公式,到离线训练+实时调控+在线出价的端到端工程平台,策略工程体系已经发展出了独具特色的技术路线。

端到端的策略工程平台

依据策略参数和模型的生产-消费角色,可以将策略工程平台划分为三个子系统:

  • 离线训练系统 :支持强化学习和超参寻优的计算场景,以SDK的形式提供了解决机制策略优化问题常用的强化学习工具包和超参寻优工具包,其中强化学习工具包集成了DQN、DDPG、A3C、PPO等主流强化学习算法,超参寻优工具包集成了ES、CEM等多种超参寻优算法。训练系统产出的模型交付给调控系统使用。

  • 实时调控系统 :具备实时数仓能力,以及流批一体的数据处理、模型计算、IO调度能力,稳定、实时地支撑百万量级广告的策略参数调控。调控系统产出的策略参数交付给在线系统使用。

  • 在线出价系统 :支持各种出价和拍卖算法,根据策略参数计算每个广告在每个流量上的出价,从而影响广告最终的排序和投放效果。

图7. 策略工程平台

一次开发,按需集成,多处生效

作为策略效果迭代的主阵地,策略在线引擎的迭代有两大明显的趋势:

  • 多阶段策略复用 :如上文所述,出价策略已经覆盖到了粗排、精排、重排等多个阶段,各阶段的出价逻辑要保持一致性,那么就需要相同的策略算子和子图在引擎的各阶段能够尽量复用。但是,不同阶段的计算特点不同,比如粗排广告比精排大一个数量级,但是精排广告比粗排计算精度要高,因此需要算子和子图能够以本地集成和服务化调用等多种形式来灵活部署和访问。这正是我们上文介绍的算子“漂移”能力的典型场景。

  • 跨业务能力复用 :搜索广告、展示广告、内容广告各自特有的机制策略虽然存在一定差异,但在策略技术体系上、尤其是基础的策略工程能力上(参数查询、特征计算、轻量级模型、日志回流等),有着共同的范式。通过上文介绍的统一数据抽象+统一业务抽象,我们实现了策略算子在多个业务之间最大程度的复用,让万相台等横向跨渠道投放的业务具备了“ 一次开发,多场景生效 ”的策略迭代能力。

图8. 策略在线引擎

5. 日新月异,创意引擎展开未来生态蓝图

阿里妈妈智能创意技术

创意是广告与用户交互的载体。好的创意形式和内容,会给用户体验和广告效果带来显著提升。广告创意一部分来自于广告主自己的制作,另外一大部分来自于算法的智能制作。多年来,阿里妈妈在 智能创意 上已经积累了深厚的技术和产品能力。

  • 图文创意方面 ,从基于设计师模板的拼接创意,到基于制作手法的动态描述创意,取得了很好的视觉效果的同时,还衍生出了智能延展、合成图美颜、人物换装等颇具想象力的技术。

  • 视频创意方面 ,包括基于模板和元素的剧本创意,以及基于对已有视频剪辑加工的剪辑视频,并且研发出了多模态时空剪辑、动效视频、直播片段剪辑等特色技术。

这些智能创意技术,让阿里妈妈广告更加原生化、更吸引人,同时能够覆盖更多的流量场景、获得更好的投放效果。

端到端的智能创意平台

创意算法的演进,背后是全链路的数据能力和强大的工程平台的支撑。 阿里妈妈智能创意平台 ,经过多年的积累已经颇具规模,整个平台包括了面向运营和设计师的创意中心、统一的创意与素材存储中心、标准化的数据Schema和更新链路、元素级的创意实时拼图服务,以及支撑算法核心能力的创意制作和投放引擎等。

图9. 智能创意平台
  • 创意制作引擎 :负责对素材库中的原始图/文/视频素材进行加工处理,根据上述各种智能制作算法,制作出可用于在线投放和优选的创意素材。创意制作引擎具备高吞吐的请求响应能力、高性能的模型服务能力,日均可生产千万量级的各类型创意素材候选集。

  • 创意投放引擎 :负责将离线制作好的创意素材,根据在线流量特征,进行个性化的优选和组装,从而生成最终展现给用户的完整创意,完成从创意生产到投放的闭环。这里主要的挑战在于,要将各种素材以最优的组合方式投放在非常多样化的流量场景上,满足样式和内容原生、用户体验良好的同时,带来更好的投放效果。

丰富的创意生态工具

智能创意平台除了能够制作海量的广告创意并投放到海量的流量上,还提供了丰富的图/文/视频内容的创作工具(阿里妈妈创意中心:https://chuangyi.taobao.com/),帮助广告主及生态伙伴轻松使用AI能力来高效制作高质量的创意。

图10. 创意生态工具

例如,短视频制作工具“绘剪”,只需要输入商品链接,即可 一键生成 指定尺寸和投放渠道的短视频创意。而“混剪”工具,可以将商家普通的商品介绍视频,按照不同的算法脚本(例如“全面种草”),一键生成可用于营销推广的短视频创意。“一键生成”的背后,是创意制作引擎模型服务强大的算法和工程能力。阿里妈妈智能创意平台正在将多年的技术积累和创新,打造成丰富的产品和生态能力,让商家的营销如虎添翼。

6. 面向未来,坚定前行

本文分享了阿里妈妈内投广告引擎的最新技术成果,包括Serverless化的引擎架构、富有想象空间的召回架构、端到端的策略工程平台和智能创意平台等。在这些技术积累的背后,是我们对卓越和极致的追求、对更高迭代效率和更好研发体验的探索。真正好的技术和平台,从60分做到80分不容易,从80分做到99分更具挑战。我们会持续探索和打磨令人兴奋的工程技术平台,面向未来创造更多业务价值。欢迎大家持续关注和交流~

▐ 关于我们

我们是阿里妈妈业务引擎工程团队,致力于打造新一代智能化、Serverless化的广告业务引擎。我们的工作涉及搜索/展示/内容广告引擎、广告索引和策略数据链路、智能创意制作和投放引擎等,欢迎感兴趣的伙伴加入。

投递简历邮箱:

alimama_tech@service.alibaba.com

也许你还想看

广告库存管理系统性能优化实战

面向数智营销的 AI FAAS 解决方案

广告深度学习计算:异构硬件加速实践

‍广告深度学习计算:召回算法和工程协同优化的若干经验

关注 「阿里妈妈技术」 了解更多 ~

祝各位大朋友今天快乐呀~

喜欢要"分享",好看要"点赞"哦ღ

↓欢迎留言参与讨论↓

▐ 摘要CTR(Click-through rate)预估一直是推荐/广告领域重要技术之一。近年来,通过统一模型来服务多个场景的预估建模已被证明是一种有效的手段。当前多场景预估技术面临的挑战主要来自两方面:1)跨场景泛化能力:尤其对稀疏场景;2)计算复杂度:在线计算和存储资源有限情况下如何实现多场景模型构建。针对这两个挑战,本文提出AdaSparse,一种通过自适应学习稀疏网络的方法来实现多场景C... 1. 引言本文提出的方案已被WSDM 2023接收,论文:Boosting Advertising Space: Designing Ad Auctions for Augment Advertising,下载:https://dl.acm.org/doi/abs/10.1145/3539597.3570381信息流产品为了保障用户体验通常会严格限制信息流中的广告曝光占比。稀缺的广告展示坑位难以满... 导读: 传统拍卖机制不存在了!出价产品智能化成为行业发展趋势,自动出价(Auto-bidding)已成为互联网广告主营销的主流,经典效用最大化模型(Utility Maximizer)的假设已经不再能良好地刻画此类广告主,传统拍卖机制在Auto-bidding下的激励性质和最优性需要被重新思考。▐摘要数字广告是互联网平台的主要收入来源之一。近年来,很多广告主开始采用自动竞价(Auto-biddi... 其中,在营销层,革新了以往功能繁多操作麻烦的BP,给广告主带来一种新的对话式交互体验,广告主只需要通过简单的自然语言的描述,即可实现全部的营销流程,大大简化了广告主的操作和学习成本。,现实环境中的竞价环境是非常复杂且动态变化的,只控制预算无法满足更多样的出价计划的进一步优化。AlphaGo的惊艳表现,展现了强化学习的力量,而自动出价是一个非常典型的序列决策问题,在预算周期内,前面花的好不好会影响到后面的出价决策,而这正是强化学习的强项,因此第二阶段我们用了基于强化学习的Bidding。 导读:今天以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来,也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变,进而颠覆广告营销模式。广告技术人,你们准备好了吗?阿里妈妈技术已提前在该方向布局,并推出了新的广告营销智能技术体系,今天将揭露出其神秘面纱的一角,窥探背后的思考和实践。▐ 摘要出价产品智能化成为行业趋势,极简产品背后则是强大的自动出价的支撑,... 本文尝试将拍卖机制的几个经典问题做脉络性梳理,重点阐述概念之间的演进关系。希望可以勾勒清楚技术全貌,有助于大家系统性地认识计算广告领域的拍卖机制设计。丨目录: 1.初识广告拍卖机制和相关博弈论基础知识 2.社会福利最大化的有效机制3.平台营收最大化的最优机制4.经典广告拍卖基本框架和预告进阶篇5.参考文献搜索、推荐和广告在过去几年互联网蓬勃发展的浪潮中起到了核心助推引擎的作用,三者技... 丨本文作者:茂道、羲洋、君之、天柏1. 业务背景算法同学在日常工作中经常要面临一些耗时较多的临时工单,这类工单的问题类型五花八门,背后对应的原因也各不相同,例如广告主操作类问题、大盘流量波动问题、海选问题、粗排问题等。这类Case每次都需要耗费较长时间单独解决,没有办法沉淀相应的工具和知识体系,随之带来的是算法团队开发诊断代码工作量大、开发周期长、不宜维护等问题。为了有效地持续提升工单处理效率,算... 一、背景大规模信息检索一直是搜推广领域的核心问题之一,而基于任意复杂模型的检索方案无疑是业界重要的迭代方向之一。近年来,阿里妈妈展示广告Match团队与预测引擎团队专注于从算法与工程角度推动工业级大规模检索技术的研发,我们在基于任意复杂模型的检索方向上积累了一定经验并取得了不错的业务效果,现整理发布NANN(Neural Approximate Nearest Neighbor,以下简称NANN)... 1. 背景精排预估打分是在线广告系统里非常重要的环节,其中打分准确性会极大地影响客户效果,也会影响用户体验和平台收益。精排预估打分为前链路打分和后链路打分,以 CPC(Cost Per Click)计费模式为例,前链路打分指点击率(Click-Through Rate,CTR),后链路打分指点击后客户获得的效果,这里的效果可以有很多种,常见的有成交量、收藏量等。前链路打分主要用于广告排序:特指预估... 一、概览随着全球主要市场陆续出台个人信息保护政策,互联网生态中的数据安全和用户隐私保护问题变得越发重要且日趋严格。如何在营销场景下安全合规的使用数据,维护在线广告商业模型的核心运作,成为当下广告生态中各企业亟需解决的问题。阿里妈妈一直注重对于隐私数据的安全合规使用,最大限度地保护用户隐私和数据安全。本篇分享阿里妈妈在保护数据安全和用户隐私方向的Data Clean Room实践产品营销隐私计算平台... 丨本文作者:木行、相遇、冰瞳、堇华、青礞、子瑞、叶卿等动态算力系列文章:???? 动态算力起源-阿里妈妈展示广告引擎的“柔性”变形之路 [2020] https://www.infoq.cn/article/wEaIlWl7076Id2bQptAq????阿里妈妈展示广告引擎新探索:迈向全局最优算力分配[2021]????阿里妈妈展示广告引擎动态算力再探索:面向业务收益的机器自适应调配[2022]在绿色计算... 1. 背景为提升易用性和降低使用成本,大数据技术逐步向Serverless、一体化和智能化方向发展。为了更好的提升客户投放效率和效果,阿里妈妈自研了超融合多模智能引擎Dolphin(以下简称“Dolphin”)。其最初定位解决通用OLAP(OLAP全称Online Analytical Processing)在圈人场景计算性能问题,历经5年的技术发展与沉淀,目前已形成覆盖OLAP、AI、Strea... 问题定义召回操作通常作为搜索/推荐/广告的第一个阶段,主要目的是从巨大的候选集中选出相对合适的条目,交由后链路的排序等流程进行进一步的择优。因此,召回问题本质上就是一个大规模的最值的搜索问题:对于评分和候选集,给定输入,寻找固定大小的的子集,使得 {,} 在 {,}尽可能靠前。这个问题本身非常简单直接,而其核心在于其巨大的规模。通常,在阿里妈妈广告场景中,召回的候选集规模能达到... 1. 背景视频中物体分割是视频理解的基础算法,也是对淘宝商品视频分析和加工所依赖的重要能力。传统的视频分割任务一般分为两种类型:一种是VOS(Video Object Segmentation),该任务需要在第一帧给出物体的初始分割标注,并在此基础上对视频后续帧中的标定物体进行跟踪和分割;另一种是VIS(Video Instance Segmentation),这个任务目标是在预定的物体类别范围内... ✍???? 本文作者:持信、弈臻、悟放、积流、孟诸1. 摘要为商品图片上特定位置配上装饰性文案来突出重点在广告业务中有着十分广泛的应用前景。然而,现有的图片文案描述生成系统均生成与图片位置关系无关的文案,无法很好地应用到广告业务中。在本文中我们提出了一种新的文案生成任务——图上文案生成,并基于商品图片数据提出了一个大规模图上文案数据集CapOnImage2M。为了更好的利用上下文以及商品本身的信息来生成... 年味愈浓,春节将近。阿里妈妈技术年刊如约而至~2021 年 5 月,我们开始通过「阿里妈妈技术」微信公众号持续分享我们的技术实践与经验,覆盖广告算法实践、AI 平台及工程引擎、智能创意、风控、数据科学等多个方向。值此辞旧迎新之际,我们整理了过去一年颇具代表性和创新性的工作沉淀,制作成这本 500 多页的电子书,涵盖机制策略、召回匹配、模型优化、智能创意、算法工程/引擎/系统建设等内容。这些工作... 丨目录: 1.背景 2.业务问题 3.业界解决方案 4.技术方案 5.应用示例 6.业务收益 7.总结1. 背景随着业务朝向精细化经营增长,阿里妈妈商家端营销产品更加聚焦客户投放体验,旨在帮助商家提升经营效果,在变化的市场中找到确定增长。近年来,商家端算法业务使用的数据是离线T+1甚至T+7更新,为进一步捕捉用户意图,更全面实时的挖掘潜在需求,利用实时行为及投放效果帮助... 新年伊始,万象更新!转眼,阿里妈妈技术已陪伴大家走过601天~在此,感谢每位读者朋友的支持与关注回顾2022,我们分享了60篇原创技术文章、发布了1本营销科学系列白皮书、开源了1项向量召回技术方案;阿里妈妈营销隐私计算平台通过了中国信通院2项“可信隐私计算评测”,隐私计算能力获权威认证;北大-阿里妈妈人工智能创新联合实验室正式成立,并落地了首批研究成果。本期我们盘点了过去一年的技术实践,送上这份“... 丨目录:· 摘要· 动机:在离线不一致问题· 问题建模· 方法:SORL框架· 实验结果· 总结· 关于我们·参考文献▐摘要近年来,自动出价已成为广告主提升投放效果的重要方式,在真实广告系统(RAS)中,常见的自动出价策略是利用强化学习算法在复杂多变的竞价环境下进行实时调整。考虑到线上探索的成本和安全性,强化学习模型的训练通常是在一个模拟广告系统(VAS)中进行。由于RAS和VAS之间存在明显... 丨目录:· 摘要· 引言· 问题建模· 实验· 总结与展望· 关于我们·参考文献▐摘要大多数的信息流场景会向用户展现自然内容和商业化内容(广告)的混合结果。一种比较常见的做法是,将广告限定在固定位置进行展现,但由于这种静态广告展现策略忽略了用户的个性化偏好,往往比较低效。因此,在本文中我们聚焦于信息流广告的动态展现方法研究,从动态背包问题的角度将其建模,并提出了分层约束下的动态广告展现方法(H...