ACM SIGKDD (Knowledge Discovery and Data Mining,简称 KDD)是数据挖掘领域的国际顶级会议。KDD Cup比赛是由SIGKDD主办的数据挖掘研究领域的国际顶级赛事,从1997年开始,每年举办一次,是目前数据挖掘领域最有影响力的赛事。本文精选了美团技术团队被 KDD 2024 收录的 5 篇长文进行解读,覆盖了用户意图感知、机器学习&运筹优化、在线控制实验、联合广告模型、实时调度决策等多个技术领域。这些论文都是美团与高校、科研机构合作的成果。希望能给从事相关研究工作的同学带来一些帮助或启发。
此外,大众点评技术部/内容智能算法团队组建的 BlackPearl 团队参加了今年KDD Cup-OAG Bench(Open Academic Graph Benchmark)赛道的WhoIsWho-IND、PST、AQA三道赛题,基于大模型技术提出自反馈增强、嫁接学习等方案,三个赛题均以较大优势取得冠军!活动预告来啦!8月8日(周四),我们将邀请 3位 论文作者进行线上分享(文末有详细介绍),欢迎点击这里报名~
01
Unified Dual-Intent Translation for Joint Modeling of Search and Recommendation
论文作者:Yuting Zhang∗(ICT, CAS),Yiqing Wu∗(ICT, CAS),Ruidong Han(Meituan),Ying Sun(Thrust of Artificial Intelligence, The Hong Kong University of Science and Technology),Yongchun Zhu(ICT, CAS),Xiang Li(Meituan),Wei Lin(Meituan)备注:ICT, CAS全称为Institute of Computing Technology,Chinese Academy of Sciences论文下载:PDF
论文简介:推荐系统旨在帮助用户在众多候选商品中发现他们所喜爱的商品,并已服务于各种在线平台的数十亿用户。从直观上看,用户与商品的交互高度受到他们稳定的固有意图(例如,始终偏好高质量的商品)和变化的需求意图(例如,夏天想要一件T恤,冬天想要一件羽绒服)的驱动。然而,这两种意图在推荐场景中都是隐式表达的,这给准确感知用户意图带来了挑战。幸运的是,在通常与推荐系统共存于同一在线平台的搜索场景中,用户通过查询词显式表达了他们的需求意图。直观上,在这两种场景中,同一用户的交互可能受到相似的需求意图的影响,并且其固有意图是稳定的。因此,利用这两个场景中的交互数据来相互增强或补充双重意图,并进行联合意图感知建模是可行的。然而,搜索和推荐的联合意图感知建模需要解决以下两个问题:(1)准确建模推荐中用户隐式的需求意图;(2)建模双重意图与交互商品之间的关系。为了解决上述问题,我们提出了基于双重意图转换的搜索推荐联合模型(UDITSR)。为了准确模拟推荐中用户的需求意图,我们利用搜索数据中的真实查询作为监督信息来指导其生成。为了显式模拟<固有意图,需求意图,交互商品>三元组之间的关系,我们提出了一个双重意图转换传播机制,实现了在同一语义空间中学习三元组元素间的可解释关系。大量实验表明,UDITSR在搜索和推荐任务中均优于现有的SOTA基线。此外,我们在美团外卖平台上进行了为期一个月的线上实验,平均提升了1.46%的GMV和0.77%的CTR指标。02
Joint Auction in the Online Advertising Market
论文作者:Zhen Zhang(RUC, Gaoling School of Artificial Intelligence), Weian Li(SDU, School of Software), Yahui Lei, Bingzhe Wang(RUC, Gaoling School of Artificial Intelligence), Zhicheng Zhang(RUC, Gaoling School of Artificial Intelligence), Qi Qi(RUC, Gaoling School of Artificial Intelligence), Qiang Liu(Meituan), Xingxing Wang(Meituan)
论文简介:在线广告是电子商务平台的主要收入来源。在当前的广告模式中,定向目标是愿意支付额外费用以提升其店铺位置的在线店铺主。另一方面,品牌供应商也希望在店铺中宣传其产品以提升品牌销量。然而,目前使用的广告模式无法同时满足店铺和品牌供应商的需求。为了解决这个问题,我们创新性地提出了一个名为「联合拍卖」的联合广告模型,允许品牌供应商和店铺共同竞标广告位,满足双方的需求。然而,传统的广告拍卖机制不适合这一新颖场景。在本论文中,我们提出了一种名为 JRegNet 的神经网络架构,用于最优联合拍卖设计,以生成满足近似DSIC和IR的近似最优机制。最后,我们在模拟数据和真实数据上进行了多项实验,证明与已知基线相比,我们提出的联合拍卖模型取得了较好的成果。03
STATE: A Robust ATE Estimator of Heavy-Tailed Metrics for Variance Reduction in Online Controlled Experiments
论文作者:Hao Zhou*(Meituan),Kun Sun*(Meituan),Shaoming Li(Meituan),Yangfeng Fan(Meituan),Guibin Jiang(Meituan),Jiaqi Zheng(Nanjing University),Tao Li(Meituan)论文简介:在线控制实验是评估营销活动效果的重要工具。其中,方差缩减方法可以有效地提高实验灵敏度,从而使用更少的样本或更短的实验周期得到置信的实验结论。一些典型的方法如CUPED/CUPAC/MLRATE等已逐步部署到各大公司的实验平台来提高实验的统计功效。然而,这些方法通常是建立在业务指标服从高斯分布的假设之上,无法正确地表征重尾分布的业务指标,从而效果提升有限。在本论文中,我们将t分布与机器学习工具相结合,来表征重尾指标,通过变分EM优化方法,推断得到一个鲁棒的ATE估计器,我们称之为STATE。它有效地缓解了离群点的干扰并显著降低了ATE估计的方差。此外,我们通过利用无偏的线性变换,将 STATE 方法从计数度量(Count Metric)扩展到比率度量(Ratio Metric)。我们在合成数据集和美团外卖的业务数据上都证明了STATE方法的有效性。与最先进的估计器(CUPAC/MLRATE)相比,STATE降低了ATE估计量50%左右的方差,这表明它只需一半的观测值或一半的实验时间即可达到相同的统计功效。
04
Decision Focused Causal Learning for Direct Counterfactual Marketing Optimization
论文作者:Hao Zhou*(Meituan),Rongxiao Huang*(Nanjing University),Shaoming Li(Meituan),Guibin Jiang(Meituan),Jiaqi Zheng(Nanjing University),Bing Cheng(Meituan),Wei Lin(Meituan)论文下载:PDF
论文简介:营销优化对于在线互联网平台的用户增长起着重要作用。现有的研究通常将这个问题表述为预算分配问题,并利用两个完全解耦的阶段,即机器学习(ML)与运筹优化(OR)来解决。然而,ML阶段的学习目标没有考虑下游OR阶段的优化任务,这导致ML阶段模型的预测精度可能与决策质量不呈正相关。从而,降低模型预估误差,不一定提升优化任务的决策效果。本论文提出了一种基于决策的因果学习方法(DFCL),将ML与OR两个阶段集成到一个端到端的因果学习框架中,使得机器学习模型能以下游OR阶段的优化目标作为损失函数,从而保证ML阶段与OR阶段优化方向的一致性。其次,DFCL克服了营销场景中的预算不确定性,反事实推断问题以及计算效率问题等多个技术挑战,使得DFCL可以实现针对大规模在线用户营销场景的直接反事实优化。离线实验和在线 A/B 测试都证明了 DFCL 相对于传统因果推断方法的有效性。目前,DFCL已在美团的多个营销场景部署并应用。05
Harvesting Efficient On-Demand Order Pooling from Skilled Couriers: Enhancing Graph Representation Learning for Refining Real-time Many-to-One Assignments论文作者:Yile Liang(Meituan),Jiuxia Zhao(Meituan),Donghui Li(Meituan),Jie Feng(Tsinghua University),Chen Zhang(Tsinghua University),Xuetao Ding(Meituan),Jinghua Hao(Meituan),Renqing He(Meituan)论文下载:PDF
论文简介:即时配送平台通过周期性批量调度的方式,将大量订单分配给配送员进行履约。在实时调度决策过程中,将多个订单合并指派,构造高聚合、高顺路的配送路径是提升配送员收入、优化配送员工作体验的关键。由于订单分配问题的复杂性和实时性,传统方法难以在有限时间内快速生成高质量的订单分配方案。此外,线下环境中频繁出现的不确定性因素(如门禁通行管控等),也增加了平台在感知能力和分配决策上的难度。然而,经验丰富的配送员由于对环境更加熟悉,具有更强规划能力,可有效帮助系统提高感知能力,并为实时调度决策提供“灵感”。
基于此,本论文利用有经验的配送员的实际轨迹数据,构建了效率感知网络,以挖掘嵌入在配送员轨迹中的订单合并潜力。具体而言,通过丰富的时空行为数据,将订单表示为低维向量,并通过轻量地相似性计算,对庞大的解空间进行实时剪枝,有效降低订单分配问题求解复杂度,从而快速识别高质量的订单分配方案。
同时,为了提升异构图神经网络在即时配送场景的学习效果,对传统算法的Loss、负采样等模块进行了针对性优化。该网络已部署在美团的配送系统中,线上结果显示能在实时性能要求下提升订单分配质量,优化了配送员的工作体验。
识别图片上的二维码(或点击图片)跳转报名,一起来交流吧~
---------- END ----------
美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行合作。欢迎老师和同学们发送邮件至:meituan.oi@meituan.com。