作者:京东零售 郑书剑

1、引荐LBS事务介绍

1.1 事务场景

现有的同城购事务环绕京东即时零售才能搭建了到店、到家两种事务场景。同城事务与现有事务进行互补,运用高频,时效性快的特色,能够有效提高主站复访复购频次,是零售的重要战略方向。

1.2 名词解释

LBS:依据位置的服务(Location Based Services)。

下文LBS产品代指京东小时购产品;LBS引荐代指京东依据地理位置的引荐才能,需求考虑到邻近的供应和履约才能。

B2C:直接面向顾客销售产品和服务商业的零售形式。

下文B2C产品代指京东主站产品,包含自营/pop等非小时购产品;B2C引荐指主站干流引荐才能,不需求考虑当时地理位置的供应,而是面向全国用户的引荐形式。

1.3 引荐形式

首要引荐形式会集在一下四种流量场域:

1、邻近-产品推feeds引荐;

2、邻近-纯门店引荐;

3、邻近-门店-产品列表页引荐;

4、主站中心引荐场景lbs产品混排引荐(主页为你引荐、购物车、我的京东等);

邻近-产品推feeds 邻近-纯门店 邻近-门店-产品列表页 主页为你引荐
京东LBS推荐算法实践
京东LBS推荐算法实践
京东LBS推荐算法实践
京东LBS推荐算法实践

2、引荐体系规划

现在主站中心场景从支撑b2c产品引荐,b2c内容资料/聚合资料引荐拓宽到更丰富的事务形式,支撑lbs事务逻辑引荐,给用户带来更多元化的体会,一起给线下商家和运营提供了更丰富的流量渗透战略。

现在lbs产品引荐架构和b2c产品引荐架构的引荐流程严密的耦合在一起,上线lbs产品引荐相关战略,都需求考虑到b2c引荐事务的逻辑无diff,功率低,兼容性差,迭代本钱高,不利于后续优化战略的快速迭代。经过对lbs产品引荐的整体链路进行晋级,与现在的b2c产品引荐链路进行解耦,提高体系的拓宽性,更易保护,提高算法战略接入的功率。b2c产品和lbs产品均具备独立quota空间,引荐链路愈加清晰,作用优化空间更大。

京东LBS推荐算法实践

3、算法实践

3.1 概述

咱们的前端展示形状分为纯产品、纯门店、门店-产品三种形状,且引荐位散布较多,为了减少人力保护本钱,一起考虑到LBS引荐形式和传统电商形式的差异,以及流量场域散布和引荐展示形状的差异,咱们针对LBS引荐才能进行了独自的规划,抽象出一套引荐模板能够一起处理三种引荐形式,支撑跨场景复用。

首要前端恳求入参用户当时的经纬度信息,引荐体系从gis体系获取当时可履约的门店信息;引荐体系依据用户个性化信息和门店-产品信息,为用户引荐感爱好的邻近门店-产品。

此时的item粒度为门店+产品粒度,为了一起确保用户对门店和产品爱好的一起感知,差异于b2c产品的引荐形式,咱们将整个体系分为两个阶段。在一阶段对用户感爱好的门店进行引荐,在二阶段对用户的感爱好的门店下的产品进行引荐。在两个阶段内完结门店引荐、产品引荐、门店-产品引荐三种形式,三种引荐形式可复用算子达到80+%,掩盖站点从京东主站到小程序,掩盖场景从主页-为你引荐到营销引荐位,总计掩盖中心引荐位30+。

京东LBS推荐算法实践

3.2 LBS召回算法实践

3.2.1 背景概述

背景:LBS引荐是依据地理位置的引荐场景,和主站b2c引荐形式有所差异;用户对更多维度的要素敏感,如门店质量,配送间隔,配送时效等等;

所以引荐体系需求在召回的时候就考虑到这些体会要素,所以咱们将LBS的召回算法规划成两阶段的形式。一阶段依据用户爱好(user-store爱好)和门店质量(ka/销量/间隔/时效)等要素召回用户感爱好的高质量/间隔近/配送快的门店。在二阶段进行产品召回用于召回用户感爱好的产品。

一起咱们面临着以下几个问题:

冷启问题:咱们是新事务+新场景,新品多,新用户多,相比较老练的b2c场景,lbs场景交互稀疏问题严峻;

跨场域爱好迁移:用户在b2c场景和lbs场景的爱好表达往往是不一样的,不同场景的爱好表达往往存在着必定的差异和联络,怎么精准捕捉和表达用户跨场景体现出的爱好是新场景初期开展的重要工作;

爱好激起周期短:lbs场景用户决策本钱低,转化链路短,高转化场景下更要关注物品相相联系的表达;

咱们初期也对以上几个问题进行了简略的探究,经过跨域爱好探究和优化i2i相相关系简略的验证了咱们的主意。

3.2.2 召回算法实践

1、冷启动召回

冷启动召回一般有以下几种方案:

•商圈抢手:缺点是和user无关,纯抢手item召回,相关性差;这儿咱们将全局热销/poi热销产品作为兜底召回,用于弥补;

•cross domain:是一种依据不同场域(如京东b2c场景/lbs场景)一起用户的行为将不同域的用户映射到同一个向量空间,然后借助其他域的丰富行为提高本域冷启动用户的召回作用。

咱们这儿首要针对cross domain的办法进行了一些简略探究来优化跨场域用户的冷启体会作用。

1)潜客画像召回:依据用户在b2c场景的相关行为(比如偏好类目是否为lbs转化优势类目)以及是否对lbs相关场景有前置行为的用户(引荐下阅读过邻近/搜索内点击过小时购通栏等),来判别当时用户是否为lbs的潜在转化用户,给这些用户引荐其在b2c偏好下的高转化lbs产品;

2)跨域类目召回:经过对b2c/lbs共现产品进行发掘,得到b2c到lbs的类目协同联系,依据用户在b2c场景下的偏好类目引荐对应的lbs类目下的产品;

3)跨域i2i召回:结合b2c/lbs的用户的跨场域行为,对lbs产品和b2c产品进行i2i联系发掘,得到b2c sku到lbs sku的类似相相联系,运用b2c的用户行为为其引荐lbs产品;

4)直接召回:依据b2c召回成果,为用户召回类似相关的lbs产品。

2、i2i直接召回

依据用户在lbs场景的行为直接召回lbs产品,常见办法有如itemCF,swingCF等。

咱们针对lbs场景高转化的特色对i2i召回进行了针对性的优化。咱们对lbs场景的用户行为进行了分析,发现用户的点击行为体现了产品的类似性(同品比较等),订单行为体现了产品之间的相相联系(搭配购等),可是用户的订单行为往往非常稀疏,且考虑到lbs产品还含有地域属性,直接运用订单行为构建相关的i2i联系得到的成果非常稀疏,召回的下发占比往往比较低。

所以咱们把订单的i2i联系抽象为类目-类目,产品词-产品词的的粗粒度相相联系。然后对全站lbs行为进行i2i联系发掘,得到的成果运用粗粒度相相联系进行过滤,得到了比直接运用定订单行为构建i2i联系更丰富的成果,召回功率也比类似联系的功率更高。

3、向量化召回

i2i vs embed:i2i的类似相相联系体现的愈加精准,可是掩盖率低;embed办法新颖性好,掩盖率高,可是联系表达相对不这么精准。

为了处理前文中说到的问题,对用户行为进行预处理,对反常用户和反常体现的产品先进行过滤,避免脏数据对整体数据散布造成影响,行为选取时,优先保留订单行为邻近的用户行为(高质量行为),一起历史行为序列进行了session划分,确保行为的连续性和相关性,更能体现出用户决策周期内的会集爱好,优化i-i的相相关系。

模型方面咱们采用了随机游走的graph embedding建模办法,和传统方案差异不大:行为序列发掘 -> 同构图构建 -> 带权重游走序列采样 -> skip-gram+负采样练习,得到物品的item embedding。

一起这儿的用户行为序列的选取也能够参考跨域的思路,运用b2c行为进行弥补,进一步处理lbs场域召回稀疏的问题。线上即能够运用i2i的办法进行召回,也能够运用u2i的办法进行召回。相比i2i直接召回,曝光占比更高,功率更高。

4、其他召回通道

还有比如其他的依据品类爱好和常购行为的爱好画像召回,复购、常购召回等。

3.3 排序模型实践

排序预备方面,由于历史留传原因,现在无论是用户在lbs场域的行为,仍是lbs产品画像都有所缺失。所以第一步,咱们首要对根底数据进行了保护:1)一致了全站lbs行为接入口径:经过门店pv和商详的pv埋点,捕捉全站lbs行为;2)建立了user-sku和user-store的用户画像和lbs产品画像。

排序特征方面:在复用了b2c产品的部分精排特征的根底上,构建了lbs场景的特有特征,如lbs场景用户行为序列,lbs场景产品/门店反应特征,以及配送时效,配送费,配送间隔等context类特征。

模型优化方面:引入了用户在b2c场景的用户行为,一起引入了b2c练习样本做样本增强。

模型结构方面:在模型输入的方面分为和b2c同享的部分,以及lbs独立特征输入的部分,异构b2c/lbs用户行为序列提取多场域用户爱好,与B2C场景进行多场景联合优化。上线时进行拆图,仅运用lbs task tower进行打分。

京东LBS推荐算法实践

4、总结

lbs引荐才能作为创新事务,咱们经过模板化引荐才能,快速承接引荐位30+,支撑三种引荐形式,初期快速的助力了全渠道的事务开展。

后续针对事务了解,经过对LBS引荐链路的独立拆分,以及召回和精排迭代优化。在主页-为你引荐上,lbs产品曝光UV占比相对Q3提高 488% ,CTR相对Q3提高159.52%。一起带动整体大盘指标提高,主页整体阅读深度明显提高0.39%,引荐整体uctr明显提高0.79%,引荐人均三级类目点击数明显提高0.76%,引荐外页uctr明显提高0.37%。

后续咱们将继续结合场景特色和事务了解,逐步完善优化LBS流量分发才能,更好服务商家和用户,提高京东LBS引荐才能。

本文正在参与「金石方案」