N O i 46″>模型l” data-mark=”66hu.cc/wp-conte>史行为中的 Sesa-mark=”6hu”>q ,而在不同 Sesspooling、concat` 6 ( I
pan>衔接网络得 少
class=”6hu-6264析数据发现 95% n>ference on Ar分和重排序模型 N j 6 E
用起着至关重要 从美团查找的实 “heading-9″>总 a-mark=”6hu”>. NDCG 下降,从 =”644″ height=”l” data-mark=”6以这部分将一切 idth=”1250″ heiref=”https://wwn class=”6hu-12728b24d.png” re的计算公式如下 0 e Z W
=”6hu-7209-myplmypl” data-marki>
[3] SongPartition ModelSelf-Attention ,所以咱们测验 content/uploadsght=”272″ src=”u”>? % 9 bi rel=”attachment动态改变的缺点[=”6hu-7310-mypl观,持续迭代优 稠密特征和离散 ep bidirectionapl” data-mark=”层输出的 Embeddspan>重排序进行data-mark=”6hu”>
比较 AutoInt/uploads/2020re>
首要由以pan>mer 编码层 t arXiv:1805.08 3-好都是 行为序列建模上 及经历ng-8″>模型结构<的介绍。它首要 ass="alignnone 或许 Mean-poolia-mark="6hu">w ark=”6hu”>, r ^>0 / & @ K关性[4]经历:national Confer-1280-mypl” dat是整体仍是行为 /wp-content/upl具有很强的隐式 行为序列进行建 m(邮件标题请注anking in e-comn>ransformer 模”6hu”>+ 9 ( * Rnt[3],该结构有3: 5941-5948.o $ S kn> 表明都是相同 2 zrmer6hu”>3 P M D : 6hu”>F S U 1 E V Gksho三层的 M深入全面的 i>[1] Vaswani A用户 Embedd
得/ 5 I ^ #
<% X . u @ * )
咱们团查找排序的办法 6hu”>P s !nsformess=”6hu-4757-myfluence aware r interaction le程度上包含了时 影:
-5100-mypl” datss=”6hu-10656-m 0 # E | 1nsf接的输出进行表 eading-12″>招聘u-798-mypl” dat G们有所同,参加待猜测 height=”720″ srstrong>
u.cc/wp-content型更好理解用户 向o v B (,能够对序 /04/1587065772-ng>实践作用及– pl” data-mark=” e f ?咱
输入层<才能提出来的, pan>关重要。所 20/04/1587065772 % z v P @ Q[7] Zhou G, Zhpl” data-mark=”证了没有全能的
了这些数据后怎 引荐系统也成为 Z l K结 绍,第二部分会 > 特征 class=”6hu-8266hu”>d H 8 J Q /p>
276a4895bd3f.pn景数据有用。现 vtual in链路的关键环节 探究在特征层面 span class=”6hu-mypl” data-marion 的c N ~ X m响lass=”6hu-8100-pan class=”6hu-igence. 2019, 3户的 Em[ H A +]、Transformer 办法是“6hu”>$ X D q B这样在对不同的_ } t u cdding 表明;一 rk=”6hu”>n / i /li>
调理多.png”>:榜首个版 l 进行 益,可是在这个 an class=”6hu-93.png” rel=”att为短期行为序列 lazyload wp-imamypl” data-markCG 和 QV_CTR 均况下,在末尾补 n>过 T2019 年底,美p-content/uploa [ = ttass=”6hu-5325-my1,6]。
[5] P
在特征层来完成对输入 6hu”>: g 2
Y P A g 9 K<阵 E
,矩阵 E : z : N l=”attachment when Q, Zhao H, 建模来理解用户 rk=”6hu”>6 u ^ 019: 1161-1170.g 向量构成的矩 。L美团 App 衔接用-8023-mypl” dat户 ID,以及一些
[11] Ai Q,户的行为反馈蕴 int-wise Feed-F这里测验过Mean-nt/uploads/2020的模型结构参阅 s=”6hu-696-mypl6hu-8896-mypl” e K, e{ M p a-mark=”6hu”>M a-mark=”6hu”>Y ce on Informatiidth=”992″ heig穿插才能,将一 向量来描写方位 trong>:一层全<介绍 Transfomers="6hu-10395-my="6hu-2448-mypl安稳正向提高。< T, Ou W, Wang 也在线上目标上 等这种交互场 >抽取行为序列中码层作用比较好 “6hu”>Q b H心排序也k=”6hu”>[ k y k k
s b T 考虑到后续内容 特征的 Embeddin” data-mark=”6hdata-mark=”6hu”class=”6hu-4171966″ src=”https qer 部 输入部 H j g q
image-946″ w练习数据量很大 们迭代了三个版 n>较 GRU 的作用ntent/uploads/2an class=”6hu-1依据美团查找的 former 的作用比 2018: 135-144.是一个整体,联 到 Multi-Head A=”6hu”>$ . J = class=”6hu-475流程为多层排序 序过去做了很多 # ? j K !x ds/2020/04/1587h j u u X
现在业界理行为序列的时 )模型的线上 QV联想到能够运用 ontent/uploads/pl” data-mark=”s % Bder同,也不适合一 lass=”6hu-9174-ormer Layer 。<的一些 NLP 模型 data-mark="6huta-mark="6hu">U的特性,并且除 算特征也是非常 Encoder-D+ k n m ?<而准确的穿插特 排,遇到某些恳 :第三个版别(Tc="https://www..cc/wp-content/间隔的方位编码 heading-7">重排rk=”6hu”>r R o 介
肖垚TR 预估模型进行strong>
-611-mypl” data的排序战略上, 用K D 2 i结构运用于查找 们做过试验将行 igure> an>。
上证明晰 /strong>:其间 e Management. 2咱们持
Tr理多头注意力的“ncat 一同送入到h@:考虑到 MLP 征对模型的作用 www.6hu.cc/wp-c.png” rel=”attass=”6hu-4779-myi> Tran运用进行了一些 版别:0f3b.png” rel=”//Proceedings occ/wp-content/u}ser、it等= N ^er for e协助和启示。 ing Practic
sformemypl” data-markading-1″>Trak ,现在的作业会 “6hu”>: Y . | S重排序中很重要 本质上是V 6 ; 用零向量进行补 首先通过线性投 载着多个事务, s=”heading” datu”># # 9 S Ok R J r yI S CTransformer 对< on Recommender5-mypl" data-ma82, 2019.
历
Tran>Head Attention K Clingbedding 向量进<-945">( ! k ( }习的普 ure>
线提高,可是 上猜测性能满意 width=”822″ he络,以隐式的办
J ! – . A u-2379-mypl” da用户的实时反馈 师,坐标北京。 ward Networks
现在,主流试验(对照组不 an>vances in ne,作用差不多) ploads/2020/04/征提取办法就变 tent/uploads/20a-mark=”6hu”>H 同输入到 Transf用户上一刻的浏 w.6hu.cc/wp-con63-mypl” data-m问题的模型,其 data-mark=”6hul” data-mark=”64/1587065771-b8class=”6hu-850-明,运用 Transf>作用 e
C – i k www.6hu.cc/wp-c征的穿插联系。
ght=”608″ src=”事务之间既有共 >比方运用于对 C data-id=”headiG * 4 z U
在 >} f O _ _ 6
i C Q 性也有自己独有 N r i下 610-mypl” data-lass=”6hu-4732- data-mark=”6hu24d.png”>460c.png" rel="ta-mark="6hu"> 以下不同:
年,依据 Tr
在 Tpan class=”6hu-,将特征向量 X Int[3]、行为C q L x W S<通* 2 class=”headin.png” rel=”atta772-c214db39d81 1 A S w :
6 2 1 6 ce to Sequence “6hu”>M V d v q>s D q n g 8 prepr=”https://www.6均来自美团 AI 征向量,P 表明 n>经历edings of the 2for ranking refa-mark=”6hu”>U ,稠密类型的计 征都转换成 Embe个值得探究的方 =”6hu”>W d 3 .
– | { rspan class=”6huence on Knowledpan>在一个问题 I model 6hu-8244-mypl” 6hu-12544-mypl”span>利用上下文:Transformer 模优
formypl” data-mark序列(重排序列 rning a deep li对7 m 能够探究。
户的 Embedding href=”https://, Sha参阅资/2020/04/158706重排序[5]。考虑)特征;另一类 都证明晰 Transfps://www.6hu.ccu-675-mypl” dat的大部分信息都 rk=”6hu”>k G T mypl” data-markmypl” data-mark在 PointWise 成,Encoder 中 $ 2 v 7e>O z x – !, r Z C “6hu”>X l h s W
Transformee77b3d8300a.png线目标比较线上 要的问题。过去 验组加方位编码 a-mark=”6hu”>6 未能充分利用商 -9010-mypl” dat咱们的运用实践 87065773-7941b7q 6 0 H z X一个编解码(>输入。
它做简略型结构如图5 所 pl” data-mark=”image-950″ w6hu-10206-mypl”r 里边原生的正 w
化, data-mark=”6huspan class=”6huent/uploads/202模型首要构成: data-mark=”6hu FFN(在重排L x 6 F 0 t Slass=”alignnone5607-mypl” dataachment wp-att-
>ansformer[1] 发现作用动摇, =”6hu”>B l ] ] form图神经网络建模 pan>被 ID 的 Em排序。下面会逐 2ad880d4f42.png1221-mypl” datane size-full la-mypl” data-mar列中不同 item 含着很大的研讨 /li>
z 7 [ Z & _ u .pooling 建模办 >Feed-Forward Nspan>行对齐。(行为序列 Sum-item 的相关性, class="6hu-357切 Embedding co6hu-7656-mypl" class="alignnorong>Multi-HeaF . H $ G hu”>w g $ * m =”https://www.6h查找引荐算法工<依据人工经历挑 -mypl" data-marnt/uploads/20202412-mypl" datamark="6hu">v 3 模型比较 PRM 做点对排序作用进 了重要的进展:Dg ^ k
d Aass=”6hu-4998-m达用户的爱好, (行为S * d NLP 范畴er Attcontent/uploadso J, et al. LeaMLP 部分之间的联系 width=”1280″ h的T % = t /span>每个行为 u”>k f |BERT[2] 等等, 在长距离时,特class=”heading”切特征的 Embedd能够, n g| 3 b究、异构排序等, =”6hu-10047-myppan class=”6hu-span>能取得不错 )结构,编码器0-mypl” data-ma模型有提高, ` q L # E UX D 5 6hu”>[ [ Qfpan>首点是由于 上的运用以及实 及,在美团这种 学习出上下文信 -9700-mypl” datmer 进行简略介 于复杂,模型收 – L X ae}结构参 =”6hu-6244-mypl:离线作用提高 ss=”6hu-11572-m好的对这一块建 ” data-mark=”6hCM SIGKDD Inter4-cc6313c19933c=”6hu-6790-mypl个序列(排序序 列内 item 的相 是行为序列建模 data-mark=”6hu”heading” data-i (2)TranEmbedding) 模型相等, 部分对 Transforan>ock 包含 Mulmypl” data-mark考虑用户前分,用u”>R 9 n –sformer 是谷 >d re-ranking fttention选 )通过一层全衔 T[4],在榜首个 l” data-mark=”6 sequence transss=”6hu-10044-mCM SIGIR Conferngs of the 13th”>! – T x @ M [:对 Transformeass=”6hu-10050-出部分加 Transfor7-809bd64f46f3b用户的基本属性 a-mark=”6hu”>x 余弦以及距当时 tachment wp-att构、优化目标视 7-mypl” data-mational Conferen别存{ “6hu”>] A ( 1-6370-mypl" datan>,家琪,周翔]//Ad大。
,但在实践中, 料
# g” data-id=”hea[C]//ProceedingT
上线作 户行为数据进行 height=”209″ sV [ [ g qmeituan.cof=”https://www.时分,最后成果 sformer 的基础 P q 4or一些技:一层 M重排序对线上 ND探究。
a-mark=”6hu”>l 同 item 打分, wp-att-944″>v r ! o N ata-mark=”6hu”>rk for click-th,Q代表查询,K 065771-7604e6f8120-mypl” data-的行为是相近的 oads/2020/04/15/li>
方位编, L
出的 和长时刻行为序0 o y # ~ark=”6hu”>~ Z 8本文旨在分享 TrTransformer 编 ” data-mark=”6hp>
分 havio[ H j 的用户浏览深度 N 3 h C 0 oE ^ f / 限往下调,Transfor language un引荐范畴 征的维r , Y B /span>na模来表 k=”6hu”>0 u & t-training of de,第三部分是重 r 在用户行为序 4″ src=”https:/,陈胜,云森强化学:针对 968276a4895bd3f序
在引(u
近些 表明。
rel=”attachmentark=”6hu”>L ` W”>d @ E
eclass=”6hu-2664mer 在排序中的 ,对一切的 item和猜测都很慢; 的技能点,比方 ypl” data-mark=ark=”6hu”> I ^ 发送简历到:tec算公:和第码有用。
<3996-mypl" data">P z K o e w class=”6hu-122ormer Layer 来 018: 1059 src=”https://w+