作者：卉芸

1. 事务简介与剖析

1.1 事务剖析

谈到查找，咱们日常生活已离不开此功用，例如通用查找引擎Google百度，购物时的电商查找，听歌时的音乐app查找等。在不同的事务场景下，查找的事务实质与方针也有着很大异同。在电商场景下，查找实质上对错精准导向的，由于满意用户query目的的产品候选量级极大，个性化的作用极大的被彰显，在query了解、召回及排序的各个环节，个性化都是必不可少的考量要素；此外，用户的query与产品的title存在显着的语义gap，商家多选用特点堆砌的方法来构成标题，导致与用户的表达方法差异较大；终究，算法的优化方针也十分明晰单一，即gmv及成交笔数。

在云音乐查找事务中，候选资源种类繁多，包括演员、单曲、歌单、视频、播单等多种异构资源，混排面对更多的应战；一起，关于演员及歌曲的查找，更倾向于精准化导向，满意用户目的的候选往往个数较少，对准确性要求极高，但在视频及歌单查找中，又更具有非精准性，满意用户query的候选多，故成果的个性化与多样性更需求被确保；关于不同的资源类型，算法的优化方针也不尽相同。

视频资源作为一种多模态的资源类型，在音乐查找中，有着自己的独特性：

（1）内容了解难：视频的标题及描绘并不能反响视频的悉数内容，视音频模态的信息补充十分要害；描绘文本倾向于天然句子，而非结构化的特点标签，长度也长短不均；信息抽取与语义表征难度高，用户query与视频相关性建模更为艰巨。

（2）相关性要求高：当用户查找单曲无版权时，可能会到视频页查找资源。有些查找query存在歧义，例如抖音火爆的歌曲“会不会”，仅经过文本词级其他匹配，会得到很多不相关的视频资源，故需求结合用户的实在目的来确保成果的相关性。

（3）时效性强：用户对热点内容需求较大，新热上升视频应该具有更多的曝光流量，例如“蜜雪冰城”查找成果下，应该将最近较火的日文改编版往前排。查找成果的时新性对用户的体会至关重要，实时的特征对排序作用影响较大。

（4）优化方针多：视频总体方针如下图所示，其间点击率和有用率，是最根底的优化方针，视频的播映时长占比、点赞率、保藏率、转发率也很重要，它们能更好的鼓励视频生产者创作，并和视频消费者构成更紧密的互动，利好整个视频生态。

1.2 算法体系

如上图所示，视频查找的全体算法体系能够分为五大模块：query了解模块、召回&扩召回模块、相关性模块、排序模块及重排战略模块。

数据发掘供给根底的数据支撑，包括新词发现、同义词发掘、标签发掘等，经过离线方法定时更新底层信息库，一起服务于视频了解模块。query了解作为初始环节，包办了文本归一化、纠错、词权重剖析、实体及特点抽取、目的辨认等功用，从用户不规则的输入文本中，获取到中心结构化信息，送入后续模块进一步处理。

召回部分可细分为两块，根底的文本查找引擎和多路扩召回，查找引擎结合紧密度、热度、tf-idf等特征给出候选粗排分数。扩召回可细分为两大类型：query改写多路及向量召回，前者经过显式的构建同义query召回更多满意语义的视频，具有更好的可解释性和可控性，后者运用模型泛化性隐式的召回相关视频，会带来一些惊喜的成果。相关性模块用于衡量用户query和视频的相关程度，能确保用户的查找体会，查找query和视频案牍存在天然的语义gap，同一query在不同的场景下存在歧义，怎么界说云音乐场景下的相关性并进行语义消歧，十分重要。

排序部分包括特征与模型的构建，根据云音乐自研的snapshot渠道，能够便捷的构建无特征穿越的实时样本，进行在线特征抽取及数据落盘，模型阅历了单方针到多方针的优化迭代。重排和战略是终究的一环，担任成果的多样性打散及可解释性案牍的拼装，也支持运营的case干涉。

云音乐的视频查找之前一直处于根底版别阶段，算法层面未阅历迭代优化。文本将结合上述重难点，详细从查找相关性和排序来论述下优化的方案与成效。召回部分会供给一个扼要的技能分享，不作为本文的重点。

2. 相关性

相关性是查找流程中十分重要的模块，它担任确保查找出来的成果和查找query是相关的，“相关”不只体现在word-level的匹配上，也体现在semantic-level层面，它是一种用户的片面感触，缺少一个通用的客观规范。在不同事务场景下，查找相关性的界说是不同的，需求依据详细的事务认知，给出符合用户体会的档位界说。有别于ctr使命，相关性天然缺失样本标签，是否点击不能用于直接衡量query与item的相关性，由于用户的点击行为还会遭到活动、方位、别致等其他要素的影响，因此需求依据相关性准则，进行人工数据的标示，但是深度模型的练习依靠很多的标示样本集，不可能悉数由人工来标示。在模型层面，咱们熟知的文本匹配领域内的模型，比方representation-based和interaction-based模型，都能够搬迁用于query和item的相关性建模，但考虑到线上inference的功率和rt约束，需求在作用和功率上进行折中。怎么运用有限的人工标示集，选用弱监督的方法构建一个高效的线上模型，是该使命的应战所在。

2.1 界说与评价

在云音乐查找场景下，咱们依据音乐领域内相关知识和用户的常见的目的种类，将相关性分拆为以下三个子维度：

文本相关性
- 指查找成果中包括查找query，即term匹配，查找成果中包括query中的中心词汇
语义相关性
- 指查找成果与query语义相关，能够广泛认为是知识相关，如歌手名和单曲名、专辑名、风格类型、国家语言、节目、渠道等相关
- 例如 “晴天” vs “周杰伦”、“刘德华” vs “四大天王”、“会不会” vs “小乐哥”、“会不会” vs “陈绮贞”、“刘聪” vs “中国有嘻哈”
目的匹配
- query中包括详细歌曲、演员、歌单、专辑、歌词等实体目的时，资源中对应目的也该一致
- 例如：”周杰伦晴天” vs “视频（xx翻唱晴天）”，这种状况认为是目的不一致，用户想搜的应该是周杰伦演唱或许出演的晴天

结合以上三个子维度，咱们将音乐相关性界说为四个档位，详细为：

good档位（最相关档位）
- term匹配 & 语义相关 & 目的匹配：示例：query（周杰伦晴天） | 单曲（周杰伦-叶惠美-晴天）、query（周杰伦晴天） | video（周杰伦演唱会live现场演唱《晴天》
- 特殊说明：关于演员，例如 hehe vs 田馥甄，虽然term不匹配，但的确是同一个人，这种case也归于good档位
fair-good档位（次相关档位）
- term不匹配 & 语义相关 & 目的匹配：示例：query（hebe）| 演员（S.H.E）
- term不匹配 & 语义相关 & 目的不匹配：示例：query（周杰伦晴天）| 视频（xx翻唱晴天）
- term匹配 & 语义相关 & 目的不匹配：示例：query（晴天）| 视频（xx翻唱晴天）
fair-fair档位（中立档位）
- term匹配 & 语义不相关 & 目的匹配：示例：query（晴天）| 单曲（我的新鲜女友晴天版）
- term匹配 & 语义不相关 & 目的不匹配：示例：query（晴天）| 视频（冰菓动漫编排）
bad档位（完全不相关档位）
- term不匹配 & 语义不相关：示例：query（晴天）| 歌曲（阿桑-受了点伤-叶子）

有了明确的档位界说后，在用户的前史点击日志中，挑选了万级其他样本进行人工标示，这部分数据能够用来finetune模型，也能够用于评价相关性模型的作用。由于音乐场景下的item分为多种资源类型，在视频标示时，以文本标题作为首要考量要素，视频文本标签作为辅佐要素。在实在的档位分布中，fair-fair档位占比较低，在评价模型作用时，将good和fair-good视为1，bad视为0，则能够作为二分类问题来核算auc方针。

2.2 模型选型

相关性的建模在业内存在多种方法，如下图所示，大致能够分为四种类型，根底的文本相关性模型、特点相关性模型、语义相关性模型和行为相关性模型。归纳四种不同方法获取的相关性分数，还能够构建一个顶层的归纳相关性模块，选用集成的方法，获取终究的相关性分数或档位。

文本相关性，在词级别剖析query与doc间的相关程度。针对用户输入的query，进行分词，再根据如BM25等算法核算相关性，如紧密度是衡量term之间距离的一种方法。这种方法能够无缝对接查找引擎，启动快，但是无法处理消歧和语义类似的问题。

特点文本相关性，是将query和doc进一步进行特点的抽取与剖析，在同特点维度下判别是否相关，然后归纳各维度，得到终究相关性分数。这种方法可解释性强，但是对特点抽取的准确度要求高，一起需求发掘特点下的同义词表，才能获取更好的语义相关性。

语义相关性，选用深度模型来对语义建模，打破term层面的字面匹配约束，并能必定程度处理消歧问题，具有良好的泛化性。近年来NLP模型的迅猛发展，文本语义建模的方案层出不穷，文本匹配领域内的模型都能够拿来学习运用。由于工业界对线上rt有较高的要求，杂乱的交互式模型太重，不合适大规模上线运用，一起练习样本集的构建也非易事。

行为相关性，是指经过用户查找后的点击、有用消费等一系列行为，选用无监督的学习方法，在点击图上进行信息的传递，来发掘query与doc的相关性。该方法由Yahoo在网页查找中首先提出[1]，算法将query和doc经过词向量传递，将两者变换到同一语义空间中，从而便利得到相关性的类似度核算。点击图的作用鲁棒性强，在头部query和doc上体现较好，但是在长尾数据上体现欠安。

2.3 收效方法及实战

得到query与item的相关性分数或档位后，该怎么应用到排序流程中呢。如下图所示，相关性模块除了输出相关分数外，还能够产出query向量、item向量（限于双塔模型），在召回中派上用场。能够用作一路语义向量召回，也能够在query改写的召回阶段用于寻觅类似query候选。排序中，语义向量和相关性分数能够拿来作为特征运用。

在云音乐场景下，咱们在引擎粗排中融入了紧密度特征，并构建了交融特点维度的语义相关性模型，也测验了点击图模型的试验，以下做以介绍。

语义相关性模型 – Aspect Relevance Model

练习深度模型需求很多的样本数据集，单个用户的点击与否不能直接当成正负样本，参阅电商语义相关性模型[2]，咱们核算了query和item之间的平均ctr，并划分为高ctr、中ctr和低ctr三个区间。咱们认为在同一query下，ctr高的item相关性是要好于低ctr的，因此得到了一个分层次的监督学习数据集。在构建负样本时，咱们选用了随机采样的方法获取简略的负样本，一起，也经过正样本中某些NER词汇的替换改写，构建了一批难学的负样本，由此增强模型的区别才能。

线上模型结构如上图所示，为了线上功用的优化，选用根底的双塔结构。底层同享词的embedding，在每个encoder侧，不只对query/item进行原始文本的信息编码，也对NER抽取的词组信息进行encoding。关于每个维度的语义信息，选用根据CNN的self-attention方法获取深层的语义表征，如果选用多个卷积核，能够得到多组的query或维度文本的向量表明。核算query与item的相关性分数时，选用弱交互的方法，对向量进行求和、求差、拼接三个操作后，送入全衔接层，经过max-pooling和sigmoid获取终究的相关性分数。在视频场景下，除文本信息外，还有图画、音频信息，能够将图画向量视为一个语义维度，运用tensor fusion进行向量的外积交融，这种方法关于多模态信息的交融更充沛，作用优于直接concat。

在loss的构建上，依据分层的ctr样本界说了一种pointwise的loss方法

其间，score为猜测的相关性分数，target为方针分数，关于不同来历的正样本，要求猜测分需求大于相关性的阈值分，关于负样本，猜测分需求小于对应的阈值分。在离线模型的评价中，为了对比数据采样的有用性，将点击样本直接拿来练习模型，模型在人工评测数据上的auc为0.706，而选用分层的ctr数据练习，auc可达0.742。进一步的，运用1w条人工标示集进行finetune后，auc能够提高到0.830。

点击图模型 – Click Graph Model

用户的点击日志蕴含着丰厚的信息，点击图模型运用二部图的信息传导，从类似的query/item中提取term来丰厚当时节点的term表达。咱们选用近三月的查找点击日志，构建了query和item的图，其间item包括多种资源，单曲、演员、歌单、视频等。针对不同的资源类型，选取不同的元字段信息来做文本的表征，比方视频类型，除了标题信息外，还选用了内容描绘标签信息，在分词阶段，接入了云音乐专属的事务词典，避免将歌曲名、演员名切分错误，一起过滤掉无意义的停用词。节点之间的权重选用了点击率，相比点击次数，点击率更能反响query与item的相关程度。

query和item间的向量迭代沿用了Yahoo文中的核算方法，每次迭代后在人工评测集上核算auc，选取最高auc对应的迭代向量，作为终究的词袋成果。下图给出了一个case成果，“陈奕迅”及两个对应的视频的终究的迭代向量中，包括了相关的歌曲词汇及演员词，有必定的可解释性。得到词袋向量后，需求⼀个合适的度量⽅法来核算类似度，咱们试验了两种种⽅式：cosine类似度和kl散度KL(Q||I)。为削减核算量，对词袋向量作了⻓度截断，仅保留top20个词。在同一份人工评测集上，选用kl散度的相关性分数，auc能够到达0.768，作用要好于finetune之前的语义相关性模型。

点击图方法核算简略有用，是一种鲁棒性很强的相关性算法，关于没有点击行为的query和item，Yahoo提出能够将文本拆解为n-grams，学习n-grams的向量表达和权重信息，处理中长尾无表达的问题。由于query侧的词袋向量表达中，会迭代出相关性较强的词汇，咱们选出了tag query下的词袋信息进行调查，如下图所示，第二列的词袋词汇中能够发掘出很多相关词，这部分进行人工审阅后，能够补充到同义词典中。

实际运用中，咱们将相关性应用到视频排序阶段，终究线上有点率提高1.5%，有用有点率提高2.3%。在视频8.0版别人工测评中，相关性及高质量召回case数量比7.0增加23%。以下给出一个相关性优化的成果展现。

3. 召回及排序

召回和排序是搜推算法中传统的两个模块。召回需求处理的候选集量级极大，线上呼应的时效要求高，因此不能选用杂乱结构的模型。排序阶段又能够细分为粗排和精排，在精排阶段，一般只需对上百个item进行打分，为了更准的呈现用户想看的成果，对模型的准确性要求较高，故需求在特征上做更精细化的处理，并选用更杂乱的模型来拟合数据分布。

3.1 多路召回

在视频召回中，咱们拟定了四大类召回方法：根底文本召回、query改写多路召回、向量召回、个性化召回。在根底的文本召回根底上，为了能召回更多语义相关的候选视频，构建了显式的query改写召回和隐式的向量召回。为了更好地满意用户个性化体会，也单独构建了个性化召回链路。

query改写的流程可细分为召回与判别两部分。在召回环节，可经过语义embedding相近、同session下query发掘、近义词替换等方法，寻觅与query同义或近义的query候选。在判别环节，构建语义类似度模型，衡量两个query是否语义相同，由于改写的数据能够离线生成好供给线上运用，所以杂乱的交互式模型如bert，都能够派上用场。事务中标示样本本钱较高，今年发表的simCSE[3]和R-drop[4]模型，也十分合适用在工业场景中。

依据建模方法的差异，可将向量召回分为如下图几类。近年来的文献中，向量召回在推荐领域内的发展较多，对user和item的建模方案，能够酌情搬迁到query和item上。查找事务上，Facebook上一年的工作EBR[5]和Baidu的Mobius[6]也有很强的学习意义，ebr从样本采样到体系层面给出了详细的实践经验与试验剖析，mobius结合查找相关性优化ctr模型。召回的模型一般选用双塔的结构，便利离线生成query和item侧的向量，接入线上的高效向量检索流程。

召回在模型上没有太多花样可玩，传言道，如果说排序是特征的艺术，那么召回便是样本的艺术，特别是负样本的艺术。召回层面的方针便是将与query相关的item召回，不相关的除掉，直接选用ctr的点击与否作为学习样本，显然是不合适的，这是由于召回所面对的百万、千万级的候选item，绝大多数是从未被曝光过的。大局负样本采样也存在必定问题，随机采样的样本过于简略，没有难负样本，模型难只能学习到粗粒度上的item区别，无法感知细微的差异。阿里在上一年发表的ESAM[7]，测验用一种新的视角处理Sample Selection Bias问题，将曝光过的样本点击label，搬迁学习到未曝光的item域上，能够获取大局的item标签。

查找中的个性化召回部分，理论上有两种方法可做，一种是运用根据trigger的传统方法进行U2I的召回，接着过一个query的相关性判别；一种是将用户特征融入到深度召回模型中。前者的功率会比后者差，所以咱们先方案测验用户特征的引进，向量召回部分现在仍在优化推进中，在此不作为重点详细展开论述。

3.2 排序

(1) 排序特征体系

视频精排用到的特征汇总如上，涉及到query维度、视频维度和用户维度。除了静态类的特点特征外，还有T+1的核算类特征，以及根据实时核算渠道magina开发的实时特征。时效性对视频排序尤为重要，实时类的特征必不可少，此外，学习Youtube在推荐体系中的做法，引进视频example age特征（当时时间-播映该视频的采样日志时间）将新视频和练习视频进行区别，能够进一步缓解新热问题。在视频内容的了解与表征上，咱们和行研的图画算法团队合作，提取视频的内容标签，比方演员信息、风格信息等，用于完善视频信息。为了描写视频的质量，选用了分辨率、时长和审阅状态特征。视频tab页中，单列流模式下，一屏只展现2个视频，用户的点击行为会由于position产生比较大的误差，为了消除方位误差的影响，咱们也加上了position特征。

界说好特征并完成特征抽取算子后，根据云音乐自研的snapshot实时样本渠道，能够便捷的获取线上样本的特征数据，并进行实时样本的落盘，用于模型的实时练习。snapshot渠道能够避免特征穿越问题，并确保线下与线上的一致性，为算法作用供给了强有力的确保[8]。

特征处理部分，也有一些技巧可言。关于id类型特征，为了缓解冷门id练习不充沛，咱们构建了id词典，将呈现频次少的id映射到同一编码上。处理接连数值型的核算类特征时，区间分桶受核算值变化影响较大，故选用log软分桶，能够使接连特征离散化，一起受核算值变化影响小。核算率值特征时，如果直接核算点击率，关于核算数据较少的曝光和点击，容易呈现高估的问题，需求做核算滑润处理。常见的滑润方法有威尔逊区间法、EM滑润、贝叶斯滑润[9]，实践中发现贝叶斯滑润作用最好，离线auc涨了千分之一个点。特征穿插在传统的机器学习中，往往经过人工的方法进行，近年来的深度模型已具有主动特征穿插的功用，能更高效的捕获特征间的相关[10]。

(2) 排序模型：单方针到多方针

视频排序单模型，方针是提高点击率ctr。咱们测验了从无模型（战略分）到deepFM模型的演进，deepFM取得了离线最高auc，上线后点击率也提高了5%。视频一期排序中，尚未考虑个性化要素，用户建模的模型还有待探究试验，根据attention思维的DIN和DIEN模型，是后续测验的方向。

视频事务方针多，针对多方针优化的多方针模型必不可少，咱们的精排大模型结构如下所示。图中示意了两个查找的根底中心方针，点击率ctr和有用转化率cvr，视频场景下咱们认为视频消费时长大于必定阈值则是有用消费。使命底层选用特征同享，模型沿用了MMOE[11]的结构，专家和gate的结构能够由简到繁，咱们用多层全衔接来作为base结构。考虑到postion bias，构建了一个shallow tower来做方位误差的消除。单一使命的学习部分，运用了全衔接层，为了增强模型的回忆才能，可将原始的输入特征经过sigmoid喂入到task顶层，经过线性逻辑来批改模型泛化的规则。终究核算loss时，参阅阿里ESMM[12]的思维，在全空间样本上一起进行ctr和ctcvr的loss学习，能够缓解Sample Selection Bias问题。不同方针的loss在量级和下降程度上会有差异，选用uncertainty weight loss[13]算法主动学习各方针的权重份额。

在敲定大模型结构之前，咱们进行了一系列的线下试验，测验了多方针使命领域内的一些经典模型，如简略的share-bottom方法，也试验了腾讯的PLE[14]，下表给出了试验的方针作用。

Models	练习方法	Loss加权系数	CTR-AUC	CVR-AUC
Single-CTR	0.810
Single-CVR	0.690
Share-Bottom	替换练习	0.817	0.707
ESMM	联合练习	ctr-loss:ctcvr-loss=0.04:1	0.811	0.678
ESMM	联合练习	UWL主动调权	0.818	0.691
MMOE	联合练习	ctr-loss:ctcvr-loss=1:1	0.823	0.721
MMOE	联合练习	UWL主动调权	0.822	0.720
PLE	联合练习	ctr-loss:ctcvr-loss=1:1	0.822	0.714
PLE	联合练习	UWL主动调权	0.821	0.710

经过试验数据，能够得到以下几个结论：
- 不同使命loss相差很大时，UWL会比直接Loss加和作用好；loss接近时，作用相当。
- PLE规划的初衷是为了缓解seesaw phenomenon，当多使命联系杂乱时，作用显著；关于ctr&cvr是递进联系的使命，提高作用不显著。
- ESMM规划是为了处理样本选择性误差和样本稀少问题，在视频场景下，cvr样本并非十分稀少，故cvr提高不显着。
- MMOE作用最佳，当使命联系简略或递进时，作用显着，将此作为后续上线模型。

关于不同的优化方针，应该酌情考虑模型结构和loss加权方法，不能一致而论。排序二期会将用户的视频播映完成度考虑进来，视频的播映时长占比和ctr、cvr的联系更为杂乱，归于回归使命，在模型选取和loss构建上，也会针对性优化。

(3) 排序模型：个性化模型

如前面所说，视频场景下的查找，跟单曲、演员查找相比，更倾向于非精准的查找，满意用户query的视频候选往往较多，个性化排序的空间相对较大。关于有歧义的query，个性化也能发挥作用，比方歌曲名“会不会”，能够对应到多个演员目的上，依据用户的前史偏好，能够将用户偏好的演员视频往前排，提高用户体会。在用户建模中，行为序列对错常有用的特征，也是排序二期探究的重点内容。

4. 小结与展望

云音乐视频查找当时面对四大痛点，视频内容的了解、相关性、时效性和多方针优化。本文作为第一篇章，论述了云音乐查找相关性模块的构建，也分享了精排一期中特征处理、多方针优化的一些经验。查找的优化负重致远，下半年将会集在更多方针的优化和个性化建模方向，提高线上方针的一起，更好的确保用户的体会，让视频查找更智能化。

阅读资料

[1] Jiang S, Hu Y, Kang C, et al. Learning query and document relevance from a web-scale click graph[C]//Proceedings of the 39th International ACM SIGIR conference on Research and Development in Information Retrieval. 2016: 185-194.

[2] Yao S, Tan J, Chen X, et al. Learning a Product Relevance Model from Click-Through Data in E-Commerce[C]//Proceedings of the Web Conference 2021. 2021: 2890-2899.

[3] Gao T, Yao X, Chen D. SimCSE: Simple Contrastive Learning of Sentence Embeddings[J]. arXiv preprint arXiv:2104.08821, 2021.

[4] Liang X, Wu L, Li J, et al. R-Drop: Regularized Dropout for Neural Networks[J]. arXiv preprint arXiv:2106.14448, 2021.

[5] Huang J T, Sharma A, Sun S, et al. Embedding-based retrieval in facebook search[C]//Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020: 2553-2561.

[6] Fan M, Guo J, Zhu S, et al. MOBIUS: towards the next generation of query-ad matching in baidu’s sponsored search[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 2509-2517.

[7] Chen Z, Xiao R, Li C, et al. Esam: Discriminative domain adaptation with non-displayed items to improve long-tail performance[C]//Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020: 579-588.

[8] 云音乐模型实时化-根据snapshot的实时样本 kms.netease.com/article/279…

[9] Wang X, Li W, Cui Y, et al. Click-through rate estimation for rare events in online advertising[M]//Online multimedia advertising: Techniques and technologies. IGI Global, 2011: 1-12.

[10] CTR神经网络特征穿插汇总mp.weixin.qq.com/s__biz=Mzg4…

[11] Zhao Z, Hong L, Wei L, et al. Recommending what video to watch next: a multitask ranking system[C]//Proceedings of the 13th ACM Conference on Recommender Systems. 2019: 43-51.

[12] Ma X, Zhao L, Huang G, et al. Entire space multi-task model: An effective approach for estimating post-click conversion rate[C]//The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018: 1137-1140.

[13] Kendall A, Gal Y, Cipolla R. Multi-task learning using uncertainty to weigh losses for scene geometry and semantics[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7482-7491.

[14] Tang H, Liu J, Zhao M, et al. Progressive layered extraction (ple): A novel multi-task learning (mtl) model for personalized recommendations[C]//Fourteenth ACM Conference on Recommender Systems. 2020: 269-278.

本文发布自网易云音乐技能团队，文章未经授权禁止任何方法的转载。咱们终年招收各类技能岗位，如果你预备换工作，又恰好喜爱云音乐，那就参加咱们 staff.musicrecruit@service.netease.com 。

云音乐视频搜索优化之旅