云音乐视频搜索优化之旅

云音乐视频搜索优化之旅

作者:卉芸

1. 事务简介与剖析

1.1 事务剖析

谈到查找,咱们日常生活已离不开此功用,例如通用查找引擎Google百度,购物时的电商查找,听歌时的音乐app查找等。在不同的事务场景下,查找的事务实质与方针也有着很大异同。在电商场景下,查找实质上对错精准导向的,由于满意用户query目的的产品候选量级极大,个性化的作用极大的被彰显,在query了解、召回及排序的各个环节,个性化都是必不可少的考量要素;此外,用户的query与产品的title存在显着的语义gap,商家多选用特点堆砌的方法来构成标题,导致与用户的表达方法差异较大;终究,算法的优化方针也十分明晰单一,即gmv及成交笔数。

在云音乐查找事务中,候选资源种类繁多,包括演员、单曲、歌单、视频、播单等多种异构资源,混排面对更多的应战;一起,关于演员及歌曲的查找,更倾向于精准化导向,满意用户目的的候选往往个数较少,对准确性要求极高,但在视频及歌单查找中,又更具有非精准性,满意用户query的候选多,故成果的个性化与多样性更需求被确保;关于不同的资源类型,算法的优化方针也不尽相同。

视频资源作为一种多模态的资源类型,在音乐查找中,有着自己的独特性:

(1)内容了解难:视频的标题及描绘并不能反响视频的悉数内容,视音频模态的信息补充十分要害;描绘文本倾向于天然句子,而非结构化的特点标签,长度也长短不均;信息抽取与语义表征难度高,用户query与视频相关性建模更为艰巨。

(2)相关性要求高:当用户查找单曲无版权时,可能会到视频页查找资源。有些查找query存在歧义,例如抖音火爆的歌曲“会不会”,仅经过文本词级其他匹配,会得到很多不相关的视频资源,故需求结合用户的实在目的来确保成果的相关性。

(3)时效性强:用户对热点内容需求较大,新热上升视频应该具有更多的曝光流量,例如“蜜雪冰城”查找成果下,应该将最近较火的日文改编版往前排。查找成果的时新性对用户的体会至关重要,实时的特征对排序作用影响较大。

(4)优化方针多:视频总体方针如下图所示,其间点击率和有用率,是最根底的优化方针,视频的播映时长占比、点赞率、保藏率、转发率也很重要,它们能更好的鼓励视频生产者创作,并和视频消费者构成更紧密的互动,利好整个视频生态。

云音乐视频搜索优化之旅

1.2 算法体系

云音乐视频搜索优化之旅

如上图所示,视频查找的全体算法体系能够分为五大模块:query了解模块、召回&扩召回模块、相关性模块、排序模块及重排战略模块。

数据发掘供给根底的数据支撑,包括新词发现、同义词发掘、标签发掘等,经过离线方法定时更新底层信息库,一起服务于视频了解模块。query了解作为初始环节,包办了文本归一化、纠错、词权重剖析、实体及特点抽取、目的辨认等功用,从用户不规则的输入文本中,获取到中心结构化信息,送入后续模块进一步处理。

召回部分可细分为两块,根底的文本查找引擎和多路扩召回,查找引擎结合紧密度、热度、tf-idf等特征给出候选粗排分数。扩召回可细分为两大类型:query改写多路及向量召回,前者经过显式的构建同义query召回更多满意语义的视频,具有更好的可解释性和可控性,后者运用模型泛化性隐式的召回相关视频,会带来一些惊喜的成果。相关性模块用于衡量用户query和视频的相关程度,能确保用户的查找体会,查找query和视频案牍存在天然的语义gap,同一query在不同的场景下存在歧义,怎么界说云音乐场景下的相关性并进行语义消歧,十分重要。

排序部分包括特征与模型的构建,根据云音乐自研的snapshot渠道,能够便捷的构建无特征穿越的实时样本,进行在线特征抽取及数据落盘,模型阅历了单方针到多方针的优化迭代。重排和战略是终究的一环,担任成果的多样性打散及可解释性案牍的拼装,也支持运营的case干涉。

云音乐的视频查找之前一直处于根底版别阶段,算法层面未阅历迭代优化。文本将结合上述重难点,详细从查找相关性和排序来论述下优化的方案与成效。召回部分会供给一个扼要的技能分享,不作为本文的重点。

2. 相关性

相关性是查找流程中十分重要的模块,它担任确保查找出来的成果和查找query是相关的,“相关”不只体现在word-level的匹配上,也体现在semantic-level层面,它是一种用户的片面感触,缺少一个通用的客观规范。 在不同事务场景下,查找相关性的界说是不同的,需求依据详细的事务认知,给出符合用户体会的档位界说。有别于ctr使命,相关性天然缺失样本标签,是否点击不能用于直接衡量query与item的相关性,由于用户的点击行为还会遭到活动、方位、别致等其他要素的影响,因此需求依据相关性准则,进行人工数据的标示,但是深度模型的练习依靠很多的标示样本集,不可能悉数由人工来标示。在模型层面,咱们熟知的文本匹配领域内的模型,比方representation-based和interaction-based模型,都能够搬迁用于query和item的相关性建模,但考虑到线上inference的功率和rt约束,需求在作用和功率上进行折中。 怎么运用有限的人工标示集,选用弱监督的方法构建一个高效的线上模型,是该使命的应战所在。

2.1 界说与评价

在云音乐查找场景下,咱们依据音乐领域内相关知识和用户的常见的目的种类,将相关性分拆为以下三个子维度:

  • 文本相关性

    • 指查找成果中包括查找query,即term匹配,查找成果中包括query中的中心词汇
  • 语义相关性

    • 指查找成果与query语义相关,能够广泛认为是知识相关,如歌手名和单曲名、专辑名、风格类型、国家语言、节目、渠道等相关
    • 例如 “晴天” vs “周杰伦”、“刘德华” vs “四大天王”、“会不会” vs “小乐哥”、“会不会” vs “陈绮贞”、“刘聪” vs “中国有嘻哈”
  • 目的匹配

    • query中包括详细歌曲、演员、歌单、专辑、歌词等实体目的时,资源中对应目的也该一致
    • 例如:”周杰伦 晴天” vs “视频(xx翻唱 晴天)”,这种状况认为是目的不一致,用户想搜的应该是 周杰伦演唱或许出演的晴天

结合以上三个子维度,咱们将音乐相关性界说为四个档位,详细为:

  • good档位(最相关档位)

    • term匹配 & 语义相关 & 目的匹配:示例:query(周杰伦 晴天) | 单曲(周杰伦-叶惠美-晴天)、query(周杰伦 晴天) | video(周杰伦演唱会live现场演唱《晴天》
    • 特殊说明:关于演员,例如 hehe vs 田馥甄,虽然term不匹配,但的确是同一个人,这种case也归于good档位
  • fair-good档位(次相关档位)

    • term不匹配 & 语义相关 & 目的匹配:示例:query(hebe)| 演员(S.H.E)
    • term不匹配 & 语义相关 & 目的不匹配:示例:query(周杰伦 晴天)| 视频(xx翻唱 晴天)
    • term匹配 & 语义相关 & 目的不匹配:示例:query(晴天)| 视频(xx翻唱 晴天)
  • fair-fair档位(中立档位)

    • term匹配 & 语义不相关 & 目的匹配:示例:query(晴天)| 单曲(我的新鲜女友晴天版)
    • term匹配 & 语义不相关 & 目的不匹配:示例:query(晴天)| 视频(冰菓动漫编排)
  • bad档位(完全不相关档位)

    • term不匹配 & 语义不相关:示例:query(晴天)| 歌曲(阿桑-受了点伤-叶子)

有了明确的档位界说后,在用户的前史点击日志中,挑选了万级其他样本进行人工标示,这部分数据能够用来finetune模型,也能够用于评价相关性模型的作用。由于音乐场景下的item分为多种资源类型,在视频标示时,以文本标题作为首要考量要素,视频文本标签作为辅佐要素。在实在的档位分布中,fair-fair档位占比较低,在评价模型作用时,将good和fair-good视为1,bad视为0,则能够作为二分类问题来核算auc方针。

2.2 模型选型

相关性的建模在业内存在多种方法,如下图所示,大致能够分为四种类型,根底的文本相关性模型、特点相关性模型、语义相关性模型和行为相关性模型。归纳四种不同方法获取的相关性分数,还能够构建一个顶层的归纳相关性模块,选用集成的方法,获取终究的相关性分数或档位。

云音乐视频搜索优化之旅

文本相关性,在词级别剖析query与doc间的相关程度。针对用户输入的query,进行分词,再根据如BM25等算法核算相关性,如紧密度是衡量term之间距离的一种方法。这种方法能够无缝对接查找引擎,启动快,但是无法处理消歧和语义类似的问题。

特点文本相关性,是将query和doc进一步进行特点的抽取与剖析,在同特点维度下判别是否相关,然后归纳各维度,得到终究相关性分数。这种方法可解释性强,但是对特点抽取的准确度要求高,一起需求发掘特点下的同义词表,才能获取更好的语义相关性。

语义相关性,选用深度模型来对语义建模,打破term层面的字面匹配约束,并能必定程度处理消歧问题,具有良好的泛化性。近年来NLP模型的迅猛发展,文本语义建模的方案层出不穷,文本匹配领域内的模型都能够拿来学习运用。由于工业界对线上rt有较高的要求,杂乱的交互式模型太重,不合适大规模上线运用,一起练习样本集的构建也非易事。

行为相关性,是指经过用户查找后的点击、有用消费等一系列行为,选用无监督的学习方法,在点击图上进行信息的传递,来发掘query与doc的相关性。该方法由Yahoo在网页查找中首先提出[1],算法将query和doc经过词向量传递,将两者变换到同一语义空间中,从而便利得到相关性的类似度核算。点击图的作用鲁棒性强,在头部query和doc上体现较好,但是在长尾数据上体现欠安。

2.3 收效方法及实战

得到query与item的相关性分数或档位后,该怎么应用到排序流程中呢。如下图所示,相关性模块除了输出相关分数外,还能够产出query向量、item向量(限于双塔模型),在召回中派上用场。能够用作一路语义向量召回,也能够在query改写的召回阶段用于寻觅类似query候选。排序中,语义向量和相关性分数能够拿来作为特征运用。

云音乐视频搜索优化之旅

在云音乐场景下,咱们在引擎粗排中融入了紧密度特征,并构建了交融特点维度的语义相关性模型,也测验了点击图模型的试验,以下做以介绍。

  • 语义相关性模型 – Aspect Relevance Model

练习深度模型需求很多的样本数据集,单个用户的点击与否不能直接当成正负样本,参阅电商语义相关性模型[2],咱们核算了query和item之间的平均ctr,并划分为高ctr、中ctr和低ctr三个区间。咱们认为在同一query下,ctr高的item相关性是要好于低ctr的,因此得到了一个分层次的监督学习数据集。在构建负样本时,咱们选用了随机采样的方法获取简略的负样本,一起,也经过正样本中某些NER词汇的替换改写,构建了一批难学的负样本,由此增强模型的区别才能。

云音乐视频搜索优化之旅

线上模型结构如上图所示,为了线上功用的优化,选用根底的双塔结构。底层同享词的embedding,在每个encoder侧,不只对query/item进行原始文本的信息编码,也对NER抽取的词组信息进行encoding。关于每个维度的语义信息,选用根据CNN的self-attention方法获取深层的语义表征,如果选用多个卷积核,能够得到多组的query或维度文本的向量表明。核算query与item的相关性分数时,选用弱交互的方法,对向量进行求和、求差、拼接三个操作后,送入全衔接层,经过max-pooling和sigmoid获取终究的相关性分数。在视频场景下,除文本信息外,还有图画、音频信息,能够将图画向量视为一个语义维度,运用tensor fusion进行向量的外积交融,这种方法关于多模态信息的交融更充沛,作用优于直接concat。

在loss的构建上,依据分层的ctr样本界说了一种pointwise的loss方法

云音乐视频搜索优化之旅

其间,score为猜测的相关性分数,target为方针分数,关于不同来历的正样本,要求猜测分需求大于相关性的阈值分,关于负样本,猜测分需求小于对应的阈值分。在离线模型的评价中,为了对比数据采样的有用性,将点击样本直接拿来练习模型,模型在人工评测数据上的auc为0.706,而选用分层的ctr数据练习,auc可达0.742。进一步的,运用1w条人工标示集进行finetune后,auc能够提高到0.830。

  • 点击图模型 – Click Graph Model

用户的点击日志蕴含着丰厚的信息,点击图模型运用二部图的信息传导,从类似的query/item中提取term来丰厚当时节点的term表达。咱们选用近三月的查找点击日志,构建了query和item的图,其间item包括多种资源,单曲、演员、歌单、视频等。针对不同的资源类型,选取不同的元字段信息来做文本的表征,比方视频类型,除了标题信息外,还选用了内容描绘标签信息,在分词阶段,接入了云音乐专属的事务词典,避免将歌曲名、演员名切分错误,一起过滤掉无意义的停用词。节点之间的权重选用了点击率,相比点击次数,点击率更能反响query与item的相关程度。

query和item间的向量迭代沿用了Yahoo文中的核算方法,每次迭代后在人工评测集上核算auc,选取最高auc对应的迭代向量,作为终究的词袋成果。下图给出了一个case成果,“陈奕迅”及两个对应的视频的终究的迭代向量中,包括了相关的歌曲词汇及演员词,有必定的可解释性。得到词袋向量后,需求⼀个合适的度量⽅法来核算类似度,咱们试验了两种种⽅式:cosine类似度和kl散度KL(Q||I)。为削减核算量,对词袋向量作了⻓度截断,仅保留top20个词。在同一份人工评测集上,选用kl散度的相关性分数,auc能够到达0.768,作用要好于finetune之前的语义相关性模型。

云音乐视频搜索优化之旅

点击图方法核算简略有用,是一种鲁棒性很强的相关性算法,关于没有点击行为的query和item,Yahoo提出能够将文本拆解为n-grams,学习n-grams的向量表达和权重信息,处理中长尾无表达的问题。由于query侧的词袋向量表达中,会迭代出相关性较强的词汇,咱们选出了tag query下的词袋信息进行调查,如下图所示,第二列的词袋词汇中能够发掘出很多相关词,这部分进行人工审阅后,能够补充到同义词典中。

云音乐视频搜索优化之旅

实际运用中,咱们将相关性应用到视频排序阶段,终究线上有点率提高1.5%,有用有点率提高2.3%。在视频8.0版别人工测评中,相关性及高质量召回case数量比7.0增加23%。以下给出一个相关性优化的成果展现。

云音乐视频搜索优化之旅

3. 召回及排序

云音乐视频搜索优化之旅
召回和排序是搜推算法中传统的两个模块。召回需求处理的候选集量级极大,线上呼应的时效要求高,因此不能选用杂乱结构的模型。排序阶段又能够细分为粗排和精排,在精排阶段,一般只需对上百个item进行打分,为了更准的呈现用户想看的成果,对模型的准确性要求较高,故需求在特征上做更精细化的处理,并选用更杂乱的模型来拟合数据分布。

3.1 多路召回

在视频召回中,咱们拟定了四大类召回方法:根底文本召回、query改写多路召回、向量召回、个性化召回。在根底的文本召回根底上,为了能召回更多语义相关的候选视频,构建了显式的query改写召回和隐式的向量召回。为了更好地满意用户个性化体会,也单独构建了个性化召回链路。

query改写的流程可细分为召回与判别两部分。在召回环节,可经过语义embedding相近、同session下query发掘、近义词替换等方法,寻觅与query同义或近义的query候选。在判别环节,构建语义类似度模型,衡量两个query是否语义相同,由于改写的数据能够离线生成好供给线上运用,所以杂乱的交互式模型如bert,都能够派上用场。事务中标示样本本钱较高,今年发表的simCSE[3]和R-drop[4]模型,也十分合适用在工业场景中。

依据建模方法的差异,可将向量召回分为如下图几类。近年来的文献中,向量召回在推荐领域内的发展较多,对user和item的建模方案,能够酌情搬迁到query和item上。查找事务上,Facebook上一年的工作EBR[5]和Baidu的Mobius[6]也有很强的学习意义,ebr从样本采样到体系层面给出了详细的实践经验与试验剖析,mobius结合查找相关性优化ctr模型。召回的模型一般选用双塔的结构,便利离线生成query和item侧的向量,接入线上的高效向量检索流程。

云音乐视频搜索优化之旅

召回在模型上没有太多花样可玩,传言道,如果说排序是特征的艺术,那么召回便是样本的艺术,特别是负样本的艺术。召回层面的方针便是将与query相关的item召回,不相关的除掉,直接选用ctr的点击与否作为学习样本,显然是不合适的,这是由于召回所面对的百万、千万级的候选item,绝大多数是从未被曝光过的。大局负样本采样也存在必定问题,随机采样的样本过于简略,没有难负样本,模型难只能学习到粗粒度上的item区别,无法感知细微的差异。阿里在上一年发表的ESAM[7],测验用一种新的视角处理Sample Selection Bias问题,将曝光过的样本点击label,搬迁学习到未曝光的item域上,能够获取大局的item标签。

查找中的个性化召回部分,理论上有两种方法可做,一种是运用根据trigger的传统方法进行U2I的召回,接着过一个query的相关性判别;一种是将用户特征融入到深度召回模型中。前者的功率会比后者差,所以咱们先方案测验用户特征的引进,向量召回部分现在仍在优化推进中,在此不作为重点详细展开论述。

3.2 排序

(1) 排序特征体系

云音乐视频搜索优化之旅

视频精排用到的特征汇总如上,涉及到query维度、视频维度和用户维度。除了静态类的特点特征外,还有T+1的核算类特征,以及根据实时核算渠道magina开发的实时特征。时效性对视频排序尤为重要,实时类的特征必不可少,此外,学习Youtube在推荐体系中的做法,引进视频example age特征(当时时间-播映该视频的采样日志时间)将新视频和练习视频进行区别,能够进一步缓解新热问题。在视频内容的了解与表征上,咱们和行研的图画算法团队合作,提取视频的内容标签,比方演员信息、风格信息等,用于完善视频信息。为了描写视频的质量,选用了分辨率、时长和审阅状态特征。视频tab页中,单列流模式下,一屏只展现2个视频,用户的点击行为会由于position产生比较大的误差,为了消除方位误差的影响,咱们也加上了position特征。

界说好特征并完成特征抽取算子后,根据云音乐自研的snapshot实时样本渠道,能够便捷的获取线上样本的特征数据,并进行实时样本的落盘,用于模型的实时练习。snapshot渠道能够避免特征穿越问题,并确保线下与线上的一致性,为算法作用供给了强有力的确保[8]。

特征处理部分,也有一些技巧可言。关于id类型特征,为了缓解冷门id练习不充沛,咱们构建了id词典,将呈现频次少的id映射到同一编码上。处理接连数值型的核算类特征时,区间分桶受核算值变化影响较大,故选用log软分桶,能够使接连特征离散化,一起受核算值变化影响小。核算率值特征时,如果直接核算点击率,关于核算数据较少的曝光和点击,容易呈现高估的问题,需求做核算滑润处理。常见的滑润方法有威尔逊区间法、EM滑润、贝叶斯滑润[9],实践中发现贝叶斯滑润作用最好,离线auc涨了千分之一个点。特征穿插在传统的机器学习中,往往经过人工的方法进行,近年来的深度模型已具有主动特征穿插的功用,能更高效的捕获特征间的相关[10]。

(2) 排序模型:单方针到多方针

云音乐视频搜索优化之旅

视频排序单模型,方针是提高点击率ctr。咱们测验了从无模型(战略分)到deepFM模型的演进,deepFM取得了离线最高auc,上线后点击率也提高了5%。视频一期排序中,尚未考虑个性化要素,用户建模的模型还有待探究试验,根据attention思维的DIN和DIEN模型,是后续测验的方向。

视频事务方针多,针对多方针优化的多方针模型必不可少,咱们的精排大模型结构如下所示。图中示意了两个查找的根底中心方针,点击率ctr和有用转化率cvr,视频场景下咱们认为视频消费时长大于必定阈值则是有用消费。使命底层选用特征同享,模型沿用了MMOE[11]的结构,专家和gate的结构能够由简到繁,咱们用多层全衔接来作为base结构。考虑到postion bias,构建了一个shallow tower来做方位误差的消除。单一使命的学习部分,运用了全衔接层,为了增强模型的回忆才能,可将原始的输入特征经过sigmoid喂入到task顶层,经过线性逻辑来批改模型泛化的规则。终究核算loss时,参阅阿里ESMM[12]的思维,在全空间样本上一起进行ctr和ctcvr的loss学习,能够缓解Sample Selection Bias问题。不同方针的loss在量级和下降程度上会有差异,选用uncertainty weight loss[13]算法主动学习各方针的权重份额。

云音乐视频搜索优化之旅

在敲定大模型结构之前,咱们进行了一系列的线下试验,测验了多方针使命领域内的一些经典模型,如简略的share-bottom方法,也试验了腾讯的PLE[14],下表给出了试验的方针作用。

Models 练习方法 Loss加权系数 CTR-AUC CVR-AUC
Single-CTR 0.810
Single-CVR 0.690
Share-Bottom 替换练习 0.817 0.707
ESMM 联合练习 ctr-loss:ctcvr-loss=0.04:1 0.811 0.678
ESMM 联合练习 UWL主动调权 0.818 0.691
MMOE 联合练习 ctr-loss:ctcvr-loss=1:1 0.823 0.721
MMOE 联合练习 UWL主动调权 0.822 0.720
PLE 联合练习 ctr-loss:ctcvr-loss=1:1 0.822 0.714
PLE 联合练习 UWL主动调权 0.821 0.710
  • 经过试验数据,能够得到以下几个结论:

    • 不同使命loss相差很大时,UWL会比直接Loss加和作用好;loss接近时,作用相当。
    • PLE规划的初衷是为了缓解seesaw phenomenon,当多使命联系杂乱时,作用显著;关于ctr&cvr是递进联系的使命,提高作用不显著。
    • ESMM规划是为了处理样本选择性误差和样本稀少问题,在视频场景下,cvr样本并非十分稀少,故cvr提高不显着。
    • MMOE作用最佳,当使命联系简略或递进时,作用显着,将此作为后续上线模型。

关于不同的优化方针,应该酌情考虑模型结构和loss加权方法,不能一致而论。排序二期会将用户的视频播映完成度考虑进来,视频的播映时长占比和ctr、cvr的联系更为杂乱,归于回归使命,在模型选取和loss构建上,也会针对性优化。

(3) 排序模型:个性化模型

如前面所说,视频场景下的查找,跟单曲、演员查找相比,更倾向于非精准的查找,满意用户query的视频候选往往较多,个性化排序的空间相对较大。关于有歧义的query,个性化也能发挥作用,比方歌曲名“会不会”,能够对应到多个演员目的上,依据用户的前史偏好,能够将用户偏好的演员视频往前排,提高用户体会。在用户建模中,行为序列对错常有用的特征,也是排序二期探究的重点内容。

云音乐视频搜索优化之旅

4. 小结与展望

云音乐视频查找当时面对四大痛点,视频内容的了解、相关性、时效性和多方针优化。本文作为第一篇章,论述了云音乐查找相关性模块的构建,也分享了精排一期中特征处理、多方针优化的一些经验。查找的优化负重致远,下半年将会集在更多方针的优化和个性化建模方向,提高线上方针的一起,更好的确保用户的体会,让视频查找更智能化。

阅读资料

[1] Jiang S, Hu Y, Kang C, et al. Learning query and document relevance from a web-scale click graph[C]//Proceedings of the 39th International ACM SIGIR conference on Research and Development in Information Retrieval. 2016: 185-194.

[2] Yao S, Tan J, Chen X, et al. Learning a Product Relevance Model from Click-Through Data in E-Commerce[C]//Proceedings of the Web Conference 2021. 2021: 2890-2899.

[3] Gao T, Yao X, Chen D. SimCSE: Simple Contrastive Learning of Sentence Embeddings[J]. arXiv preprint arXiv:2104.08821, 2021.

[4] Liang X, Wu L, Li J, et al. R-Drop: Regularized Dropout for Neural Networks[J]. arXiv preprint arXiv:2106.14448, 2021.

[5] Huang J T, Sharma A, Sun S, et al. Embedding-based retrieval in facebook search[C]//Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020: 2553-2561.

[6] Fan M, Guo J, Zhu S, et al. MOBIUS: towards the next generation of query-ad matching in baidu’s sponsored search[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 2509-2517.

[7] Chen Z, Xiao R, Li C, et al. Esam: Discriminative domain adaptation with non-displayed items to improve long-tail performance[C]//Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020: 579-588.

[8] 云音乐模型实时化-根据snapshot的实时样本 kms.netease.com/article/279…

[9] Wang X, Li W, Cui Y, et al. Click-through rate estimation for rare events in online advertising[M]//Online multimedia advertising: Techniques and technologies. IGI Global, 2011: 1-12.

[10] CTR神经网络特征穿插汇总mp.weixin.qq.com/s__biz=Mzg4…

[11] Zhao Z, Hong L, Wei L, et al. Recommending what video to watch next: a multitask ranking system[C]//Proceedings of the 13th ACM Conference on Recommender Systems. 2019: 43-51.

[12] Ma X, Zhao L, Huang G, et al. Entire space multi-task model: An effective approach for estimating post-click conversion rate[C]//The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018: 1137-1140.

[13] Kendall A, Gal Y, Cipolla R. Multi-task learning using uncertainty to weigh losses for scene geometry and semantics[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7482-7491.

[14] Tang H, Liu J, Zhao M, et al. Progressive layered extraction (ple): A novel multi-task learning (mtl) model for personalized recommendations[C]//Fourteenth ACM Conference on Recommender Systems. 2020: 269-278.

本文发布自网易云音乐技能团队,文章未经授权禁止任何方法的转载。咱们终年招收各类技能岗位,如果你预备换工作,又恰好喜爱云音乐,那就参加咱们 staff.musicrecruit@service.netease.com 。