引荐和查找是近年来信息分发的重要办法,小红书UGC社区让人形象深入,其引荐体系有何特别之处?学界对搜推体系召回阶段有哪些首要发展和主流办法?面临大语言模型的兴起,引荐和查找的展开有哪些机会和应战?

为联结核算技能范畴企业技能高管和专家学者,讨论技能展开趋势,由 CCF CTO Club 发起的 CCF C 活动在 3 月 30 日走进小红书,多位来自行业的专家和学者以 “智能引荐与查找” 为主题,与现场 40 余位嘉宾深入讨论沟通。同时,活动全程在“中国核算机学会”、“小红书技能REDtech”、“机器之心”、”量子位“等多渠道同步直播,共招引 16000+ 人在线观看,直播数据创 CCF C 活动历史新高。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

CCF 副秘书长、企工委主任、亿邦动力 CEO- 王超 掌管活动

活动现场由 CCF 副秘书长、企工委主任、亿邦动力 CEO王超掌管。CCF 副理事长、立异工场首席科学家、澜舟科技创始人兼 CEO周明,小红书技能副总裁风笛别离致辞,周明代表 CCF 为活动承办方小红书颁布 CCF C 活动承办单位感谢牌。本活动约请风笛和武汉大学国家网络安全学院教授李晨亮,就 《小红书引荐体系的技能立异与实践》《搜推体系召回阶段的前沿发展》 作主题陈述共享。在圆桌论坛 《智能引荐未来的展望》 中,风笛作为掌管人,与中国人民大学出色学者特聘教授、北京智源人工智能研讨院智源学者徐君,天津大学副教授、华为诺亚方舟决议计划推理试验室主任郝建业,中国科学院核算技能研讨所副研讨员敖翔,汇量科技首席人工智能官朱小强,小红书社区技能负责人夏侯一起对话,共享真知灼见,讨论引荐和查找的未来。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

CCF 副理事长、立异工场首席科学家澜舟科技创始人兼 CEO- 周明 致辞

1. 共享 • 小红书引荐体系的技能立异与实践

作为当下展开迅速的移动互联网渠道,小红书正成为跨代际人群的生活百科全书。社区每天都会产生很多图文、视频、评论互动等信息,这些多模态数据让小红书App成为引荐、查找的最佳实践场所,同时也提出不小的技能应战。风笛在共享 《小红书引荐体系的技能立异与实践》 主题陈述时,先从企业全体视角动身,解读小红书引荐体系背面的核心理念,再具体论述技能难题和应对战略。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

小红书技能副总裁- 风笛

风笛介绍小红书事务时表明,小红书的首要方针用户经过不同的事务展开阶段现已从最初的“高消费才能的女性集体”向外泛化,期望服务更广泛的人群。近三年,小红书用户数量增长迅速,到去年底,月活用户超过2.6亿、月度活跃创作者超过2000万。现在,小红书的定位是一个普通人帮助普通人的内容共享社区,聚集多元生活办法,核心理念是“Inspire Lives 共享和发现国际的精彩“。作为一个内容丰厚的UGC社区,小红书鼓励每个用户发布的内容都能被全国际看到,这就意味着它的引荐体系不同于业界的惯例做法,更注重平权分发而非只是寻求功率。这需求一个更加去中心化的流量分发机制,对算法模型是不小的应战。

结合小红书事务特点,风笛具体论述了引荐体系的四点首要应战:多模异构内容引荐、去中心化分发、爱好多样性和人群破圈,以及成本控制算力优化。小红书人的作业办法是“走进用户”,注重用户体会的情绪也融入到了小红书App中,例如坚持使用双列的产品形状,是为了给用户自由选择的权力。传统人工界说的层次化标签,无法完整描写图文和视频内容;小红书技能团队根据10亿量级的图文、视频笔记,将多模态预练习运用到引荐体系中,获得内容的向量化表征;未来将打通内容表征和行为表征,两域联合建模。

如安在平衡大局功率束缚下做潜力预估和流量分配?为应对业界公认的冷启动难题,小红书高时效引荐体系从“天级更新”晋级为“分钟级更新”,这对新笔记冷启动和扶持小众内容均有增益。为优化用户体会,防止用户落入信息茧房,风笛表明会设置各种指数遗忘战略,对用户的实时爱好做降权,保证爱好多样性,缓解追打密布。这样既能平衡用户的用户的长时间爱好与短期爱好,亦能促进社区生态繁荣。

此外,为让有一起爱好的用户充分沟通,小红书引荐体系寻求的对错大局功率最优,简言之便是“人以群分”,让每篇笔记内容、每位用户都能在自己的爱好圈层进行沟通。在小红书社区,和用户交朋友,让真挚活动,让小众内容长起来,让人与人的连接更严密。共享最后,风笛也抛出了两个小问题供业内考虑,怎么做高效的爱好探究和怎么对留存进行建模。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

2. 共享 • 搜推体系召回阶段的前沿发展

在数据爆炸的时代,每个人都需求进行信息检索。引荐和查找是最首要的办法,而人机对话也逐步成为主流。在工业界同样如此,搜推体系的召回阶段十分要害:在实践事务场景中,如安在亿级产品中快速找到用户感爱好的候选产品?这一步决定了精排阶段的成功与否。武汉大学李晨亮教授带来了 《搜推体系召回阶段的前沿发展》 主题陈述。在陈述中,他介绍近几年搜推体系召回阶段的首要发展和主流办法,结合相关前沿作业,讨论未来的展开趋势。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

武汉大学国家网络安全学院教授- 李晨亮

在召回阶段,业界对于响应时延的苛刻要求,导致无法使用才能更强但是核算开销更大的模型办法。李晨亮教授指出:“召回的首要方针是保证低时延,同时满足功率和性能,对当时研讨依然是不可逾越的应战,这不是技能,反而是一门艺术“。他要点介绍了表征学习、交互式学习两种办法,并环绕“双塔模型/深度网络模型、多爱好建模、长尾数据处理、外部数据丰厚场景语义”这四个方向来提炼产品和用户的表征,精准辨认用户需求。其间,怎么处理长尾数据的作业与小红书社区理念背面的引荐机制不谋而合。

3. 圆桌论坛 智能引荐未来的展望

在主题陈述共享完毕后,风笛作为圆桌论坛掌管人,与中国人民大学教授徐君、天津大学教授郝建业、中科院研讨员敖翔、汇量科技首席人工智能官朱小强、小红书社区技能负责人夏侯,及现场嘉宾环绕 《智能引荐未来的展望》 进行深入讨论。智能引荐和查找作为经典问题,在产业实践和前沿探究中都十分重要。近期,ChatGPT的火爆引起了社会各界对大语言模型、AIGC等热点话题的注重。风笛提问: “它们的爆发,对引荐和查找的展开会带来哪些机会和应战呢?” 开启了圆桌论坛的讨论。各位嘉宾依据自身经历动身,别离发表了观点。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

中国人民大学出色学者特聘教授、北京智源人工智能研讨院智源学者- 徐君

首要研讨查找的徐君教授结合微软 New Bing 的比如,论述了大语言模型的兴起,会改动传统互联网的查找习惯和广告盈利形式。郝建业教授指出,传统的引荐体系根据有限的用户数据,经过过拟合的办法进行类似内容的分发,但其实无法真实了解用户的心智改变;等待未来引荐与大模型的结合,引荐能完成真实的“智能化”、“个性化”、“人性化”。敖翔提出要活跃拥抱新东西,一方面不要完全信任模型给出的成果,需求依据不同场景进行评估,另一方面要多考虑怎么使用大模型,完成更多的价值。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

天津大学副教授、华为诺亚方舟决议计划推理试验室主任- 郝建业

引荐和查找技能的实质是为消费者提供更准确、优质的信息,以完成构建美好国际的初衷,正如风笛共享所言,小众的社区需求更有效的曝光和相符的用户集体。但是,大语言模型是否会替代引荐体系?来自工业界的朱小强持短期保存、长时间激进的情绪。短期内,大语言模型为企业提供私有数据之外的常识;而从长时间来看,当人们获取信息办法发生改变,信息分发技能会迎来新的冲击,原有的引荐形状和模型或许需求重新构建,这是一把悬在咱们头上的剑。夏侯提出未来3至5年面临的应战:传统的查找和引荐都是根据用户点击触发的行为形式。过去单纯以用户点击而驱动的算法分发形式,正走向用户行为+内容了解双轮并驱的分发形式,能否真实完成搜推一体化,更好地提升用户行为功率呢?

当推荐和搜索遇上大模型,会碰撞出什么样的火花

中国科学院核算技能研讨所副研讨员- 敖翔

随后,风笛为每位嘉宾准备了特别问题,约请大家逐个共享。徐君教授拥有丰厚的产学研经历,共享了智能信息检索范畴的最新发展,即怎么发现并去除用户反应中的偏差。ChatGPT 带火了 RLHF(根据人类反应的强化学习),郝建业教授论述了 RLHF 与传统强化学习的差异,以及对引荐的启发:从数据质量抓取下手,先树立一个十分精准的长时间用户爱好的大模型,在此基础上做立异作业。谈及“在保护用户隐私和安全的前提下,怎么使用金融反诈骗的经历来应对 AICG 在引荐体系中的乱用“时,敖翔同样认为树立一个精准的用户行为模型十分重要。咱们需求打破公司内部的数据墙,将数据打通,完成多模态、长周期的全量用户数据分析,以便更好地了解用户行为和意图。朱小强具体共享了过亿 DAU 的大 APP 和几百万的小 APP,在引荐算法和数据建模的不同之处。规划引荐体系,需求考虑法令、隐私、安全、数据等问题。“没有高质量的数据,只谈技能,无疑是空中楼阁。“他强调了好数据的重要性,并共享了实践洞悉。大模型能打破国界、语言的妨碍,了解不同国家和地区的用户行为和文化,更好地为用户提供引荐服务。为在用户规模、社区封闭性、商业化开放性之间做权衡,夏侯谈及小红书智能引荐事务面临的三大应战:体系复杂度、方针多样性、内容多样性。

当推荐和搜索遇上大模型,会碰撞出什么样的火花

汇量科技首席人工智能官- 朱小强

最后,各位嘉宾就“下一代引荐体系技能形成大一统的或许性“、“数据、算力等资源对智能引荐的产业格局影响”展开深度讨论。面临大语言模型,咱们应活跃拥抱新事物、慎重地审视它,做更加个性化、智能化的引荐与查找!或许,智能引荐技能将成为未来的底层操作体系,AI 范畴向其他学科范畴输出的那一天,就要来了。

CCF 期望经过 CCF C 活动搭建中国企业技能沟通渠道,经过两年 18 场的活动努力,现已在核算机、互联网、AI及相关范畴树立起良好口碑。CCF C 活动第 18 场走进小红书,十分感谢多位讲者及圆桌嘉宾的精彩共享,现场沟通气氛热烈。本活动全程有录播回看视频,欢迎在“小红书技能REDtech”视频号及B站、“CCF数字图书馆”查阅。小红书长时间注重技能展开及人才培养,愿和全行业一起进步,等待下次相遇!