跟着小红书社区电商业务的发展,营销类型不断丰富,覆盖的用户及场景随之增加,黄牛的抢购手法也逐步杂乱多样。除了长期存在的同人集合性购买热销产品的方法,还衍生出了众包方法的抢购——即经过约请真人用户代为购买让利产品,转寄继而到货后转账的方法来获取货物和差价收益。
此类黄牛行为不只会给渠道带来丢失,还会继续影响普通用户以及商家的权益。为维护用户和商家的利益,小红书反做弊团队一直在继续地经过各种手法与黄牛进行对立,并从中沉积出了高效、可执行、可完成的图核算算法模型。
1. 黄牛防控难点与应战
在进行对立之前,咱们需求先明确对立的对象是谁,以及将面临的难点有哪些:
- 黄牛常以团伙方法呈现,这要求咱们除了要注意被购买产品上的明显集合特征外,还需运用其他特征精准判断用户身份。
- 黄牛用户首要有两大类:
-
- 同人类黄牛:经过大批量注册、买卖账号囤积资源,定期运营,在买卖时会经过切换账号来规避风控阻拦。
- 众包类黄牛:经过分发使命的模式进行买卖,账户真实性高,从设备或行为上较与正常用户的区别较小,难以区别。
- 电商业务改变较快,黄牛所针对的产品类型及做弊手法也在不断改变,反做弊需求不断优化而且更新方法,在满足业务精细化需求的同时防止新式黄牛手法的攻破。
2. 防控手法与方法-图核算算法模型
Q:为什么运用图核算?
A:在回答这个问题之前,咱们可以先了解什么是图。图是由一组节点与一组可以将两个节点相连的边组成的,节点间树立的边可以描绘不同的相相联系。比方在电商场景中,存在购买用户与产品两个不同特点的节点,其间的边可以代表着用户的阅读联系、购买联系与点评联系等;而用户在买卖中运用的手机号、设备等又可以作为不同特点的节点与购买者相连,并经过边来描绘其运用或持有联系,这种联系可以经过图数据结构存储下来,在电商推荐、搜索、风控等多哥范畴完成大数据剖析与模型练习。图核算的优势首要在于:
1.图数据结构所能存储的数据特征维度更加丰富:相较于传统表式存储更能描绘不同主体间杂乱的相相联系,在电商范畴中更能凸显做弊集体内以及不同集体间的相相联系,使这些相关更直接,更直观,也更易于理解。
2.图数据库的查询与剖析效率更高,功能更优:比方在交际联系型数据中,跟着交际联系的深度(即朋友的朋友)越深,联系型数据库与图数据库的查询功能相差越大。
3.图数据库可以更加方便地运用数据进行建模:图数据库的重要性往往体现在当前电商买卖场景中重要的“数据联系”上,和人际联系相同,数据的价值也在于它们之间的相相联系上。相较于单纯的节点数据剖析,这种联系数据的建模剖析往往能带来更多增益。
Q:咱们怎样运用图核算来预防和对立黄牛危险?
A:之前已经介绍了首要的两类黄牛危险:同人黄牛与众包黄牛。咱们团队分别从这两类黄牛危险的做弊特征出发,规划了两种针对的性的图核算模型。
2.1电商同人黄牛图算法
同人黄牛图的规划理念:在渠道买卖对立中,同人黄牛用户经常会经过特别手法更换资源来绕过传统战略,而且在买卖时的特征维度存在多跳联系,战略的局限性会被放大;且买卖链路对时效性的要求极高,咱们更需求实时地辨认账号或行为间具有集合性的黑产并打击,以保证渠道商家与用户的买卖安全。为了应对这种应战,咱们开发一种体现更直观,可描绘性更强且具有实时迭代才能的黄牛图算法,并经过以下流程进行构建:
1.经过线上数据对Kafka买卖行为日志实时消费,并经过反序列化方法提取用户UID、设备指纹参数、IP地址、产品ID等信息。
2.将对象作为不同节点并构建其间的边,在这种树立节点与边的过程中赋予其内在多维度特征,并将这种异构拓扑相关图谱写入Nebula图数据库,建边方法包括但不限于:
a.用户注册、登录行为中的绑定联系e.g.:用户→绑定账号等。
b.用户买卖行为中的运用联系e.g.:用户→设备、IP等。
c.用户买卖行为中的购买联系e.g.:用户→产品、商家等。
运用这种联系图谱,咱们可以实时多跳相关抽样子图并进行强实体挖掘与弱标签传播等方法来发现同人黄牛集体,并将异常集体更新至危险种子库来实时保证买卖安全。
2.2电商众包黄牛社群发现算法
Q:什么是社区发现算法?
A:社区发现算法基于模块度(Modularity),经过不断遍历街坊结点并将自己的社区标签更新为模块度增量最大的街坊标签直至不再有增益,然后找到每个节点所属的社区。
Q:怎样运用社区发现算法来对立众包黄牛?
A:针对电商场景中具有团伙集合性质的众包黄牛购买行为,咱们运用社区发现算法树立了电商异常社群发现模型,经过用户与其购买的产品之间的联系建边,构建用户与用户之间的二部图。在模型的树立过程中咱们运用数据预处理过滤了对模型影响较大的异常数据,并运用自定义间隔算法来量化用户之间在购买上的相似度:
其中k表明两用户共同购买的产品数目,CA与CB分别表明对应用户购买产品数量,Wpurchase与Wreceive分别表明用户购买与收货相似度,并跟着时刻窗口与是/非大促期间自适应改变,R(A,B)越高表明用户购买相关性越大,对应建边权重越大,由此构建用户间购买联系。
经过树立的用户购买联系图,咱们运用社群发现算法进行社群归并,得到被划分的社群后,进一步对不同社群用户进行特征描绘并主动筛查,然后取得真实想要找到的可疑度较高的众包黄牛用户与团伙。
3. 结语
除了前文首要介绍的两类图算法,小红书反做弊团队仍在继续沉积并研发多种对立黄牛的手法。比方咱们针对众包黄牛的特点,运用黄牛团伙约请真人用户的流程,在技能层面规划了一整套辨认、阻拦和数据沉积的流程,经过用户标示——>阻拦——>辨认产品——>沉积产品和用户数据——>回扫确认危险用户——>更新标示构成一个闭环的监控,这套流程帮助咱们依据阻拦率拟定预警,使咱们可以实时监控并及时发现抢购状况,后续咱们还将运用它沉积用户黑产画像、让利产品和黄牛地址等多维数据。
在业务层面上,咱们依据产品类型、售卖模式拟定了个性化限购方案——经过了解商家对具体产品的限购业务逻辑,针对直播间的让利营销,抽象出不同类别的限购需求,再结合hammurabi风控引擎,构建累计因子,定制限购的风控战略,同时继续与业务交互,以完成精细化运营。这类型的风控方法不需求依赖于用户间的相相联系,而是运用沉积的数据做纵向阻拦,与图算法模型构成互补。
4. 作者信息
傅达 小红书安全技能部算法工程师
老皮 小红书安全技能部数据剖析师
时影 小红书安全技能部产品经理