建站资讯

互联网技术潜规则一:作弊与反作弊

作者:admin 发布时间:2020-08-03

互联网技术作弊是啥? 互联网技术作弊是一种很普遍的行为,就拿我们最熟悉的来说,有电商和O2O的刷单刷信誉行为、广告作弊等,具体分类如下图:

广告作弊与反作弊 1.背景:互联网技术广告成为主流

(1)数据营销(互联网技术广告)分两类:


品牌广告:以品牌推广为主,多以千次曝光的形式计费,广告商追求的是长期的品牌溢价;


2017年上半年度, AdMaster推出的《广告反欺诈市场研究报告》显示:2016上半年度,AdMaster的广告反欺诈检测系统平均每天识别出高达 28% 的虚假流量。的确,中国的数据营销生态环境保护也正遭受着虚假流量的侵蚀。

3.作弊类型


点击作弊:利用机器、人工或诱导用户点击,例如把广告换成一个美女图片,吸引完全不符广告意图的点击。另外,竞争者还可能进行恶意点击。


点击行为分析:机器点击具有一定的持续性,可以通过判断同IP同设备的连续点击、同IP段的大量点击、同IP连续点击时间间隔等进行判断。


注册者从到站到注册间的间隔时间:真人在注册前会有长时间的浏览过程,而机器行为则直奔主题。


(1)排重:添加监测链接,通过Cookie、设备号或IP排重,如大量出现218.175.11.x这种相同C段的IP号。

(2)频度控制、SDK加密防护、人工介入监控

(3)点击有效期限:限制点击的有效期限,在有效期限内,后续转化归属相应平台,如超时则不予计算。

(4)异常数据信用黑名单:对点击记录超过一定范围标记为信用黑名单,长期过滤。

(5)归因时差监控:归因时差即指从点击到下载激活的时间。一般作弊时,伪造点击与激活是并存的,所以往往在时间逻辑上是错误的。

(6)增加行为操作的复杂性,但可能伤害用户。


从总体上,就是通过网站内部优化比如网站产业结构调整、内容建设、代码设计等,以及站外优化比如网站店铺推广、品牌文化建设等,使网站满足百度搜索引擎收录排名需求,在百度搜索引擎中提高关键字排名,从而吸引精准用户进入网站,获得流量,产生直接销售或品牌营销。

2.百度怎么反作弊? (1)绿萝算法:二零一三年2月上线的百度搜索引擎反作弊算法,主要打击超链中介、出卖链接、购买网站等超链作弊行为。通过综合外链内容的关联性、A及B网页页面内容品质、更新频率、违规历史数据、总权重,从而判断外链的权重传递是否有效。

(2)石榴算法:针对低品质网站的进一步打击的全新升级,将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面,尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表。


淘宝搜索反作弊系统不仅监控卖家行为,同时也监控买家行为,并且通过对买家ID的行为监控可倒推反证卖家作弊。而且,该算法还能够作为推荐系统使用。反作弊手段大致划分为以下3种:信任传播模型、不信任传播模型和异常发现模型。

()

1.信任传播模型 在海量的宝贝网页数据中,通过一定手段,筛选出决不能作弊的店铺、宝贝和ID(即授权管理)。算法以这些授权管理内的页面作为立足点,赋予授权管理内的页面节点较高的信任感分值,其他宝贝、买家、卖家是否作弊,要根据其和授权管理内节点店铺或宝贝的成交关系来确定。授权管理内节点通过成交关系将信任感分值向扩散传播,如果某个节点最后得到的信任感分值低于这一阀值,那么该宝贝网页、买家或卖家则会被认为是有作弊嫌疑。

2.不信任传播模型 从大的技术框架上来讲,其和信任传播模型是相似的,最大的区别在于初始的页面子集合不是值得信任的店铺或宝贝页面节点,而是确认存在作弊行为的页面或ID集合(即信用黑名单)。赋予信用黑名单内页面节点不信任分值,通过成交关系将这种不信任关系传播出去,如果最后页面节点的不信任分值大于设定的阀值,则会被认为是作弊网页或有作弊嫌疑。

3.异常发现模型 先找到一些作弊或非作弊的集合,分析出其绝对特征有什么,然后利用这些特征来识别作弊行为。从总体上,一种是直接从作弊行为包含的独特特征来构建算法;另一种是通过统计等手段分析正常的店铺、宝贝和ID应该具备哪些特征,如果不具备则被认为是作弊。这几种都是通过分析行为之间、物品之间的相似性或区别度,故还可以用来用于用户的人性化推荐,比如我们常见的 热门推荐 、 向你推荐 等。这是我了解的最有趣的一点。


收缩