360搜索“ICO算法”清理低质量URL与重复内容

360搜索“ICO算法”清理低质量URL与重复内容

360 搜索“ICO 算法”是 360 搜索引擎第一个真正意义上的搜索引擎算法,相信很多人并没有听说过 360 搜索的一项具体的算法名称,此 ICO 并非网站 ICON 图标,以下是官方给出的 ICO 算法一些介绍。

ICO 算法解读

ICO 算法是对已经入索引库的低质量 URL 和无效 URL 数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)

算法公布规范:一次清理超过 10 亿页面的算法 360 搜索都将提前公布告知站长,并告知算法优化处理的主要方向。


ICO 算法—本次针对重复内容清理

处理量级:10 亿以上

处理网页特点:

该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL 地址含有无效参数的页面等。

例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。

本文原创作者:SEO大学,其版权均为SEO大学所有。如需转载,请注明出处:《360搜索“ICO算法”清理低质量URL与重复内容
48

发表回复