百度飓风算法3.0 打击恶劣采集与站群问题

百度飓风算法3.0 打击恶劣采集与站群问题

飓风算法是百度搜索为打压站点恶劣采集行为,给优质原创内容提供更多展示机会,促进搜索生态良性发展而推出的一种搜索引擎算法。百度发布了飓风算法,旨在严厉打击恶劣采集行为和站群问题,将覆盖百度搜索下的 PC 站点、H5 站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。

  • 算法名称:飓风算法
  • 上线日期:2017.7.4
  • 算法目的:严厉打击恶劣采集行为和站群问题
  • 算法作用:营造良好的搜索内容生态

算法版本

飓风算法 3.0

2019 年 8 月 8 日,百度搜索将飓风算法升级到飓风算法 3.0,主要打击百度搜索下的 PC 站点、H5 站点、智能小程序存在的跨领域采集及批量构造站群获取搜索流量的行为。飓风算法 3.0 旨在维护健康的移动生态,保障用户体验,保证优质站点/智能小程序能够获得合理的流量分发。

本次算法升级主要针对跨领域采集以及站群问题,将覆盖百度搜索下的 PC 站点、H5 站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。

飓风算法 2.0

2018 年 9 月 13 日,百度对飓风算法进行升级,发布飓风算法 2.0,主要打击采集痕迹明显、内容拼接、站点存在大量采集内容、跨领域采集等五类采集行为。飓风算法 2.0 旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。

飓风算法2.0主要打击以下四类恶劣采集行为:

  • 存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
  • 存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
  • 站点内存在大量采集内容,网站自身的内容生产力极差。
  • 站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。

飓风算法 1.0

2017 年 7 月 4 日,百度搜索资源平台发布公告推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。

飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在百度搜索资源平台的反馈中心进行反馈

算法惩戒及建议

1. 跨领域采集

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。

问题示例:美食类智能小程序发布足球相关内容

问题示例:美食类智能小程序发布足球相关内容

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。

问题示例:智能小程序内容涉及多个领域

问题示例:智能小程序内容涉及多个领域

建议:鼓励站点生产领域内的文章和内容,通过领域专注度获得更多的搜索流量。不要尝试采集跨领域的内容来获得短期收益,这样会造成领域专注度的降低,从而影响站点在搜索中的表现。

2. 站群问题

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低

问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低

3. 采集痕迹明显

站点存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。

问题示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显

问题示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显

建议:对于网站发布的内容,需注意文章的排版和布局,不应出现与文章主旨不相关的信息或不可用的功能,干扰用户的浏览。

4. 内容拼接

采集多篇不同文章进行拼接,整体内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。

问题示例:前后内容无关,逻辑不连贯

问题示例:前后内容无关,逻辑不连贯

建议:严厉反对利用采集编辑器等工具,随意生产拼接采集内容的行为,请网站多多生产对用户有价值的原创内容。

5. 存在大量采集内容

网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。

建议:鼓励站点生产原创内容,如若转载需标明出处。(如:新闻、政策类等标明出处的转载内容,不会被认为是采集内容)

飓风算法多久能恢复

  • 对于第一次违规的站点,改好后解除限制展现的周期为 1 个月;
  • 对于第二次违规的站点,我们将不予释放。

飓风算法常见 Q&A

列出一些搜索引擎优化过程中可能会遇到的和飓风算法相关的疑问,如下:

Q1:同一品牌下,分公司的网站/智能小程序都采用相同的模板,是否会被判定为站群,被飓风算法 3.0 命中呢?

A1:对于站群问题,算法会根据多个因素综合判断,如页面排版相似度、同一主体下的站点/智能小程序数量、内容质量、内容稀缺性、内容相似度等等。

如果同一品牌下的网站/智能小程序,使用相同的页面排版,内容相似度较高,这类情况也有可能被判定为站群,存在被算法命中的风险。

百度飓风算法 3.0 打击恶劣采集与站群问题

问题示例:某品牌下多个智能小程序,使用相同的模板,内容质量低,相似度高

Q2:这次飓风算法升级主要打击跨领域采集,那么同领域的采集会被算法覆盖吗?

A2:此次飓风算法 3.0 的主要升级点是加强了对跨领域采集和站群问题的覆盖,但以往飓风算法对恶劣采集的控制依然有效。百度搜索算法一直在持续运行,控制伤害用户体验的违规问题,不会因为算法的升级或新增而导致旧算法停止。

Q3:如果站点/智能小程序中有曾经跨领域采集的内容,为了避免被算法命中,需要将以前的跨领域内容删除吗?

A3:是的,如果站点/智能小程序中曾经发布过与网站/智能小程序所属领域不相关的内容,我们建议您尽快删除跨领域的内容,深耕当前领域,生产满足用户需求的优质内容,提升网站/智能小程序的领域专注度。

Q4:在一个站点下设置不同主题的频道或目录,发布不同领域的内容,这样会被算法命中吗?

A4:在同一个站点下可以存在不同主题的频道或目录,但每个频道的内容都应当与该站点的领域定位相关,且专注于该领域,频道内容应是满足搜索用户需求的优质内容。

Q5:在同一个主体下开发不同的智能小程序,发布不同领域的内容,这样会被算法命中吗?

A5:在同一个主体下可以存在不同主题的智能小程序,但每一个智能小程序都应当具有专业的资源、优质的内容、完善的功能,不存在站群行为,且内容应专注于该智能小程序所属的领域。

本文原创作者:SEO大学,其版权均为SEO大学所有。如需转载,请注明出处:《百度飓风算法3.0 打击恶劣采集与站群问题
20

发表评论

//百度统计