百度飓风算法3.0 打击恶劣采集与站群问题
飓风算法是百度搜索为打压站点恶劣采集行为,给优质原创内容提供更多展示机会,促进搜索生态良性发展而推出的一种搜索引擎算法。百度发布了飓风算法,旨在严厉打击恶劣采集行为和站群问题,将覆盖百度搜索下的 PC 站点、H5 站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。
- 算法名称:飓风算法
- 上线日期:2017.7.4
- 算法目的:严厉打击恶劣采集行为和站群问题
- 算法作用:营造良好的搜索内容生态
算法版本
飓风算法 3.0
2019 年 8 月 8 日,百度搜索将飓风算法升级到飓风算法 3.0,主要打击百度搜索下的 PC 站点、H5 站点、智能小程序存在的跨领域采集及批量构造站群获取搜索流量的行为。飓风算法 3.0 旨在维护健康的移动生态,保障用户体验,保证优质站点/智能小程序能够获得合理的流量分发。
本次算法升级主要针对跨领域采集以及站群问题,将覆盖百度搜索下的 PC 站点、H5 站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。
飓风算法 2.0
2018 年 9 月 13 日,百度对飓风算法进行升级,发布飓风算法 2.0,主要打击采集痕迹明显、内容拼接、站点存在大量采集内容、跨领域采集等五类采集行为。飓风算法 2.0 旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。
飓风算法2.0主要打击以下四类恶劣采集行为:
- 存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
- 存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
- 站点内存在大量采集内容,网站自身的内容生产力极差。
- 站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。
飓风算法 1.0
2017 年 7 月 4 日,百度搜索资源平台发布公告推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。
飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在百度搜索资源平台的反馈中心进行反馈
算法惩戒及建议
1. 跨领域采集
指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。
问题示例:美食类智能小程序发布足球相关内容
第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
问题示例:智能小程序内容涉及多个领域
2. 站群问题
指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低
3. 采集痕迹明显
站点存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。
问题示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显
4. 内容拼接
采集多篇不同文章进行拼接,整体内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。
问题示例:前后内容无关,逻辑不连贯
5. 存在大量采集内容
网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。
飓风算法多久能恢复
- 对于第一次违规的站点,改好后解除限制展现的周期为 1 个月;
- 对于第二次违规的站点,我们将不予释放。
飓风算法常见 Q&A
列出一些搜索引擎优化过程中可能会遇到的和飓风算法相关的疑问,如下:
Q1:同一品牌下,分公司的网站/智能小程序都采用相同的模板,是否会被判定为站群,被飓风算法 3.0 命中呢?
A1:对于站群问题,算法会根据多个因素综合判断,如页面排版相似度、同一主体下的站点/智能小程序数量、内容质量、内容稀缺性、内容相似度等等。
如果同一品牌下的网站/智能小程序,使用相同的页面排版,内容相似度较高,这类情况也有可能被判定为站群,存在被算法命中的风险。
问题示例:某品牌下多个智能小程序,使用相同的模板,内容质量低,相似度高
Q2:这次飓风算法升级主要打击跨领域采集,那么同领域的采集会被算法覆盖吗?
A2:此次飓风算法 3.0 的主要升级点是加强了对跨领域采集和站群问题的覆盖,但以往飓风算法对恶劣采集的控制依然有效。百度搜索算法一直在持续运行,控制伤害用户体验的违规问题,不会因为算法的升级或新增而导致旧算法停止。
Q3:如果站点/智能小程序中有曾经跨领域采集的内容,为了避免被算法命中,需要将以前的跨领域内容删除吗?
A3:是的,如果站点/智能小程序中曾经发布过与网站/智能小程序所属领域不相关的内容,我们建议您尽快删除跨领域的内容,深耕当前领域,生产满足用户需求的优质内容,提升网站/智能小程序的领域专注度。
Q4:在一个站点下设置不同主题的频道或目录,发布不同领域的内容,这样会被算法命中吗?
A4:在同一个站点下可以存在不同主题的频道或目录,但每个频道的内容都应当与该站点的领域定位相关,且专注于该领域,频道内容应是满足搜索用户需求的优质内容。
Q5:在同一个主体下开发不同的智能小程序,发布不同领域的内容,这样会被算法命中吗?
A5:在同一个主体下可以存在不同主题的智能小程序,但每一个智能小程序都应当具有专业的资源、优质的内容、完善的功能,不存在站群行为,且内容应专注于该智能小程序所属的领域。