Sogou搜索引擎站长指南
《搜狗站长指南》中列出了常见的有关收录、搜狗 spider 偏好以及作弊行为等问题,让站长在 Sogou 搜索引擎优化的时候更加了解 Sogou 搜索引擎,最大程度避免踩坑,利用搜狗站长指南助力 Sogou 搜索优化。附下载
一、常见收录问题
1.1 什么样的站点会受到搜狗欢迎?
搜狗会收录满足用户需求的网站和网页。搜狗最重视的就是用户体验。
站长们一定要意识到,站点应该是面向用户的,而不是面向搜索引擎的。因此一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;反过来,如果你的站点做了很多针对搜狗的优化,但却给用户带来大量负面体验,那么,你的站点最终肯定会被搜狗和用户遗弃。
面向用户的站点一般会满足以下三个特征:
- 站点稳定可访问;
- 站点内容真实、完整、丰富、对用户有意义有帮助;
- 站点浏览体验好;
1.2 什么样的网站搜狗不予收录?
内容重复,有更佳资源可替代的网站
对于简单抄袭与采集的内容,搜狗有理由不予收录。简单抄袭和采集会影响用户体验,因此搜狗更喜欢独家,或经过人工认真编辑的内容。
无实质内容或内容无意义的站点
类似“淘宝客”站点,自身无实质商品信息,跳转到淘宝站点的;内容不可理解,无意义的,搜狗有理由不予收录。
作弊的站点
作弊包括一切针对搜索引擎做的欺骗流量的行为:恶意关键词优化、低质甚至垃圾友情链接等。作弊会严重影响用户体验,一经发现,搜狗会对作弊站点进行严厉打击,包括降权以及封禁。处罚时间最短为 60~90 天,整顿完成后申述,达到标准后可恢复收录或恢复部分收录。
盗版内容的网站
包括盗版视频,书籍,私服等。未经版权拥有者授权,非法设立的网络服务器的站点,搜狗有理由不予收录。
涉及无保障财产交易的网站
为保障用户财产安全,对于可能会造成用户的财产损失的页面,搜狗可以不予收录。
浏览体验差的站点
页面排版混乱,内容与广告无法区分,大面积广告,出现预期之外的弹窗等等浏览体验差的站点,搜狗有可能不予收录。
违法内容的站点
淫秽色情、非法博彩、网络诈骗、涉枪涉暴、政治敏感等内容的站点,搜狗不予收录。
1.3 如何查看我的网站是否被搜狗收录?site 语法看到的结果数是不是收录的真实数量?
站长常常会告知我们搜索结果不显示他们的网站,但其实这些网站仍然收录在搜索结果当中。要判断搜狗是否已经收录您的网站,可以通过执行 site 语法查看——直接在搜狗搜索框中输入 site:您的域名,如 site:www.seoeri.com,如果可以查询到结果,那您的网站就已经被搜狗收录。site 语法中,冒号必须为英文。site 语法得到的搜索结果数,只是一个估算的数值,仅供参考。
1.4 我的网页为什么会从搜狗搜索结果中消失?
如果您的网页长时间无法从搜狗搜索到,或者突然从搜狗的搜索结果中消失,可能的原因有:
- 您的站点对搜狗 spider 进行了封禁,导致搜狗无法获取您的页面从而被搜狗暂时性去除;
- 您的网页内容或浏览体验不符合用户的搜索体验;
- 您的站点被黑导致存在搜狗不欢迎的内容;
- 您的站点存在作弊行为;
- 您的网页内容有不符合国家法律和法规规定的地方;
- 其他技术性问题。
- 参与了搜狗推广但未续费,会从搜狗搜索结果中消失;
- 参与了其他搜索引擎的广告项目,会从搜狗搜索结果中消失;
- 与搜狗旗下网站产生了竞争,会从搜狗搜索结果中消失;
- 从搜狗获得的流量太大,会从搜狗搜索结果中消失。
二、如何从搜狗中删除内容
2.1 如何让我的网页不被搜狗收录?
搜狗严格遵循搜索引擎 Robots 协议,详细内容,参见http://www.robotstxt.org/您可以设置一个 Robots 文件以限制您的网站全部网页或者部分目录下网页不被搜狗收录。
如果您的网站在被搜狗收录之后才设置 robots 文件禁止抓取,那么新的 robots 文件通常会在 48 小时内生效,生效以后的新网页,将不再建入索引。
需要注意的是,robots.txt 禁止收录以前搜狗已收录的内容,从搜索结果中去除可能需要数月。若您急切需要删除,可以通过删除快照或死链提交告知搜狗您所需要删除的内容。
删除快照支持单个页面删除,并且需要提供相应的证件,核实情况属实则予以删除。死链提交只删除死链,不存在的页面。
2.2 为什么我的网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被搜狗收录?
首先站长们要了解,sogou spider 对网页的抓取,是通过网页与网页之间的链接实现的。网页之间的链接类型,除了站点内部的页面链接(内链)之外,还有不同网站之间的互相链接(外链)。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。
搜狗 Spider 的访问权限,和普通用户是一样的。之所以看上去某些访问权限限制内容被搜狗收录,原因可能有两点:
- 该内容在 Spider 访问时是没有权限限制的,但抓取后,内容的权限发生了变化。
- 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则 Spider 就会循着这条路径抓出受限内容。因此也提醒站长们及时的修补网站安全漏洞。
三、搜狗对作弊的定义与处罚
3.1 搜狗对作弊网站的定义是什么?
作弊网站是指在网页设计中,为了提升网页在搜索引擎中的排序而做的欺骗搜索引擎的行为。
这种做法导致的结果是或许您的网站会在短时间内(搜狗未发现您的作弊行为前)会有所提升,但最终会以被降权或封禁作为对您网站的惩罚而告终。作弊会严重影响用户体验,一经发现,搜狗会对作弊站点进行严厉打击,包括降权以及封禁。
处罚时间最短为 60 天,整顿完成后可进行网站申诉,申诉后工作人员会在20~30 个工作日内对您的站点质量进行评估,整顿达到标准后可恢复收录或恢复部分收录。
请注意,解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚,可能导致永久封禁。
3.2 常见的作弊行为有哪些?
隐藏文本/隐藏链接
一般指网页专为搜索引擎所设计,但普通访问者无法看到的文本内容或链接。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。其他方法包括使用超小号文字、文字放在图片层的后面、页面底部下出现的多余内容、滥用图片 ALT 等;
- 隐藏文本内容——意欲在不影响网站美观的前提下通过包含大量关键词的网页提高关键词相关性得分,从而达到改善搜索引擎排名的目的。
- 隐藏链接——意欲在不影响网站美观的前提下通过在其它页面添加指向目标优化页的隐形链接,通过提升链接得分而改善搜索引擎排名。
现在大多数搜索引擎都能检测隐藏技术,并视为作弊。这类包含隐含文本或链接的网页面临被搜狗 spider 降低排名甚至删除列表的惩罚。
网页与描述不符
一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。常见的“诱饵行为”就属于此类偷梁换柱之举——创建一个优化页和一个普通页,然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。
滥用关键词
- 误导性关键词——在页面中使用与该网页毫不相干的误导性关键词来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和客观性,为搜索引擎所深恶痛绝。
- 重复性关键词——这种作弊技术也被称为“关键词堆砌欺骗”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行不合理的(过度)重复。类似的其它做法还包括在 HTML 元标识中大量堆砌关键字或使用多个关键字元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。
恶意互换链接
在网页中互相建立大量指向对方网站的链接。
隐形页面
对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的对搜索引擎友好的内容提升排名。
欺骗性重定向
指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。
建立大量镜像网站
复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。
页面包含恶意广告、恶意代码或恶意插件
页面有链接指向作弊网站的可能会被视为作弊网站。
以下两点:
- 对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
- 对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使你的网站受到负面影响。
日志欺骗行为
是指通过对一些页面等级较高的站点进行大量的虚假点击以求名列这些站点的最高引用者日志中,从而获得它们的导入链接。
3.3 搜狗会怎样处罚作弊网站?
搜狗反作弊系统会实时监控作弊网站,并根据作弊等级对作弊网站进行相应的处罚。
- 常见处罚:降低网站在搜狗的整体排名;
- 一般处罚:仅索引正常网页比如首页,其他网页不予收录;
- 严厉处罚:包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。
3.4 如何申请解除处罚
被搜狗视为有作弊行为的网站,在清除作弊内容后,可在站长平台中的网站申诉提交解除作弊处罚申请。
搜狗工作人员会在收到申诉之后的20~30 个工作日内对您的站点质量进行审查,如果确认网站已经不存在作弊行为,搜狗将恢复对该网站的正常收录。解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚,可能导致永久封禁。
说法都是错误的和毫无根据的:
- 我成为搜狗的广告客户或者联盟网站,就可以重新被收录。
- 我给搜狗若干钱,就可以重新被收录。
- 我认识搜狗的某某人,就可以重新被收录。
完结:以上为 Sogou 搜索引擎站长指南的全部内容。各站长按需查阅。