新浪王久明分享死链解决方案 教你如何处理预防网站死链

在第四次深“度”接触结束后,spider工程师表示新浪的死链处理工作一直效果不错,提醒学院应该请其做个分享。新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请新浪王久明分享如何死链处理和预防网站产生死链(重要页面因修改而产生死链)方面的经验。

一、在以下背景下会较多产生死链

1、时政新闻的敏感性;

2、来自监管的删除需求;

3、频道(编辑)自身删改的需求;

4、搜索方期望资源方主动优化和定期清除的需求

想知道如何查找出全站死链,请阅读本站另一篇文章:死链检测工具Xenu:让全站死链、暗链、黑链无处遁形

二、死链分类

由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:

1、协议死链,服务器端返回HTTP状态码404;

404死链

2、内容死链,服务器端返回HTTP状态码200,无法设置为404;

404死链案例

3、页面需要用户和蜘蛛可以正常访问,但由于删改或误操作导致反复上下线形成协议死链或内容死链。

上线后又下线,后又上线,甚至反复多次。由于下线期间存在协议死链或内容死链的情况,导致百度认为该页面应该被删除,不被收录,且即使后续重新上线也无法恢复收录。对于这种情况,应加以预防。

网站死链预防

如果你还不知道为什么要处理网站死链?死链对网站有多大影响?网站死链又是怎么产生的?可以阅读本站另一篇好文:死链对网站的影响、产生过程、解决办法 。

三、死链解决方案

1、协议死链,这个最符合HTML标准处理方式,站点方面无须多做什么,如果需要百度快速处理可以通过百度站长平台的死链提交工进行主动提交。

2、无法设置协议死链接,仅主体内容文本被删除的内容死链死链,新浪的处理方法是:

1)走事先之制定好的《死链标准流程》:用站内标准内容死链模板页面(告诉用户该页无法找到)覆盖需要删除的页面,5秒后跳转到统一的全站导航页,以减少用户流失。

2)根据需要,比如根据特定关键词圈定一批最终需要处理为协议死链的敏感页面,将这些页面链接放到一个文件里,由专人在服务器端修改成协议死链。通过百度站长平台工具进行死链提交

3、针对反复上下线导致百度误判为死链的情况,新浪的预防办法是:

1)制度上:系统后台设置提醒,提醒编辑上线后除非特殊情况不要下线;

2)功能上:这种情况在专题运营中最常见,且影响比单篇新闻页要大,由于我站点运营规定是不能删除页面的,因此在系统后台将“删除专题(对编辑来说就是删除该专题)”和“将专题调整为不对外显示(对编辑来说不是删除,而是暂时下线,调整为外网用户无法访问,可随时再次重新上线)”两个功能严格区分开,并提供回收功能。针对“将专题调整为不对外显示”这种情况,不再将页面更新为内容死链(页面无法找到),以免被百度误判。专题页面仍可访问,只是站点不设置入口、不进行推广,用户没有访问来源而已。

注:原文来自百度站长平台

百度竞价推广托管服务