建站优化
如何批量检测被百度收录的死链的方法
发布日期:2017-08-17 09:32

  前段时间服务(service)器被入侵(指以征服或虏掠为目的的窜犯),挂了很多博彩之类的黑页,而且全部被收录。青岛网站建设就建站公司而言,很多企业的需求往往具有模糊性,对此建站公司要从专业性的角度为企业提供完善的策划方案,而且这些方案必须要做到图文并茂,同时通过图片来模拟相关的设计以及后台功能展现情况,让企业对此有着明确的认识和了解,然后确定最终的需求,然后再进行网站设计和建设,就会做到事半功倍,否则无论是企业还是建站公司都是双输。
  现在把漏洞(weak points)补好了,但删除黑页文件以后成了死链,要怎么让删除收录呢?
  在网上找了一下,似乎只有检测网址是否被收录的工具,而没有检测收录的是不是死链的工具。青岛网站建设就建站公司而言,很多企业的需求往往具有模糊性,对此建站公司要从专业性的角度为企业提供完善的策划方案,而且这些方案必须要做到图文并茂,同时通过图片来模拟相关的设计以及后台功能展现情况,让企业对此有着明确的认识和了解,然后确定最终的需求,然后再进行网站设计和建设,就会做到事半功倍,否则无论是企业还是建站公司都是双输。
  自己理清了下思路,找办法找出了所有被收录的死链,并写下这篇文章。
  不知道有没有更好的方法,大家可以告诉我,先分享给大家,如果有大神请忽视或者告诉我更好的方法,一起学习交流吧。
  下面教程开始
  先在找到xenu可以模拟(定义:对真实事物或者过程的虚拟)爬虫爬取所有连接,我下载了个汉化版。
  我们先用这个工具查询所有被收录的页面。
  打开软件,填入简版site网站(website)地址,之所以用简版是可以减少链接查询时间和内容。(请把xxx.bizcn.com换成你的网址)
  http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site:xxx.bizcn.com
  等待检测完成。
  点击导出为制表符分隔的文件。
  导出的文件,我们可以看到格式(form )是:网址+空格+状态(state)码
  那么写一个正则,把需要(xū yào)的网址提取出来就行,比如www.baidu.com下的0页面就是
  /http:\/\/www.baidu.com(.*?)\s0/i
  (以http://www.baidu.com开头,\s代表空格,0,/i代表匹配大小写)
  不会正则怎么办?
  为了方便大家,我把文件作了修改,大家只要把head改成标致性开头,state改成状态码就行,file改成导出的文件路径就行。
  head怎么改,举个例子,
  你的网站是http://www.baidu.com/abc.html,那么你就写http://www.baidu.com/
  你的网站(website)是http://abc.baidu.com/abc.html,那么你就写http://abc.baidu.com/
  把正则写入php,在php环境(huán jìng)下运行get.php。青岛网站制作是根据客户的详细要求来定的报价,比如,您打算制作的网站的基本功能(展现公司简介、产品展示、联系方式、人才招聘、企业风采等),您的产品展示方式有没有特殊要求,人才招聘有没有特殊要求,需不需要留言功能,需不需要我们上门拍摄照片,程序上有什么特殊要求没有。那么结果就出来了。
  这时你只需要(xū yào)全选,复制到一个txt文件,上传(Upload)到网站(website)空间,再到死链提交填入文件路径(path)就行就可以。
  我们知道,思路是通过爬取找出所有被收录的链接,然后按条件列出来而已。
  这样的话,只要把开头输入的site网址改一下,也可以查询其他搜索引擎(Engine)(Search Engine)的收录。
  把正则改一下,可以获得(huò dé)如标题等其他内容。在此就不一一叙述。
  
金湖棋牌 金湖棋牌APP下载 江苏11选5开奖结果 永凡棋牌 江苏11选5 江苏11选5开奖结果 江苏11选5走势图 江苏11选5开奖记录 金湖棋牌APP下载 江苏11选5走势图


金湖棋牌 金湖棋牌APP下载 江苏11选5开奖结果 永凡棋牌 江苏11选5 江苏11选5开奖结果 江苏11选5走势图 江苏11选5开奖记录 金湖棋牌APP下载 江苏11选5走势图