济宁天气预报
济宁市人力资源和社会保障局
济宁人事考试单位代码
济宁市安全教育平台
济宁违章查询
济宁住房公积金查询
济宁科技网 济宁培训班 济宁银行网上银行 济宁教育网 济宁旅行社 济宁旅游 济宁市地图 济宁房产 济宁教育网 济宁人事考试信息网 济宁新闻网
侠盗飞车 济宁信息港
浏览器之家 济宁汽车 掼蛋
下载吧 股票书籍 word
照片恢复 炸金花
红警之家 掼蛋游戏下载
马伊琍 手机照片恢复
您现在的位置:主页 > 旅游界 > 国内旅游 > 如何不让搜索引擎抓取网站的隐私内容?(2)

如何不让搜索引擎抓取网站的隐私内容?(2)

时间:2013-10-17 00:00来源:未知 www.yunhepan.com

例子:

http://www.cncn.com/robots.txt    有效

http://www.cncn.com/bbs/robots.txt     无效

4.生效时间

robots.txt文件一般生效时间为7-15天,即1-2周。如果新网站源码中包含robots.txt文件,那样蜘蛛进行爬行时就会生效,如果是后来添加的,那样蜘蛛需要对数据进行更新,时间一般在7-15天。

5.关于robots.txt一般站长需要注意以下几点:

1.)网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。

2.)网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。

3.)一些没有关键词的页面,比如站内的搜索结果页面屏蔽掉更好

4.)网站中的脚本程序、样式表等文件即使被蜘蛛收录,也不会增加网站的收录率,还只会占用服务器存储空间。因此必须在robots.txt文件里设置不要让搜索蜘蛛索引脚本程序、样式表等文件。

5.)搜索蜘蛛抓取网页太浪费服务器资源,在robots.txt文件中设置所有的搜索蜘蛛都不能抓取全部的网页。如果这样的话,会导致整个网站不能被搜索引擎收录。


上一篇:紧盯“中国钱袋子” 多国放宽对华签证
下一篇:要不要“到此一游”?

济宁运河畔网版权与免责声明:

①凡本网来源于注明来“源于:运河畔或www.yunhepan.com”版权均属运河畔网所有,其他媒体可以转载,且需注明“来源运河畔网”
② 凡本网注明“来源:XXX(非济宁运河畔,济宁信息港)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
③ 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

  • 全网热点
  • 健康
  • 教育
  • 旅游
  • 美食