robots文件的代码意思是什么?:浩顺考勤机 服务器IP和端口号设置

時間:2024-01-19 08:51:31 作者:浩顺考勤机 服务器IP和端口号设置 熱度:浩顺考勤机 服务器IP和端口号设置
浩顺考勤机 服务器IP和端口号设置描述::

  网站上线之前,优化师都会认真的检查一遍有没有遗漏的地方,其中一项就是robots文件的添加,robots文件的作用是告诉搜索引擎蜘蛛,这个网站上什么内容是可以抓取的,哪些内容是禁止抓取的。但是里面代码一堆,哪些是可以抓取,哪些是禁止呢?一起来了解下吧~

  Useragent禁止访问抓取系列:

  Useragent *

  这里的*好是通配符,意指所有的搜索引擎都可以抓取,包括百度、搜狗、360等等

  Disallo

  意思是禁止蜘蛛抓取该网站的任何目录

  Disallo123

  意思是禁止蜘蛛抓取该网站的123以及123层级之下的所有内容

  Disallo123

  意思是禁止蜘蛛抓取123层级之下的所有内容,但是可以抓取123页面的内容

  Disallo*png

  意思是禁止蜘蛛抓取网站上所有png格式的图片,想要禁止抓取其它格式也是这样书写,比如想要禁止抓取网站jpg格式的图片,书写方式为Disallo*jpg

  Disallo123*png

  禁止蜘蛛访问123层次下的png图片,其他格式也是同样的书写方式

  Disallo*?*

  禁止蜘蛛抓取网站上所有的动态url页面

  Disallo123*?*

  禁止蜘蛛抓取网站上123目录下的所有动态页面,不影响抓取网站123目录中的其它内容

  Allo允许抓取访问系列:

  Allo的意思是允许蜘蛛访问抓取的意思,在写robots文件的时候一定要注意一件事,就是在书写的时候,一定要将allo放在disallo前面,才能不受disallo的影响,其它的写法参考disallo的书写方式,这里就不凑字数了。

  有一点注意事项,大家在使用的时候一定要注意,robotstxt文件名称一定要小写的,不要大写。有了完整的robots文件,搜索引擎在抓取的时候才会更加的方便,利于对网站的提升。

站長聲明:以上關於【robots文件的代码意思是什么?-浩顺考勤机 服务器IP和端口号设置】的內容是由各互聯網用戶貢獻並自行上傳的,我們新聞網站並不擁有所有權的故也不會承擔相關法律責任。如您發現具有涉嫌版權及其它版權的內容,歡迎發送至:1@qq.com 進行相關的舉報,本站人員會在2~3個工作日內親自聯繫您,一經查實我們將立刻刪除相關的涉嫌侵權內容。