AI智能
当前位置:
涂社首页 / 网站资讯 / 技术相关 / 通过robots.txt文件屏蔽蜘蛛抓取不存在的后缀

通过robots.txt文件屏蔽蜘蛛抓取不存在的后缀

2021-04-12 00:00   责任编辑: 涂社互联      阅读次数:50600   

通过网站日志分析,会发现搜索引擎蜘蛛抓取了一些网站上不存在的文件后缀,如:.php、.asp、.aspx等。

涂社互联网站后台日志分析结果如下图:

image.

涂社互联主站实际上不存在php后缀的URL地址。

可通过robots.txt文件禁止蜘蛛抓取不存在的后缀,减少出现404返回值。


在robots.txt文件填写屏蔽规则如下:

Disallow: /*.asp$
Disallow: /*.php$
Disallow: /*.aspx$

注意前面一个*,后面一个$,代表后缀。

参考涂社互联的robots.txt文件写法,点击这里

扩展

扫二维码与项目经理沟通

我们在微信上24小时期待您的声音

解答:网站建设APP开发小程序开发

涂社互联是色涂君网络旗下专注于网站建设APP开发小程序开发定制解决方案为主的互联网营销落地品牌。以客户需求为导向,客户利益为出发点,结合自身设计及专业建站优势,为客户提供从基础建设到营销推广的一整套解决方案,探索并实现客户商业价值较大化,为所有谋求发展的企业贡献全部力量。

涂社互联公众号
色涂君网络旗下涂社互联官方微信公众号