HTTPS是以安全为目标的HTTP通道,是HTTP的安全版,保证数据传输的安全,有效保障用户隐私数据,截取也无法解密。
HTTPS的收录机制是什么?
一、蜘蛛如何发现HTTPS
1、网页中出现的超链接是不是HTTPS,如果是HTTPS蜘蛛会认为是HTTPS站点。
2、站长平台链接提交工具,比如主动提交,文件中如果提交的是HTTPS的链接则以HTTPS的形式来发现。
3、参考抓取相对路径,如果第一个网页是HTTPS,网站里面的内容路径提供的也是相对路径,认为这种链接是HTTPS。
4、观察历史的链接,通过这种方式的原因主要是为了纠错,如果提取HTTPS是错误的会出现以下两种情况:第一种,因为HTTPS不可访问导致抓取失败。第二种,抓取成功但是可能会导致展现出来的效果不是站长想要的。
二、HTTPS链接的抓取
链接的抓取有两种:第一种HTTPS抓取,它没有HTTP的版本。第二种是通过HTTP重定向到HTTPS。通过这两种方式都是可以正常的进行抓取,和HTTP抓取的效果是一样的。
三、HTTPS的展现方式
HTTPS数据,在展现端会有明显的提示。