从概念上区别:每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度快照功能在百度的服务器上保存了几乎所有网站的大部分页面,使您在不能链接所需网站时,通过百度快照也能正常浏览网页。网站收录就是与互联网用户共享网址,网站收录前提是网站页提交给搜索引擎,蜘蛛才会光顾,每次抓取网页时都会向索引中添加并更新新的网站,站长只需提供顶层网页即可,不必提交各个单独的网页。抓取工具能够找到其他网页。符合相关标准提交的网址,会在1个月内按搜索引擎收录标准被处理。
不知道大家会不会从下边的图中发现一点问题:
通常所说的百度快照有两个含意,个是几乎每个被百度收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。当用户在百度搜索引擎上试图打开搜索结果网页无法打开,或者打开速度特别缓慢时候,该网页的“百度快照”能帮您解决问题。百度从自身网站调用纯文本的“百度快照”速度较快,您可以通过“快照”快速浏览页面内容。
百度收录就可以解释为百度爬取了你的网页,并认为你的网页内容符合收录规则或者说有价值,百度的会将你的网页加入他的索引库,并且让你的网页将会出现在与你网页内容相关的查询的搜索结果中。但是如果得你的网页内容存在问题,比方含有敏感词、或者是重复内容、或者是纯软件生成的页面等等,被百度认为是没有价值的内容,就有可能无法被收录。