精品人妻互换一区二区三区免费,午夜精品久久久久久久9,欧美巨鞭大战丰满少妇,97精品人妻一区二区三区蜜桃

爬行、抓取、索引、收錄,指的都是什么

  留言說(shuō)明,這位讀者并沒(méi)有太明白什么是抓取,什么是索引,index和noindex標(biāo)簽的意義又是什么。noindex標(biāo)簽不是不允許抓取該頁(yè)面,是不允許索引該頁(yè)面,這兩者是不同的意思,有不同的功能。

  看SEO有關(guān)博客和論壇時(shí)能感覺(jué)到,很多SEO并沒(méi)有理解爬行、抓取、索引、收錄這些概念到底指的是什么,區(qū)別在哪,noindex、nofollow、robots文件的功能又是什么。對(duì)這些概念沒(méi)有精準(zhǔn)理解,處理大型網(wǎng)站結(jié)構(gòu),決定什么頁(yè)面需要被抓取,什么需要被索引,哪些頁(yè)面需要禁止抓取、索引等等情況時(shí),就很難明白該怎么做。甚至就像抓取配額那篇帖子的很多留言說(shuō)的,提到這些情況的處理時(shí),根本看不懂在說(shuō)什么。

  爬行是什么?

  爬行指的是搜索引擎蜘蛛從已知頁(yè)面上解析出鏈接指向的URL,然后沿著鏈接發(fā)現(xiàn)新頁(yè)面(也就是鏈接指向的URL)的過(guò)程。當(dāng)然,蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬過(guò)去抓取新頁(yè)面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫(kù)中,蜘蛛按照一定順序從地址庫(kù)中提取要抓取的URL。

  抓取是什么?

  抓取是搜索引擎蜘蛛從待抓地址庫(kù)中提取要抓的URL,訪問(wèn)這個(gè)URL,把讀取的HTML代碼存入數(shù)據(jù)庫(kù)。蜘蛛的抓取就是像瀏覽器一樣打開這個(gè)頁(yè)面,和用戶瀏覽器訪問(wèn)一樣,也會(huì)在服務(wù)器原始日志中留下記錄。

  索引是什么?

  索引指的是將一個(gè)URL的信息進(jìn)行整理,存入數(shù)據(jù)庫(kù),也就是索引庫(kù),用戶搜索時(shí),搜索引擎從索引庫(kù)中提取URL信息并排序展現(xiàn)出來(lái)。索引的英文是index。索引庫(kù)是用于搜索的,所以被索引的URL是可以被用戶搜索到的,沒(méi)有被索引的URL用戶在搜索結(jié)果中是看不到的。

  要注意的是,所謂“一個(gè)URL的信息“,并不限于蜘蛛從URL上抓取來(lái)的內(nèi)容,還有來(lái)自其它來(lái)源的信息,如外部鏈接、鏈接的錨文字等。有的時(shí)候,索引庫(kù)中關(guān)于這個(gè)URL的的信息,根本沒(méi)有從這個(gè)URL抓取來(lái)的內(nèi)容,但搜索引擎知道這個(gè)URL的存在,并且有一些其它信息。

  抓取和索引不是一回事。

  收錄是什么?

  我個(gè)人覺(jué)得收錄和索引沒(méi)有區(qū)別。只不過(guò)收錄是從搜索用戶角度看的,搜索時(shí)能找到這個(gè)URL,就是這個(gè)URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個(gè)URL的信息在索引庫(kù)中存在。英文并沒(méi)有收錄這個(gè)詞,和索引用的是同一個(gè)詞index。

  noindex的作用是什么?

  頁(yè)面頭信息中放上meta noindex標(biāo)簽是告訴搜索引擎不要索引這個(gè)URL,也就是用戶搜索時(shí)找不到這個(gè)URL的信息,這個(gè)URL不會(huì)返回在搜索結(jié)果列表中。

  noindex不是告訴搜索引擎不要抓取這個(gè)URL,實(shí)際上,noindex要起作用,這個(gè)URL是必須先被抓取的,不然搜索引擎怎么看到頁(yè)面HTML代碼中有noindex標(biāo)簽?zāi)兀?/p>

  robots文件的作用是什么?

  robots.txt文件是告訴搜索引擎,某些URL不要抓取。注意,這里說(shuō)的是不要抓取,沒(méi)說(shuō)不要索引。和noindex是正相反的。

  nofollow的作用是什么?

  給鏈接加上nofollow標(biāo)簽是告訴搜索引擎,不要沿著這個(gè)鏈接爬行,就當(dāng)這個(gè)鏈接不存在。注意,nofollow只是告訴蜘蛛不要爬這個(gè)鏈接,沒(méi)有說(shuō)不要抓取鏈接指向的URL,也沒(méi)有說(shuō)不要索引鏈接指向的URL,nofollow既沒(méi)禁止抓取,也沒(méi)禁止索引。

  概念說(shuō)過(guò)后,指出幾個(gè)SEO們經(jīng)常弄不明白的情況:

  沒(méi)有被抓取的頁(yè)面是可以被索引的

  也就是說(shuō),蜘蛛沒(méi)有訪問(wèn)和抓取這個(gè)頁(yè)面(比如被robots文件禁止抓取),這個(gè)頁(yè)面卻有信息存在索引庫(kù)中,用戶搜索時(shí)還能看到。

  比如,淘寶整個(gè)網(wǎng)站用robots文件禁止百度蜘蛛抓取,但沒(méi)有用noindex禁止索引(如上面說(shuō)的,禁止抓取后,就沒(méi)辦法禁止索引了,不抓取,就看不到noindex標(biāo)簽了),所以即使百度沒(méi)有訪問(wèn)和抓取淘寶頁(yè)面,但淘寶很多頁(yè)面是被百度索引的,用戶可以搜到的:

  百度從網(wǎng)上那么多鏈接知道淘寶首頁(yè)的存在,通過(guò)鏈接的錨文字也知道這個(gè)頁(yè)面標(biāo)題大概是淘寶之類的,當(dāng)然更知道百度口碑里的評(píng)價(jià)數(shù)。所以即使百度蜘蛛沒(méi)有抓取淘寶首頁(yè),用戶還是能搜到,并且顯示一些百度知道的信息。

  要想百度不能返回淘寶首頁(yè)該怎么辦呢?取消robots文件的禁止抓取,頁(yè)面上用noindex禁止索引。

  被抓取的頁(yè)面是可以不被索引的

  最常見(jiàn)的就是上面說(shuō)過(guò)的,頁(yè)面頭信息使用noindex禁止索引,頁(yè)面被抓取,讀到noindex后,不被索引,不會(huì)在搜索結(jié)果中返回。老頁(yè)面新加noindex也不是馬上刪除索引,還會(huì)保留索引一段時(shí)間,但不會(huì)返回在搜索結(jié)果中。

  加了noindex的頁(yè)面上的鏈接是可以被跟蹤一段時(shí)間的,但時(shí)間長(zhǎng)了,有noindex的頁(yè)面搜索引擎可能就不再抓取和索引了,上面的鏈接也就無(wú)效了。

  還有可能是因?yàn)轫?yè)面內(nèi)容是抄襲、轉(zhuǎn)載、低質(zhì)量的,搜索引擎雖然抓取了頁(yè)面,索引過(guò)程中檢測(cè)出這些內(nèi)容問(wèn)題,被丟棄,沒(méi)有被索引。所以頁(yè)面沒(méi)有被收錄,通常要先檢查原始日志,看看是否被抓取過(guò),如果被抓取過(guò),可能是內(nèi)容質(zhì)量問(wèn)題,如果根本沒(méi)被抓取,建議先看看網(wǎng)站結(jié)構(gòu)是否有問(wèn)題。

  加了nofollow的鏈接目標(biāo)頁(yè)面可以被抓取和索引

  前面說(shuō)了,nofollow既不禁止抓取,也不禁止索引。nofollow的作用是告訴蜘蛛不要跟著這個(gè)鏈接爬,就當(dāng)這個(gè)鏈接不存在,但nofollow只對(duì)這個(gè)鏈接起作用,對(duì)別的鏈接沒(méi)作用,這個(gè)鏈接加了nofollow,不意味著別的地方就沒(méi)有正常的指向這個(gè)URL的鏈接,只要?jiǎng)e的地方出現(xiàn)了沒(méi)加nofollow的鏈接,目標(biāo)URL還是會(huì)被發(fā)現(xiàn)、抓?。僭O(shè)沒(méi)被robotx文件禁止)、索引(假設(shè)沒(méi)加noindex )。

  本文轉(zhuǎn)自:ZAC每天一貼

国产乱妇高清无乱码免费| 无码精品一区二区三区潘金莲| 国产精品久久国产精品99| 久久久亚洲精品视频| 欧美性猛交xxxx黑人交| 久久熟女精品| 77777免费观看电视剧推荐| 国内精品91高清麻豆| 国产精品沙发午睡系列990531| 日韩欧美丰满熟妇人妻潮喷| 国产成人av一区二区三区不卡| 被黑人操了| 国产伦子伦在线精品一区二区三区 | 成人高潮aa毛片免费视频| 亚洲图片另类小说| 久久婷婷精品国产538| 午夜福利视频在线| 久久精品国产亚洲av麻豆白洁| 久久久久亚洲av成人网人人网站| av中文字幕在线观看| 亚洲激精日韩激情欧美激精品 | 又色又爽又黄又粗暴的小说| 一区二区三区欧美在线观看| 国精产品一品二品三品| 国产精品久久久久久人| 少妇人妻一区二区| 亚洲福利精品视频| 啊灬啊灬啊灬快灬高潮软件| 熟妇真实偷拍对白高潮| 91精品在线免费观看视频| 日日夜夜操av| 亚洲av午夜福利一区二区国产| 色婷婷av一区二区三区大白胸| 成人久久91| 精品久久久久中文人妻被强| 国产一区在线视频观看| 人妻夜夜女同中文字幕| 中文字幕成人A片毛片久久| 久久精品99久久| 国产伦精品一区二区三区免| 亚洲av第二区|