黄色国产视频,男女啪啪18禁无遮挡激烈,久草热8精品视频在线观看,四虎国产精品永久在线下载

            爬行、抓取、索引、收錄是什么意思

            時間:2022-07-13 03:49:07 計算機/互聯網/通信 我要投稿
            • 相關推薦

            爬行、抓取、索引、收錄是什么意思

              看SEO有關博客和論壇時能感覺到,很多SEO并沒有理解爬行、抓取、索引、收錄這些概念到底指的是什么,區別在哪,noindex、nofollow、robots文件的功能又是什么。下面我們就一起來了解一下吧!

              【爬行、抓取、索引、收錄是什么意思】

              爬行是什么?

              爬行指的是搜索引擎蜘蛛從已知頁面上解析出鏈接指向的URL,然后沿著鏈接發現新頁面(也就是鏈接指向的URL)的過程。當然,蜘蛛并不是發現新URL馬上就爬過去抓取新頁面,而是把發現的URL存放到待抓地址庫中,蜘蛛按照一定順序從地址庫中提取要抓取的URL。

              抓取是什么?

              抓取是搜索引擎蜘蛛從待抓地址庫中提取要抓的URL,訪問這個URL,把讀取的HTML代碼存入數據庫。蜘蛛的抓取就是像瀏覽器一樣打開這個頁面,和用戶瀏覽器訪問一樣,也會在服務器原始日志中留下記錄。

              索引是什么?

              索引指的是將一個URL的信息進行整理,存入數據庫,也就是索引庫,用戶搜索時,搜索引擎從索引庫中提取URL信息并排序展現出來。索引的英文是index。索引庫是用于搜索的,所以被索引的URL是可以被用戶搜索到的,沒有被索引的URL用戶在搜索結果中是看不到的。

              要注意的是,所謂“一個URL的信息“,并不限于蜘蛛從URL上抓取來的內容,還有來自其它來源的信息,如外部鏈接、鏈接的錨文字等。有的時候,索引庫中關于這個URL的的信息,根本沒有從這個URL抓取來的內容,但搜索引擎知道這個URL的存在,并且有一些其它信息。

              抓取和索引不是一回事。

              收錄是什么?

              我個人覺得收錄和索引沒有區別。只不過收錄是從搜索用戶角度看的,搜索時能找到這個URL,就是這個URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個URL的信息在索引庫中存在。英文并沒有收錄這個詞,和索引用的是同一個詞index。

              noindex的.作用是什么?

              頁面頭信息中放上meta noindex標簽是告訴搜索引擎不要索引這個URL,也就是用戶搜索時找不到這個URL的信息,這個URL不會返回在搜索結果列表中。

              noindex不是告訴搜索引擎不要抓取這個URL,實際上,noindex要起作用,這個URL是必須先被抓取的,不然搜索引擎怎么看到頁面HTML代碼中有noindex標簽呢?

              robots文件的作用是什么?

              robots文件是告訴搜索引擎,某些URL不要抓取。注意,這里說的是不要抓取,沒說不要索引。和noindex是正相反的。

              nofollow的作用是什么?

              給鏈接加上nofollow屬性是告訴搜索引擎,不要沿著這個鏈接爬行,就當這個鏈接不存在。注意,nofollow只是告訴蜘蛛不要爬這個鏈接,沒有說不要抓取鏈接指向的URL,也沒有說不要索引鏈接指向的URL,nofollow既沒禁止抓取,也沒禁止索引。

              概念說過后,指出幾個SEO們經常弄不明白的情況:

              沒有被抓取的頁面是可以被索引的

              也就是說,蜘蛛沒有訪問和抓取這個頁面(比如被robots文件禁止抓取),這個頁面卻有信息存在索引庫中,用戶搜索時還能看到。

              比如,淘寶整個網站用robots文件禁止百度蜘蛛抓取,但沒有用noindex禁止索引(如上面說的,禁止抓取后,就沒辦法禁止索引了,不抓取,就看不到noindex標簽了),所以即使百度沒有訪問和抓取淘寶頁面,但淘寶很多頁面是被百度索引的用戶可以搜到的。

              百度從網上那么多鏈接知道淘寶首頁的存在,通過鏈接的錨文字也知道這個頁面標題大概是淘寶之類的,當然更知道百度口碑里的評價數。所以即使百度蜘蛛沒有抓取淘寶首頁,用戶還是能搜到,并且顯示一些百度知道的信息。

              要想百度不能返回淘寶首頁該怎么辦呢?取消robots文件的禁止抓取,頁面上用noindex禁止索引。

              被抓取的頁面是可以不被索引的

              最常見的就是上面說過的,頁面頭信息使用noindex禁止索引,頁面被抓取,讀到noindex后,不被索引,不會在搜索結果中返回。

              還有可能是因為頁面內容是抄襲、轉載、低質量的,搜索引擎雖然抓取了頁面,索引過程中檢測出這些內容問題,被丟棄,沒有被索引。所以頁面沒有被收錄,通常要先檢查原始日志,看看是否被抓取過,如果被抓取過,可能是內容質量問題,如果根本沒被抓取,建議先看看網站結構是否有問題。

              加了nofollow的鏈接目標頁面可以被抓取和索引

              前面說了,nofollow既不禁止抓取,也不禁止索引。nofollow的作用是告訴蜘蛛不要跟著這個鏈接爬,就當這個鏈接不存在,但nofollow只對這個鏈接起作用,對別的鏈接沒作用,這個鏈接加了nofollow,不意味著別的地方就沒有正常的指向這個URL的鏈接,只要別的地方出現了沒加nofollow的鏈接,目標URL還是會被發現、抓取(假設沒被robotx文件禁止)、索引(假設沒加noindex )。

              上面這些概念和應用在SEO中是很重要的,如果還沒看懂,我也不知道該怎么再解釋了,只能建議再多讀幾遍。


            【爬行、抓取、索引、收錄是什么意思】相關文章:

            如何讓爬蟲快速抓取被收錄網頁07-11

            是不是靜態化便于搜索引擎抓取?07-11

            應屆的意思是什么?07-10

            躊躇的意思是什么08-19

            倜儻的意思是什么03-09

            膜拜的意思是什么04-11

            歐巴桑的意思是什么05-26

            猶豫的意思是什么08-04

            余悸的意思是什么08-05

            札記的意思是什么08-04

            主站蜘蛛池模板: 亚洲小说区图片区| 亚洲日本香蕉视频观看视频| 毛片a级在线观看| 国产天天在线| 婷婷综合久久中文字幕| 丰满人妻熟妇乱又伦精品视频三| caopor在线视频| 深夜福利一区| 久久久久久久久久久久91 | 国产第一福利| 亚洲欧美成人一区二区| 2018天天干夜夜| 精品麻豆一区二区三区乱码| 激情偷乱人成视频在线观看| 欧美精品在线观看免费| 日本性视频在线| 新普新京亚洲欧美日韩国产 | 国产喷水视频| 亚洲第一不卡| 久久福利在线| 国产系列丝袜熟女精品网站| 99久久婷婷国产综合精品| 国产女毛片| 午夜精品福利在线视频| 日韩欧美在线第一页| 高清无码午夜福利在线观看| 55夜色66夜色国产精品视频| 久久国产精品视频| 自拍偷拍 校园春色| 亚洲成AV人片不卡无码手机版| 亚洲国产av久久久| 巨大巨粗巨长 黑人长吊| 欧美日韩视频观看| 激情国产一区二区| A毛片终身免费观看网站| 国产偷国产偷亚洲清高app | 亚洲国产成人久久一区二区三区| 日本精品一二三| 欧洲色网站| 一区二区和激情视频| 日韩 精品 综合 丝袜 制服|