一个人看的www视频在线免费观看,欧美日韩电影一区,中文在线8资源库,久久久噜噜噜久噜久久综合

INDUSTRY INFORMATION

新聞資訊

當(dāng)前位置:首頁(yè) > 新聞動(dòng)態(tài)

騏秀科技:索引頁(yè)鏈接補(bǔ)全機(jī)制的一種方法

發(fā)布時(shí)間:2012-8-20 瀏覽:4875

  索引頁(yè)作為網(wǎng)站重要組成部分,它的存在避免了網(wǎng)頁(yè)變的過(guò)長(zhǎng)而導(dǎo)致搜索和閱讀產(chǎn)生困難,但是不合理的索引會(huì)給搜索引擎的Spider造成困惑,那么該如何設(shè)置一個(gè)合理的索引頁(yè)呢。下面由騏秀科技(廣州網(wǎng)站建設(shè))來(lái)做個(gè)分析:

  一、背景

  Spider位于搜索引擎數(shù)據(jù)流的最上游,負(fù)責(zé)將互聯(lián)網(wǎng)上的資源采集到本地,提供給后續(xù)檢索使用,是搜索引擎的最主要數(shù)據(jù)來(lái)源之一。spider系統(tǒng)的目標(biāo)就是發(fā)現(xiàn)并抓取互聯(lián)網(wǎng)中一切有價(jià)值的網(wǎng)頁(yè),為達(dá)到這個(gè)目標(biāo),首先就是發(fā)現(xiàn)有價(jià)值網(wǎng)頁(yè)的鏈接,當(dāng)前spider有多種鏈接發(fā)現(xiàn)機(jī)制來(lái)盡量快而全的發(fā)現(xiàn)資源鏈接,本文主要描述其中一種針對(duì)特定索引頁(yè)的鏈接補(bǔ)全機(jī)制,并給出對(duì)這種特定類型的索引頁(yè)面的建議處理規(guī)范用于優(yōu)化收錄效果。

  當(dāng)前大多數(shù)互聯(lián)網(wǎng)網(wǎng)站以索引頁(yè)和翻頁(yè)的形式來(lái)組織網(wǎng)站資源,當(dāng)有新資源增加時(shí),老資源往后推移到翻頁(yè)系列中。

  如下圖所示:

  圖表1

  http://roll.news.sina.com.cn/news/gnxw/gdxw1/index.shtml

  圖2為18小時(shí)后該網(wǎng)頁(yè)翻頁(yè)系列的第四頁(yè)的內(nèi)容,在這段時(shí)間內(nèi)新增了三頁(yè)多的資源,圖1中紅色矩陣圈到的資源在18個(gè)小時(shí)后已經(jīng)往后有序推移到第4頁(yè)的紅色方塊處。

  圖表2 18小時(shí)后第四頁(yè)

  http://roll.news.sina.com.cn/news/gnxw/gdxw1/index.shtml

  對(duì)spider來(lái)說(shuō),這種特定類型的索引頁(yè)是資源鏈接發(fā)現(xiàn)的一種有效渠道,但是由于spider是定期檢查這些網(wǎng)頁(yè)來(lái)獲得新增的資源鏈接,檢查的周期同資源鏈接發(fā)布的周期不可避免會(huì)有不同(spider會(huì)盡量探測(cè)網(wǎng)頁(yè)的發(fā)布周期,以合理的頻率來(lái)檢查網(wǎng)頁(yè)),周期不同的時(shí)候,資源鏈接很有可能就被推到翻頁(yè)序列中,所以spider需要對(duì)這種特殊類型的翻頁(yè)系列作翻頁(yè)補(bǔ)全,從而保證收錄資源的完全。

  二、主要思路

  本文主要討論這種資源按發(fā)布時(shí)間有序排布的網(wǎng)頁(yè),即新發(fā)布的資源排布在翻頁(yè)第1頁(yè)(或翻頁(yè)最后一頁(yè)),老的資源往后(或者往前)有序推移的索引頁(yè)的補(bǔ)全機(jī)制。主要思路是將整個(gè)翻頁(yè)系列的網(wǎng)頁(yè)看成一個(gè)整體,綜合判定它們的抓取狀態(tài),通過(guò)記錄每次抓取網(wǎng)頁(yè)發(fā)現(xiàn)的資源鏈接,然后將此次發(fā)現(xiàn)的資源鏈接與歷史上發(fā)現(xiàn)的資源鏈接作比較,如果有交集,說(shuō)明該次抓取發(fā)現(xiàn)了所有的新增資源;否則,說(shuō)明該次抓取并未發(fā)現(xiàn)所有的新增資源,需要繼續(xù)抓取下一頁(yè)甚至下幾頁(yè)來(lái)發(fā)現(xiàn)所有的新增資源。

  2.1 資源鏈接是否按照時(shí)間排序

  判斷資源是否按發(fā)布時(shí)間排布是這類頁(yè)面的一個(gè)必要條件,那么如何判斷資源是否按發(fā)布時(shí)間排布呢?如上面圖1所示,有些頁(yè)面中每個(gè)資源鏈接后面跟隨著對(duì)應(yīng)的發(fā)布時(shí)間,通過(guò)資源鏈接對(duì)應(yīng)的時(shí)間集合,判斷時(shí)間集合是否按大到小或小到大排序,如果是的話,則說(shuō)明網(wǎng)頁(yè)中的資源是按發(fā)布時(shí)間有序排布,反之亦然。圖1中資源從上到下對(duì)應(yīng)的時(shí)間是越來(lái)越小的,即是資源按發(fā)布時(shí)間有序的。

  還有一類網(wǎng)頁(yè),如下面圖3所示,網(wǎng)頁(yè)內(nèi)容中有多種排序方式,如按銷量排序,按價(jià)格排序,如評(píng)論數(shù)排序,按上架時(shí)間排序。通過(guò)識(shí)別和提取當(dāng)前的排序方式,然后判斷當(dāng)前的排序方式是否為按時(shí)間排序,如果是,則說(shuō)明網(wǎng)頁(yè)中的資源是按發(fā)布時(shí)間有序排布,反之亦然。圖3中的排序方式是按上架時(shí)間排序,屬于時(shí)間排序方式,所以該網(wǎng)頁(yè)發(fā)布的資源是按發(fā)布時(shí)間有序的。

  另外也會(huì)根據(jù)資源鏈接抓回后提取的發(fā)布時(shí)間綜合判斷。

  圖表3 多種排序方式的索引頁(yè)

  2.2 補(bǔ)全機(jī)制

  對(duì)于按發(fā)布時(shí)間有序排布在索引頁(yè)系列的資源鏈接,如何保證新發(fā)布的資源都被收錄呢?如上述所說(shuō),在18個(gè)小時(shí)后,圖1中的資源鏈接已經(jīng)往后有序推移到翻頁(yè)第4頁(yè)了,如此看,這段時(shí)間內(nèi)新增了翻頁(yè)第2,3,4頁(yè)索引的資源鏈接,那么,spider就需要完全的收錄這些新增的資源;

  首先,當(dāng)spider抓取18小時(shí)后的第1頁(yè)時(shí),將新發(fā)現(xiàn)的資源鏈接集合,與上一次18小時(shí)前第1頁(yè)索引頁(yè)調(diào)度記錄的資源鏈接集合作比較,會(huì)發(fā)現(xiàn)兩次調(diào)度發(fā)現(xiàn)的資源鏈接沒(méi)有交集,所以就可能存在漏鏈。進(jìn)而需要繼續(xù)發(fā)起第2頁(yè)的調(diào)度,第2頁(yè)發(fā)現(xiàn)的資源鏈接集合與之仍然沒(méi)有交集,所以還可能存在漏鏈,繼續(xù)發(fā)起第3頁(yè),第4頁(yè)的調(diào)度,最終如圖2所示,紅框中的鏈接與上一次索引頁(yè)調(diào)度記錄的資源鏈接有交集,因此可以斷定已經(jīng)補(bǔ)全了這段時(shí)間內(nèi)新增的資源,從而結(jié)束翻頁(yè)系列的調(diào)度,并保證了該翻頁(yè)系列的所有鏈接的補(bǔ)全,從而提升搜索產(chǎn)品的收錄效果。

  2.3 翻頁(yè)條的識(shí)別和翻頁(yè)條對(duì)應(yīng)的鏈接序列區(qū)塊的識(shí)別

  為了達(dá)到上面的效果,除了需要識(shí)別翻頁(yè)系列的排序方式是不是按照時(shí)間排序,還需要識(shí)別索引頁(yè)中的翻頁(yè)條和其對(duì)應(yīng)的鏈接區(qū)塊。

  因?yàn)闆](méi)有翻頁(yè)條的識(shí)別,spider系統(tǒng)就不可能把這個(gè)翻頁(yè)序列的所有鏈接綁定起來(lái),整體考慮它們的狀態(tài),那么調(diào)度抓取的結(jié)果就是隨機(jī)的,從而不能保證補(bǔ)全效果,當(dāng)前通過(guò)網(wǎng)頁(yè)中的翻頁(yè)的一系列特征,通過(guò)機(jī)器學(xué)習(xí)的方法來(lái)識(shí)別網(wǎng)頁(yè)中的翻頁(yè)區(qū)塊和翻頁(yè)深度,以及上一頁(yè),下一頁(yè)的鏈接,從而為上述補(bǔ)全機(jī)制提供基本數(shù)據(jù)。

  另外一方面,即使有了翻頁(yè)條的識(shí)別,沒(méi)有對(duì)應(yīng)鏈接區(qū)塊的識(shí)別,上述補(bǔ)全機(jī)制還是不能工作,因?yàn)樯鲜鰴C(jī)制需要對(duì)比發(fā)現(xiàn)的鏈接的集合來(lái)判定終止條件,所以,也需要識(shí)別翻頁(yè)條對(duì)應(yīng)的鏈接區(qū)塊,從而提供翻頁(yè)終止條件。

  特殊情況下,一個(gè)網(wǎng)頁(yè)可能包含多個(gè)翻頁(yè)條,這種情況更需要進(jìn)行翻頁(yè)條和鏈接區(qū)塊的對(duì)應(yīng)。

  三、建議的方法和標(biāo)準(zhǔn)

  當(dāng)前百度spider系統(tǒng)對(duì)網(wǎng)頁(yè)的類型,網(wǎng)頁(yè)中翻頁(yè)條的位置,翻頁(yè)條對(duì)應(yīng)的索引列表,以及列表是否按照時(shí)間排序都會(huì)做相應(yīng)的判斷,并根據(jù)實(shí)際的情況進(jìn)行處理,但是機(jī)器自動(dòng)的判斷方法畢竟不能做到100%的識(shí)別準(zhǔn)確率,所以如果站長(zhǎng)能夠通過(guò)在頁(yè)面中添加一些百度推薦的標(biāo)簽來(lái)標(biāo)志相應(yīng)的功能區(qū)域,就可以極大地提高我們識(shí)別的準(zhǔn)確率,從而提高spider系統(tǒng)對(duì)網(wǎng)站資源發(fā)現(xiàn)的即時(shí)性,從而提高網(wǎng)站的收錄效果。

  Spider鏈接補(bǔ)全當(dāng)前最關(guān)心的是網(wǎng)頁(yè)的翻頁(yè)條和翻頁(yè)條對(duì)應(yīng)的索引鏈接列表的區(qū)塊,所以可以通過(guò)區(qū)塊的元素(譬如div,ul)的class屬性來(lái)標(biāo)志相應(yīng)的特征,供百度spider識(shí)別使用,建議使用下面的屬性來(lái)標(biāo)志:

  表1 支持的CLASS擴(kuò)展屬性

  譬如百度新聞的頁(yè)面可以這樣設(shè)置:

  對(duì)翻頁(yè)條對(duì)應(yīng)的區(qū)塊元素p可以設(shè)置class屬性Baidu_paging_indicator,對(duì)該翻頁(yè)條對(duì)應(yīng)的主體鏈接的區(qū)塊元素div,設(shè)置 Baidu_paging_content_indicator Orderby_posttime,這樣翻頁(yè)條和對(duì)應(yīng)的鏈接區(qū)塊就對(duì)應(yīng)起來(lái),并且告知了百度是按照發(fā)布時(shí)間排序的,從而可以優(yōu)化spider系統(tǒng)的抓取行為,改善站點(diǎn)的收錄效果。

  四、總結(jié)

  除了上面說(shuō)明的鏈接發(fā)現(xiàn)方法,Baidu的抓取系統(tǒng)還有非常多的其他手段來(lái)保證對(duì)有價(jià)值網(wǎng)站的收錄覆蓋率,上述方法只是針對(duì)特定索引頁(yè)類型而采取的一種特定的手段,互聯(lián)網(wǎng)站長(zhǎng)可以參考使用。站長(zhǎng)也可以通過(guò)spider的站長(zhǎng)平臺(tái)來(lái)了解 如何獲得更快更好的網(wǎng)站收錄效果,譬如直接通過(guò)sitemap協(xié)議推送鏈接。騏秀科技(廣州網(wǎng)站優(yōu)化)建議 各位讀者:網(wǎng)站資料要定期更新,不要一會(huì)多一會(huì)少,合理的發(fā)表新聞數(shù)量,讓搜索引擎來(lái)的勤快些,那收錄就不是問(wèn)題了

  1. 保障接單

    做網(wǎng)絡(luò)就是為了多條賺錢(qián)渠道
  2. 顧問(wèn)式服務(wù)

    針對(duì)不同行業(yè)提供解決方案
  3. 專業(yè)團(tuán)隊(duì)

    專業(yè)技術(shù)員和銷售員
  4. 一站式服務(wù)

    從建站到推廣讓你無(wú)煩惱
一个人看的www视频在线免费观看,欧美日韩电影一区,中文在线8资源库,久久久噜噜噜久噜久久综合
欧美一区二区三区免费观看视频| 丝袜美腿成人在线| 精品国产自在久精品国产| 亚洲男女毛片无遮挡| 92精品国产成人观看免费| 午夜成人在线视频| 99久久久免费精品国产一区二区| 国产白丝网站精品污在线入口| 国产视频在线观看一区二区三区| 色欧美片视频在线观看在线视频| 欧美天堂亚洲电影院在线播放| 欧美顶级少妇做爰| 亚洲精品成人悠悠色影视| 日韩精品欧美精品| 国产精品每日更新在线播放网址| 精品成人在线观看| 亚洲人成精品久久久久久| 精品国产一区二区三区忘忧草| 久久精品一区八戒影视| 国产日韩欧美精品电影三级在线| 91麻豆蜜桃一区二区三区| 国产成人综合在线观看| 91精品中文字幕一区二区三区| 国产亚洲精品aa午夜观看| 欧美性猛片aaaaaaa做受| 欧美亚洲愉拍一区二区| 91啪亚洲精品| 日韩欧美一区电影| 亚洲妇熟xx妇色黄| 欧美精品 日韩| 日韩精品一区二区三区swag| 99精品视频一区二区三区| 国产日韩精品一区| 日本欧美一区二区三区| 国产精品久久久久久久久果冻传媒| 亚洲一区欧美一区| 国产v综合v亚洲欧| 欧美日韩国产在线观看| 日韩欧美aaaaaa| 欧美日韩在线三级| 色美美综合视频| 亚洲一区二区三区四区在线观看| 日韩二区三区在线观看| 午夜精品久久久久久| 免费观看一级欧美片| 久久久亚洲精品石原莉奈| 捆绑紧缚一区二区三区视频| 国产一区美女在线| 国产欧美日韩在线观看| 日韩精品一区二区三区视频在线观看| 欧美日韩国产一区| 免费在线观看一区| 97精品超碰一区二区三区| 国产精品超碰97尤物18| 日本一区二区三区dvd视频在线| 亚洲三级在线观看| www.亚洲国产| 成人精品国产一区二区4080| 精品福利av导航| 欧美v国产在线一区二区三区| 免费观看成人av| 成人成人成人在线视频| 一区二区三区精品视频| 成人午夜看片网址| 国产精品妹子av| 91丨国产丨九色丨pron| 国产亚洲欧美中文| 国产91精品欧美| 不卡影院免费观看| 欧美视频在线不卡| 99国产精品久久久| 欧美精品tushy高清| 亚洲国产日韩a在线播放| 91在线精品一区二区| 欧美日韩dvd在线观看| 91蜜桃在线免费视频| 高清国产一区二区| 国产乱理伦片在线观看夜一区| 欧美日韩在线播放一区| 欧美艳星brazzers| 日本欧美在线观看| 午夜精品免费在线观看| 久久亚洲精品小早川怜子| 久久机这里只有精品| 26uuu久久综合| 99精品视频在线观看免费| 日本精品一区二区三区四区的功能| 欧美va亚洲va| 日韩欧美高清在线| 蜜桃免费网站一区二区三区| 91国偷自产一区二区三区成为亚洲经典| 久久久久久久性| 久久亚洲一区二区三区明星换脸| 国产精品一级片在线观看| 久久99精品久久只有精品| 亚洲国产视频直播| 亚洲色图制服诱惑| 天天影视网天天综合色在线播放| 97国产精品videossex| 蜜臀av一区二区在线观看| 久久久精品天堂| 欧美精品 国产精品| 日韩欧美中文一区| 日韩一级完整毛片| 精品国产百合女同互慰| 色哟哟在线观看一区二区三区| 在线视频亚洲一区| 蜜桃av噜噜一区| 国产成人亚洲精品青草天美| 欧美三级中文字幕| 国产精品 日产精品 欧美精品| 日韩一区二区三区电影在线观看| 国产黄色91视频| 午夜精品一区二区三区三上悠亚| 日韩有码一区二区三区| 制服丝袜av成人在线看| 国产精品三级电影| 欧美在线短视频| 91高清视频免费看| 69精品人人人人| 26uuu国产在线精品一区二区| 亚洲成a天堂v人片| 成人午夜电影久久影院| 精品一区二区三区av| 国产91精品精华液一区二区三区| av中文字幕亚洲| 免费成人av资源网| 一本色道综合亚洲| 在线播放91灌醉迷j高跟美女| 精品一二三四区| 大尺度一区二区| 国产欧美日韩卡一| 国产成人亚洲精品狼色在线| 91视频com| 国产欧美一区二区三区沐欲| 欧美日本在线一区| 日韩欧美精品在线| 在线观看日韩高清av| 老司机免费视频一区二区| 国产视频一区在线观看| 亚洲另类一区二区| 国产午夜亚洲精品不卡| 欧美色图在线观看| 亚洲天堂成人在线观看| 91精品国产综合久久蜜臀| 中文字幕字幕中文在线中不卡视频| 欧美日韩国产欧美日美国产精品| 蜜臀av一区二区在线免费观看| 精品国产一区久久| 国产精品福利av| 国产精品一区二区在线看| 欧美日韩国产综合一区二区三区| 国产自产2019最新不卡| 国产清纯白嫩初高生在线观看91| 亚洲精品国产精品乱码不99| 亚洲一区二区三区四区的| 国产成人99久久亚洲综合精品| 亚洲午夜久久久久久久久久久| 色婷婷久久久综合中文字幕| 国内外成人在线视频| 久久精品国产亚洲高清剧情介绍| 亚洲线精品一区二区三区| www.色综合.com| 日韩精品一区二区三区蜜臀| 日本vs亚洲vs韩国一区三区| 日韩女同互慰一区二区| 日韩va亚洲va欧美va久久| 久久久久国色av免费看影院| 日韩欧美国产三级| 久久精品国产一区二区| 欧美私人免费视频| 亚洲国产精品一区二区久久恐怖片| 一色屋精品亚洲香蕉网站| 亚洲一区二区三区小说| 久久久.com| 一区二区三区高清不卡| 欧美少妇xxx| 在线亚洲精品福利网址导航| 欧美麻豆精品久久久久久| 玉米视频成人免费看| 色94色欧美sute亚洲线路一久| 自拍偷拍国产精品| 中文字幕字幕中文在线中不卡视频| 91国产成人在线| 日本视频在线一区| 成人中文字幕电影| 国产成人免费在线观看不卡| 国产成人精品三级| 韩国在线一区二区| 欧美a一区二区| 日韩高清一区在线| 国产精品免费网站在线观看| 成人激情小说网站| 精品三级av在线| 久久精品免费看| 爽好多水快深点欧美视频| 91精品国产手机| 日韩欧美在线不卡| 亚洲国产三级在线| 亚洲国产美国国产综合一区二区|