運(yùn)營推廣 2019-03-13 百度 baiduspider 百度蜘蛛

來認(rèn)識一下百度蜘蛛baiduspider

做網(wǎng)站優(yōu)化的朋友一定要了解搜索引擎蜘蛛程序運(yùn)作原理，尤其是百度蜘蛛，但是現(xiàn)在互聯(lián)網(wǎng)上做百度優(yōu)化的有幾個(gè)是真正懂這些的？很多朋友都僅僅只是會(huì)發(fā)發(fā)外鏈，布置一下關(guān)鍵詞，然后就開始大張旗鼓的在互聯(lián)網(wǎng)上接單，接了網(wǎng)站做不上去也不給客戶退定金，所以把整個(gè)SEO行業(yè)都搞的很臭，以至于很多客戶都不敢相信做優(yōu)化，今天我給大家詳細(xì)解剖以下百度蜘蛛，讓大家好好認(rèn)識一下它。

u=2035517852,3959676740&fm=26&gp=0.jpg

一、什么是Baiduspider? Baiduspider是百度搜索引擎的一個(gè)自動(dòng)程序，它的作用是訪問互聯(lián)網(wǎng)上的網(wǎng)頁，建立索引數(shù)據(jù)庫，使用戶能在百度搜索引擎中搜索到您網(wǎng)站上的網(wǎng)頁。

二、Baiduspider的user-agent是什么?

百度各個(gè)產(chǎn)品使用不同的user-agent：

產(chǎn)品名稱對應(yīng)user-agent

無線搜索 Baiduspider

圖片搜索 Baiduspider-image

視頻搜索 Baiduspider-video

新聞搜索 Baiduspider-news

百度搜藏 Baiduspider-favo

百度聯(lián)盟 Baiduspider-cpro

商務(wù)搜索 Baiduspider-ads

網(wǎng)頁以及其他搜索 Baiduspider

三、Baiduspider對一個(gè)網(wǎng)站服務(wù)器造成的訪問壓力如何?

為了達(dá)到對目標(biāo)資源較好的檢索效果，Baiduspider需要對您的網(wǎng)站保持一定量的抓取。我們盡量不給網(wǎng)站帶來不合理的負(fù)擔(dān)，并會(huì)根據(jù)服務(wù)器承受能力，網(wǎng)站質(zhì)量，網(wǎng)站更新等綜合因素來進(jìn)行調(diào)整。如果您覺得baiduspider的訪問行為有任何不合理的情況，您可以反饋至百度投訴平臺(tái)。

四、為什么Baiduspider不停的抓取我的網(wǎng)站?

對于您網(wǎng)站上新產(chǎn)生的或者持續(xù)更新的頁面，Baiduspider會(huì)持續(xù)抓取。此外，您也可以檢查網(wǎng)站訪問日志中Baiduspider的訪問是否正常，以防止有人惡意冒充Baiduspider來頻繁抓取您的網(wǎng)站。

如果您發(fā)現(xiàn)Baiduspider非正常抓取您的網(wǎng)站，請通過投訴平臺(tái)反饋給我們，并請盡量給出Baiduspider對貴站的訪問日志，以便于我們跟蹤處理。

五、如何判斷是否冒充Baiduspider的抓取?

建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度，根據(jù)平臺(tái)不同驗(yàn)證方法不同，如linux/windows/os三種平臺(tái)下的驗(yàn)證方法分別如下：

1，在linux平臺(tái)下，您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname 以 *.baidu.com 或 *.baidu.jp 的格式命名，非 *.baidu.com 或 *.baidu.jp 即為冒充。

$ host 123.125.66.120

120.66.125.123.in-addr.arpa domain name pointer

baiduspider-123-125-66-120.crawl.baidu.com.

host 119.63.195.254

254.195.63.119.in-addr.arpa domain name pointer

BaiduMobaider-119-63-195-254.crawl.baidu.jp.

2，在windows平臺(tái)或者IBM OS/2平臺(tái)下，您可以使用nslookup ip命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析ip，來判斷是否來自Baiduspider的抓取，Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名，非 *.baidu.com 或 *.baidu.jp 即為冒充。

3，在mac os平臺(tái)下，您可以使用dig 命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入 dig xxx.xxx.xxx.xxx(IP地址)就能解析ip，來判斷是否來自Baiduspider的抓取，Baiduspider的 hostname以 *.baidu.com 或 *.baidu.jp 的格式命名，非 *.baidu.com 或 *.baidu.jp 即為冒充。

六、我不想我的網(wǎng)站被Baiduspider訪問，我該怎么做?

Baiduspider 遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網(wǎng)站，或者禁止Baiduspider訪問您網(wǎng)站上的部分文件。注意：禁止Baiduspider訪問您的網(wǎng)站，將使您的網(wǎng)站上的網(wǎng)頁，在百度搜索引擎以及所有百度提供搜索引擎服務(wù)的搜索引擎中無法被搜索到。關(guān)于robots.txt的寫作方法，請參看我們的介紹：robots.txt寫作方法您可以根據(jù)各產(chǎn)品不同的user-agent設(shè)置不同的抓取規(guī)則，如果您想完全禁止百度所有的產(chǎn)品收錄，可以直接對Baiduspider設(shè)置禁止抓取。

以下robots實(shí)現(xiàn)禁止所有來自百度的抓?。?nbsp;

User-agent: Baiduspider

Disallow: /

以下robots實(shí)現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄：

User-agent: Baiduspider

Disallow: /

User-agent: Baiduspider-image

Allow: /image/

請注意：Baiduspider-cpro抓取的網(wǎng)頁并不會(huì)建入索引，只是執(zhí)行與客戶約定的操作，所以不遵守robots協(xié)議，如果Baiduspider-cpro給您造成了困擾，請聯(lián)系union1#baidu.com（把#改為@）。

Baiduspider-ads抓取的網(wǎng)頁并不會(huì)建入索引，只是執(zhí)行與客戶約定的操作，所以不遵守robots協(xié)議，如果Baiduspider-ads給您造成了困擾，請聯(lián)系您的客戶服務(wù)專員。

七、為什么我的網(wǎng)站已經(jīng)加了robots.txt，還能在百度搜索出來? 因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫的更新需要時(shí)間。雖然Baiduspider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁，但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息，可能需要數(shù)月時(shí)間才會(huì)清除。另外也請檢查您的robots配置是否正確。

如果您的拒絕被收錄需求非常急迫，也可以通過投訴平臺(tái)反饋請求處理。

八、我希望我的網(wǎng)站內(nèi)容被百度索引但不被保存快照，我該怎么做? Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁meta的設(shè)置，使百度顯示只對該網(wǎng)頁建索引，但并不在搜索結(jié)果中顯示該網(wǎng)頁的快照。

和robots的更新一樣，因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫的更新需要時(shí)間，所以雖然您已經(jīng)在網(wǎng)頁中通過meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁的快照，但百度搜索引擎數(shù)據(jù)庫中如果已經(jīng)建立了網(wǎng)頁索引信息，可能需要二至四周才會(huì)在線上生效。

九、Baiduspider抓取造成的帶寬堵塞?

Baiduspider 的正常抓取并不會(huì)造成您網(wǎng)站的帶寬堵塞，造成此現(xiàn)象可能是由于有人冒充Baiduspider惡意抓取。如果您發(fā)現(xiàn)有名為Baiduspider的 agent抓取并且造成帶寬堵塞，請盡快和我們聯(lián)系。您可以將信息反饋至投訴平臺(tái)，如果能夠提供您網(wǎng)站該時(shí)段的訪問日志將更加有利于我們的分析。

下一篇 description標(biāo)簽還有作用嗎？

閱讀
下一篇

熱點(diǎn)新聞

網(wǎng)站排名靠前要怎么做關(guān)鍵詞排名優(yōu)化建議企業(yè)品牌推廣怎么做

熱門標(biāo)簽

SEO優(yōu)化排名用戶體驗(yàn)優(yōu)化 SEO排名圖片優(yōu)化網(wǎng)站優(yōu)化語音搜索注冊域名網(wǎng)站seo 微信小程序網(wǎng)站SEO布局布局吸引力體驗(yàn)設(shè)計(jì) 小技巧網(wǎng)頁設(shè)計(jì) 項(xiàng)目服務(wù)平臺(tái) 投入使用 Summit 超級計(jì)算機(jī)

來認(rèn)識一下百度蜘蛛baiduspider

最新案例 查看更多

最新案例查看更多