Baiduspider遵守互聯(lián)網robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網站,或者禁止 Baiduspider訪問您網站上的部分文件。 注意:禁止Baiduspider訪問您的網站,將使您的網站上的網頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。
您可以根據(jù)各產品不同的user-agent設置不同的抓取規(guī)則,如果您想完全禁止百度所有的產品收錄,可以直接對Baiduspider設置禁止抓取。
以下robots實現(xiàn)禁止所有來自百度的抓?。?/p>
User-agent: Baiduspider
Disallow: /
以下robots實現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:
User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/
請注意:Baiduspider-cpro抓取的網頁并不會建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議。