目前中文互联网上有少量spider冒充Baiduspider抓取网页,周六madcon会上,发现很多同学不知道如何判断Baiduspider的真假,再次说明一下:
中文互联网上,Baiduspider ip的hostname以 *.baidu.com的格式命名,非 *.baidu.com即为冒充,建议您使用DNS反查方式来确定抓取来源的ip是否属于百度。 
    
    
        
        |  | # linux
host 123.125.66.120
# 输出:
# 120.66.125.123.in-addr.arpa domain name pointer
# baiduspider-123-125-66-120.crawl.baidu.com.
# windows
nslookup 123.125.66.120
# 输出:
# Name:     baiduspider-123-125-66-120.crawl.baidu.com
# Address:   123.125.66.120
 | 
         
     
    
    最新评论
      · · · · · · 
    
(共0条)
 
目前还没有评论