当前位置:首页 > 其它技术 > 正文内容

判断搜索引擎真假蜘蛛访问

曾经4个月前 (06-21)其它技术41539

主流搜索引擎蜘蛛抓取网站,都会自带UA特征,比如百度蜘蛛UA(Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)。

在网站的访问日志中也会相应记录,但UA是可以伪造的,目前越来越多伪造UA的扫描器或采集器都在伪造搜索引擎UA来迷惑管理员,造成无法判断是否是正规搜索引擎蜘蛛。

我们在不知道蜘蛛IP段的情况下,可以通过运行命令:nslookup 来判断真假蜘蛛。

首先以百度蜘蛛为例,在访问日志中找到带有UA记录的IP,如:220.181.108.*  在运行cmd命令输入 nslookup 220.181.108.* ,运行后结果中带有: baiduspider-220-181-108-*.crawl.baidu.com 字样,说明是真百度蜘蛛,反之如果没有则为假。


扫描二维码推送至手机访问。

版权声明:本文由珍惜发布,如需转载请注明出处。

本文链接:https://www.zp68.com/article/67.html

分享给朋友:

“判断搜索引擎真假蜘蛛访问” 的相关文章

使用ffmpeg合并n个.mp3文件

我有 3 个 128 kbps 的 .mp3 文件。 我想使用 ffmpeg 驱动程序合并这些文件。 这可能吗?我试过这段代码:shell_exec("ffmpeg -i 1490103690_128_1.mp3 -i 1490103714_128_...

Nginx 日志配置Json格式

nginx日志输出配置json格式nginx服务器日志相关指令主要有两条:(1) 一条是log_format,用来设置日志格式(2) 另外一条是access_log,用来指定日志文件的存放路径、格式和缓存大小。log_format指令用来设置日志的记录格式,它的语法如下:log_format nam...

宝塔面板nginx自定义日志配置详细介绍

网站配置里面设置access_log  /www/wwwlogs/web.com.log main;nginx配置文件http{}里面进行自定义日志配置log_format main '$remote_addr - $remote_user&...

SQLite3数据类型

SQLite 中的数据类型官网说明1. SQLite 中的数据类型大多数 SQL 数据库引擎(据我们所知,除 SQLite 之外的所有 SQL 数据库引擎)都使用静态、刚性类型。使用静态类型时,值的数据类型由其容器(存储值的特定列)决定。SQLite 使用更通用的动态类型系统。在 SQLi...

评论列表

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。