urchin中最常见内容中显示域名

在urchin显示的内容优化–最常见内容中默认是不带有域名的。例如
http://www.abc.com/test.html这里就只显示test.html,而万一我有test.abc.com/test.html那我就搞不清楚到底哪个是www子域名下的,哪个是test子域名下的。为了解决问题查看了urchin的帮助文档,居然还有现成的。
https://secure.urchin.com/helpwiki/cn/How_do_I_track_all_of_the_subdomains_for_my_site_in_separate_profiles%3F

   Filter Type: Custom filter > Advanced
   Field A: cs_host (Raw)
   Extract A: (.*)
   Field B: Request_Stem (Auto)
   Extract B: (.*)
   Output To: Request_Stem (Auto)
   Constructor: /$A1$B1

但是实际使用中却始终无法正常显示出来。为了解决这个问题无奈只好一个个查看urchin各个字段的解释。在http://www.google.com/support/urchin45/bin/answer.py?answer=28623&topic=7396你可以看到所有字段的解释

因为既然urchin能够获取主机名,那这里肯定也是可以显示的。最后解决问题的方法是:

   Filter Type: Custom filter > Advanced
   Field A: utm_request_hostname (AUTO)
   Extract A: (.*)
   Field B: Request_Stem (Auto)
   Extract B: (.*)
   Output To: Request_Stem (Auto)
   Constructor: $A1$B1

然后必填字段A 选择是,必填字段B选择否,覆盖输出字段选择是,区分大小写选择否。

这下终于OK了。

如何让urchin继续免费试用

urchin免费试用才1个月。过期了我的urchin,难道就不用了? 难道就真去买了序列号了?
这urchin是装在我们自己的服务器上的,难道就真没办法免费继续试用了? 于是找了下urchin的安装目录,楞是没找到相关的注册信息,那就一定是保存在数据库中的了。把数据库到处后搜索了下那个序列号,还真给找到了。

那就需要重新安装下urchin,安装方法之前已经有说过了,很容易的。这次安装主要是为了重新申请serial code而进行的。所以要选择不同的安装目录和启动端口。 这样安装完成后就按正常申请到试用序列号。通过数据库我们可以可以看到下列条目。主要内容是ucgl_serial:和ucgl_license: 这2行(经囚囚网首席DBA刘大牛提醒)。然后把这2行通过update在原来的urchin数据库中,那原来的urchin数据库就可以继续免费试用1个月了。不过最后还是得说记得操作前都做好备份,无论是urchin目录还是urchin数据库。

mysql> select * from uglobals\G
*************************** 1. row ***************************
                            usgl_id: 1
                         utgl_mtime: 2009-07-07 15:50:00
                          ucgl_name: Global Settings
                       ucgl_version: 6501
                        ucgl_serial: M7KAC3E7Z6VZS4JC1WDML3A7
                       ucgl_license: ATS5C1EZPKV5PX0EGKVNHB0HFHV20EXSL4B2X6VM44N43N2W7CBSJX7HGRWB5Y3ZTY8U6TE7

urchin的安装及使用

Urchin是google收购的一个日志分析工具。界面跟google analytics是几乎完全一样的。但是google analytics每个月的统计只能在500W PV以内,这个对于稍微有点规模的网站是不可忍受的。所以我们还是需要自己来架设一个urchin 首先需要下载一个urchin6501_linux2.6_kernel.tar.gz 这个是根据自己monitor的系统版本来进行确定的。然后还需要有一个mysql或者postgresql 创建相应的数据库和数据库用户。这里数据库名为urchin,数据库账户为urchin,urchin的账户密码为urchinapassword, urchin账户拥有urchin库的all权限。

root@monitor# mysql -u root -p
mysql> create database urchin character set utf8;
mysql> GRANT ALL ON urchin.* to 'urchin'@'10.2.%' IDENTIFIED BY 'urchinpassword';

接着使用程序目录下的install.sh脚本进行安装,这里主要是选择安装目录,数据库配置连接等等。

 ./install.sh 

安装完成后就可以通过下列网址查看urchin

http://yourserver:

修改admin用户的密码,因为我实在不知道默认admin的密码是啥

/usr/local/urchin/util/uconf-manager table=uusers action=update ucus_name="admin" ucus_password="123456" key1=ucus_name print=status

这里是把admin用户的密码设置为123456

这样我们就能通过上面的网站看到urchin的界面了,记住了申请试用必须使用IE来进行。Firefox一直有些界面看不到。

其他配置:

首先需要一个域名下放置urchin.js这个js代码。这个代码需要修改如下部分。

//-- UTM User Settings
var _udn="xiaonei.com";               //这个是你网站一级目录
var _ugifpath="http://track.xiaonei.com/__utm.gif";  //__utm.gif的地址

track.xiaonei.com 这个最好是独立的域名,这样urchin就不会分析这个域名内其他不相关的日志了。

__utm.gif和urchin.js都在安装文件中存在,根据上面的建议进行修改和放置。

关于日志配置:

默认nginx的日志格式,urchin是无法进行分析的。还必须要做相应的修改后urchin才能进行分析。

log_format urchin '$remote_addr $http_host - [$time_local]  "$request" '

'$status $body_bytes_sent "$http_referer" '

'"$http_user_agent" "$http_cookie"';

新建配置:

Urchin默认是英文界面,可以在显示中选择中文。基本设置如下:

step1

step2step3step4

urchin的原理:就是在所有的页面都会嵌入这个urchin.js来访问那个__utm.gif图片,通过这个来收集用户本地的相关信息来记录到gif图片域名下的日志中,然后urchin就来分析这个日志,所以这个分析结果的内容会比一般的多。

xiaonei