一个网站的用户访问数据对于网站运营人员来说是非常重要的,如用户是怎样到我的网站的,用户在网站浏览了什么内容,停留了多长时间等数据,很多网站 都会在网站上用上统计的功能,不少站长使用百度统计,站长统计,使用这些统计功能其实很简单,注册百度统计,然后添加网站,通过下载一个文件放到网站根目 录,进行网站认证,也就是认证这个网站是你的,接着将一段JS代码放在网站模板 footer 前,这样用户访问你的网站的相关数据,就可以在百度统计后台看 到了,站长统计也类似。

另外有一些开源的网站流量统计的框架,如Piwik,Piwik 是基于 PHP+MySQL 的,如果要使用 Piwik,得自己搭建服务器,所以要有支持 PHP+MySQL 环境的服务器,安装很简单的,类似 Joomla!、Wordpress。

如果你觉得 Piwik 还不能满足你的要求的话,你可以开发各种插件,现在很多 cms 也开发了支持 Piwik 的插件,Piwik 有一个优点,就是有非常丰富的 API,现在来看看 API。

Piwik 同样也是支持 REST api,相信了解新浪微博开放平台,twitter 开放平台的朋友对 REST api 是非常熟悉的。

在 Piwik 的后台点击API,会有 API 的快速说明文件,有个使用者验证,会有一个 &token_auth 的字符串,这个 token_auth 和你的账号和密码一样重要,千万不要公开,切记。

找到 “Module Actions”,这里有很多API可以调用的,支持 XML,Json,Tsv 等格式,在这里我使用 Json 格式的,体积小,结构清晰。随便找个,如 getPageTitles,点击 Json 格式的,如下图:

模块操作

 

打开之后发现链接如下:

http://piwik.chenwg.com/index.php?module=API&method=Actions.getPageTitles&idSite=4&period=day&date=2012-11-22&format=JSON&token_auth=*********************   (token_auth比较重要,我没有列出来,用*号表示了。)

页面显示出一堆json格式的数据,将这些json格式的数据格式化一下,如下:


[
{
"label": " 寒星晓月",
"nb_visits": 3,
"nb_uniq_visitors": 3,
"nb_hits": 3,
"sum_time_spent": 0,
"entry_nb_uniq_visitors": "3",
"entry_nb_visits": "3",
"entry_nb_actions": "3",
"entry_sum_visit_length": "0",
"entry_bounce_count": "3",
"exit_nb_uniq_visitors": "3",
"exit_nb_visits": "3",
"avg_time_on_page": 0,
"bounce_rate": "100%",
"exit_rate": "100%"
},
{
"label": " 最新hosts文件下载(2012.4.15) | 寒星晓月",
"nb_visits": 3,
"nb_uniq_visitors": 3,
"nb_hits": 3,
"sum_time_spent": 52,
"entry_nb_uniq_visitors": "3",
"entry_nb_visits": "3",
"entry_nb_actions": "4",
"entry_sum_visit_length": "53",
"entry_bounce_count": "2",
"exit_nb_uniq_visitors": "3",
"exit_nb_visits": "3",
"avg_time_on_page": 17,
"bounce_rate": "67%",
"exit_rate": "100%"
},
{
"label": " Android欢迎界面淡入淡出效果 | 寒星晓月",
"nb_visits": 1,
"nb_uniq_visitors": 1,
"nb_hits": 2,
"sum_time_spent": 16,
"entry_nb_uniq_visitors": "1",
"entry_nb_visits": "1",
"entry_nb_actions": "3",
"entry_sum_visit_length": "17",
"entry_bounce_count": "0",
"exit_nb_uniq_visitors": "1",
"exit_nb_visits": "1",
"avg_time_on_page": 16,
"bounce_rate": "0%",
"exit_rate": "100%"
},
{
"label": " extjs 常用基本控件小结 | 寒星晓月",
"nb_visits": 1,
"nb_uniq_visitors": 1,
"nb_hits": 1,
"sum_time_spent": 0,
"entry_nb_uniq_visitors": "1",
"entry_nb_visits": "1",
"entry_nb_actions": "1",
"entry_sum_visit_length": "0",
"entry_bounce_count": "1",
"exit_nb_uniq_visitors": "1",
"exit_nb_visits": "1",
"avg_time_on_page": 0,
"bounce_rate": "100%",
"exit_rate": "100%"
}
]

现在来讲讲链接参数的表示的是什么含义。

http://piwik.chenwg.com/index.php?module=API  这块我就不说了,

1. method表示的是调用哪个函数;

2. idSite就是在piwik后台添加网站时自动添加的,如下图:

网站管理

 

我们可以设置idSite=1,也可以设置idSite=1,2,3,4,…… ,这样可以显示id为1,2,3,4等网站的相关信息的,也可以设置idSite=all,这样就显示piwik所监控的所有网站。

3. period的参数可以设置 为’day’,’week’,’month’,’year’,’range’,period与date是一对好基友,他们必须在一起出现的,比如设置 period=day,则date=2012-11-23这样的格式,既YYYY-MM-DD,如果period=range,则date=2012-11-20,2012-11-23,既是一个时间段YYYY-MM-DD,YYYY-MM-DD,如果period=month,则date=2012-11,也就是YYYY-MM这样的格式。

4. format的参数,猜猜就知道了,返回的数据的类型,支持xml,json,csv等格式的,喜欢什么格式就设置什么格式。

 

本文摘自寒星晓月博文: Piwik API 初探(一)