使用nginx lua实现网站统计中的数据收集

网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析百度统计腾讯分析等等。所有这些统计分析工具的第一步都是网站访问数据的收集。目前主流的数据收集方式基本都是基于javascript的。本文将简要分析这种数据收集的原理,并一步一步实际搭建一个实际的数据收集系统。

数据收集原理分析

简单来说,网站统计分析工具需要收集到用户浏览目标网站的行为(如打开某网页、点击某按钮、将商品加入购物车等)及行为附加数据(如某下单行为产生的订单金额等)。早期的网站统计往往只收集一种用户行为:页面的打开。而后用户在页面中的行为均无法收集。这种收集策略能满足基本的流量分析、来源分析、内容分析及访客属性等常用分析视角,但是,随着ajax技术的广泛使用及电子商务网站对于电子商务目标的统计分析的需求越来越强烈,这种传统的收集策略已经显得力不能及。

后来,Google在其产品谷歌分析中创新性的引入了可定制的数据收集脚本,用户通过谷歌分析定义好的可扩展接口,只需编写少量的javascript代码就可以实现自定义事件和自定义指标的跟踪和分析。目前百度统计、搜狗分析等产品均照搬了谷歌分析的模式。

其实说起来两种数据收集模式的基本原理和流程是一致的,只是后一种通过javascript收集到了更多的信息。下面看一下现在各种网站统计工具的数据收集基本原理。

流程概览

首先通过一幅图总体看一下数据收集的基本流程。

Nginx

图1. 网站统计数据收集基本流程

首先,用户的行为会触发浏览器对被统计页面的一个http请求,这里姑且先认为行为就是打开网页。当网页被打开,页面中的埋点javascript片段会被执行,用过相关工具的朋友应该知道,一般网站统计工具都会要求用户在网页中加入一小段javascript代码,这个代码片段一般会动态创建一个script标签,并将src指向一个单独的js文件,此时这个单独的js文件(图1中绿色节点)会被浏览器请求到并执行,这个js往往就是真正的数据收集脚本。数据收集完成后,js会请求一个后端的数据收集脚本(图1中的backend),这个脚本一般是一个伪装成图片的动态脚本程序,可能由php、python或其它服务端语言编写,js会将收集到的数据通过http参数的方式传递给后端脚本,后端脚本解析参数并按固定格式记录到访问日志,同时可能会在http响应中给客户端种植一些用于追踪的cookie。

上面是一个数据收集的大概流程,下面以谷歌分析为例,对每一个阶段进行一个相对详细的分析。

埋点脚本执行阶段

若要使用谷歌分析(以下简称GA),需要在页面中插入一段它提供的javascript片段,这个片段往往被称为埋点代码。下面是我的博客中所放置的谷歌分析埋点代码截图:

Nginx

图2. 谷歌分析埋点代码

其中_gaq是GA的的全局数组,用于放置各种配置,其中每一条配置的格式为:

  1. _gaq.push([‘Action’, ‘param1’, ‘param2’, …]);

Action指定配置动作,后面是相关的参数列表。GA给的默认埋点代码会给出两条预置配置,_setAccount用于设置网站标识ID,这个标识ID是在注册GA时分配的。_trackPageview告诉GA跟踪一次页面访问。更多配置请参考:https://developers.google.com/analytics/devguides/collection/gajs/。实际上,这个_gaq是被当做一个FIFO队列来用的,配置代码不必出现在埋点代码之前,具体请参考上述链接的说明。

就本文来说,_gaq的机制不是重点,重点是后面匿名函数的代码,这才是埋点代码真正要做的。这段代码的主要目的就是引入一个外部的js文件(ga.js),方式是通过document.createElement方法创建一个script并根据协议(http或https)将src指向对应的ga.js,最后将这个element插入页面的dom树上。

注意ga.async = true的意思是异步调用外部js文件,即不阻塞浏览器的解析,待外部js下载完成后异步执行。这个属性是HTML5新引入的。

数据收集脚本执行阶段

数据收集脚本(ga.js)被请求后会被执行,这个脚本一般要做如下几件事:

1、通过浏览器内置javascript对象收集信息,如页面title(通过document.title)、referrer(上一跳url,通过document.referrer)、用户显示器分辨率(通过windows.screen)、cookie信息(通过document.cookie)等等一些信息。

2、解析_gaq收集配置信息。这里面可能会包括用户自定义的事件跟踪、业务数据(如电子商务网站的商品编号等)等。

3、将上面两步收集的数据按预定义格式解析并拼接。

4、请求一个后端脚本,将信息放在http request参数中携带给后端脚本。

这里唯一的问题是步骤4,javascript请求后端脚本常用的方法是ajax,但是ajax是不能跨域请求的。这里ga.js在被统计网站的域内执行,而后端脚本在另外的域(GA的后端统计脚本是http://www.google-analytics.com/__utm.gif),ajax行不通。一种通用的方法是js脚本创建一个Image对象,将Image对象的src属性指向后端脚本并携带参数,此时即实现了跨域请求后端。这也是后端脚本为什么通常伪装成gif文件的原因。通过http抓包可以看到ga.js对__utm.gif的请求:

Nginx

图3. 后端脚本请求的http包

可以看到ga.js在请求__utm.gif时带了很多信息,例如utmsr=1280×1024是屏幕分辨率,utmac=UA-35712773-1是_gaq中解析出的我的GA标识ID等等。

值得注意的是,__utm.gif未必只会在埋点代码执行时被请求,如果用_trackEvent配置了事件跟踪,则在事件发生时也会请求这个脚本。

由于ga.js经过了压缩和混淆,可读性很差,我们就不分析了,具体后面实现阶段我会实现一个功能类似的脚本。

后端脚本执行阶段

GA的__utm.gif是一个伪装成gif的脚本。这种后端脚本一般要完成以下几件事情:

1、解析http请求参数的到信息。

2、从服务器(WebServer)中获取一些客户端无法获取的信息,如访客ip等。

3、将信息按格式写入log。

5、生成一副1×1的空gif图片作为响应内容并将响应头的Content-type设为image/gif。

5、在响应头中通过Set-cookie设置一些需要的cookie信息。

之所以要设置cookie是因为如果要跟踪唯一访客,通常做法是如果在请求时发现客户端没有指定的跟踪cookie,则根据规则生成一个全局唯一的cookie并种植给用户,否则Set-cookie中放置获取到的跟踪cookie以保持同一用户cookie不变(见图4)。

Nginx

图4. 通过cookie跟踪唯一用户的原理

这种做法虽然不是完美的(例如用户清掉cookie或更换浏览器会被认为是两个用户),但是是目前被广泛使用的手段。注意,如果没有跨站跟踪同一用户的需求,可以通过js将cookie种植在被统计站点的域下(GA是这么做的),如果要全网统一定位,则通过后端脚本种植在服务端域下(我们待会的实现会这么做)。

系统的设计实现

根据上述原理,我自己搭建了一个访问日志收集系统。总体来说,搭建这个系统要做如下的事:

Nginx

图5. 访问数据收集系统工作分解

下面详述每一步的实现。我将这个系统叫做MyAnalytics。

确定收集的信息

为了简单起见,我不打算实现GA的完整数据收集模型,而是收集以下信息。

名称 途径 备注
访问时间 web server Nginx $msec
IP web server Nginx $remote_addr
域名 javascript document.domain
URL javascript document.URL
页面标题 javascript document.title
分辨率 javascript window.screen.height & width
颜色深度 javascript window.screen.colorDepth
Referrer javascript document.referrer
浏览客户端 web server Nginx $http_user_agent
客户端语言 javascript navigator.language
访客标识 cookie
网站标识 javascript 自定义对象

埋点代码

埋点代码我将借鉴GA的模式,但是目前不会将配置对象作为一个FIFO队列用。一个埋点代码的模板如下:

  1. <script type="text/javascript">// <![CDATA[
  2. var _maq = _maq || []; _maq.push([‘_setAccount’, ‘网站标识’]); (function() { var ma = document.createElement(‘script’); ma.type = ‘text/javascript’; ma.async = true; ma.src = (‘https:’ == document.location.protocol ? ‘https://analytics’ : ‘http://analytics’) + ‘.codinglabs.org/ma.js’; var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ma, s); })();
  3. // ]]></script>

这里我启用了二级域名analytics.codinglabs.org,统计脚本的名称为ma.js。当然这里有一点小问题,因为我并没有https的服务器,所以如果一个https站点部署了代码会有问题,不过这里我们先忽略吧。

前端统计脚本

我写了一个不是很完善但能完成基本工作的统计脚本ma.js:

  1. (function () {
  2. var params = {};
  3. //Document对象数据
  4. if(document) {
  5. params.domain = document.domain || ”;
  6. params.url = document.URL || ”;
  7. params.title = document.title || ”;
  8. params.referrer = document.referrer || ”;
  9. }
  10. //Window对象数据
  11. if(window &amp;&amp; window.screen) {
  12. params.sh = window.screen.height || 0;
  13. params.sw = window.screen.width || 0;
  14. params.cd = window.screen.colorDepth || 0;
  15. }
  16. //navigator对象数据
  17. if(navigator) {
  18. params.lang = navigator.language || ”;
  19. }
  20. //解析_maq配置
  21. if(_maq) {
  22. for(var i in _maq) {
  23. switch(_maq[i][0]) {
  24. case ‘_setAccount’:
  25. params.account = _maq[i][1];
  26. break;
  27. default:
  28. break;
  29. }
  30. }
  31. }
  32. //拼接参数串
  33. var args = ”;
  34. for(var i in params) {
  35. if(args != ”) {
  36. args += ‘&amp;’;
  37. }
  38. args += i + ‘=’ + encodeURIComponent(params[i]);
  39. }
  40. //通过Image对象请求后端脚本
  41. var img = new Image(1, 1);
  42. img.src = ‘http://analytics.codinglabs.org/1.gif?’ + args;
  43. })();

整个脚本放在匿名函数里,确保不会污染全局环境。功能在原理一节已经说明,不再赘述。其中1.gif是后端脚本。

日志格式

日志采用每行一条记录的方式,采用不可见字符^A(ascii码0x01,Linux下可通过ctrl + v ctrl + a输入,下文均用“^A”表示不可见字符0x01),具体格式如下:

时间^AIP^A域名^AURL^A页面标题^AReferrer^A分辨率高^A分辨率宽^A颜色深度^A语言^A客户端信息^A用户标识^A网站标识

后端脚本

为了简单和效率考虑,我打算直接使用nginx的access_log做日志收集,不过有个问题就是nginx配置本身的逻辑表达能力有限,所以我选用了OpenResty做这个事情。OpenResty是一个基于Nginx扩展出的高性能应用开发平台,内部集成了诸多有用的模块,其中的核心是通过ngx_lua模块集成了Lua,从而在nginx配置文件中可以通过Lua来表述业务。关于这个平台我这里不做过多介绍,感兴趣的同学可以参考其官方网站http://openresty.org/,或者这里有其作者章亦春(agentzh)做的一个非常有爱的介绍OpenResty的slide:http://agentzh.org/misc/slides/ngx-openresty-ecosystem/,关于ngx_lua可以参考:https://github.com/chaoslawful/lua-nginx-module

首先,需要在nginx的配置文件中定义日志格式:

  1. log_format tick “$msec^A$remote_addr^A$u_domain^A$u_url^A$u_title^A$u_referrer^A$u_sh^A$u_sw^A$u_cd^A$u_lang^A$http_user_agent^A$u_utrace^A$u_account”;

注意这里以u_开头的是我们待会会自己定义的变量,其它的是nginx内置变量。

然后是核心的两个location:

  1. location /1.gif {
  2. #伪装成gif文件
  3. default_type image/gif;
  4. #本身关闭access_log,通过subrequest记录log
  5. access_log off;
  6. access_by_lua "
  7. — 用户跟踪cookie名为__utrace
  8. local uid = ngx.var.cookie___utrace
  9. if not uid then
  10. — 如果没有则生成一个跟踪cookie,算法为md5(时间戳+IP+客户端信息)
  11. uid = ngx.md5(ngx.now() .. ngx.var.remote_addr .. ngx.var.http_user_agent)
  12. end
  13. ngx.header[‘Set-Cookie’] = {‘__utrace=’ .. uid .. ‘; path=/’}
  14. if ngx.var.arg_domain then
  15. — 通过subrequest到/i-log记录日志,将参数和用户跟踪cookie带过去
  16. ngx.location.capture(‘/i-log?’ .. ngx.var.args .. ‘&utrace=’ .. uid)
  17. end
  18. ";
  19. #此请求不缓存
  20. add_header Expires "Fri, 01 Jan 1980 00:00:00 GMT";
  21. add_header Pragma "no-cache";
  22. add_header Cache-Control "no-cache, max-age=0, must-revalidate";
  23. #返回一个1×1的空gif图片
  24. empty_gif;
  25. }
  26. location /i-log {
  27. #内部location,不允许外部直接访问
  28. internal;
  29. #设置变量,注意需要unescape
  30. set_unescape_uri $u_domain $arg_domain;
  31. set_unescape_uri $u_url $arg_url;
  32. set_unescape_uri $u_title $arg_title;
  33. set_unescape_uri $u_referrer $arg_referrer;
  34. set_unescape_uri $u_sh $arg_sh;
  35. set_unescape_uri $u_sw $arg_sw;
  36. set_unescape_uri $u_cd $arg_cd;
  37. set_unescape_uri $u_lang $arg_lang;
  38. set_unescape_uri $u_utrace $arg_utrace;
  39. set_unescape_uri $u_account $arg_account;
  40. #打开日志
  41. log_subrequest on;
  42. #记录日志到ma.log,实际应用中最好加buffer,格式为tick
  43. access_log /path/to/logs/directory/ma.log tick;
  44. #输出空字符串
  45. echo ”;
  46. }

要完全解释这段脚本的每一个细节有点超出本文的范围,而且用到了诸多第三方ngxin模块(全都包含在OpenResty中了),重点的地方我都用注释标出来了,可以不用完全理解每一行的意义,只要大约知道这个配置完成了我们在原理一节提到的后端逻辑就可以了。

日志轮转

真正的日志收集系统访问日志会非常多,时间一长文件变得很大,而且日志放在一个文件不便于管理。所以通常要按时间段将日志切分,例如每天或每小时切分一个日志。我这里为了效果明显,每一小时切分一个日志。我是通过crontab定时调用一个shell脚本实现的,shell脚本如下:

  1. _prefix="/path/to/nginx"
  2. time=`date +%Y%m%d%H`
  3. mv ${_prefix}/logs/ma.log ${_prefix}/logs/ma/ma-${time}.log
  4. kill -USR1 `cat ${_prefix}/logs/nginx.pid`

这个脚本将ma.log移动到指定文件夹并重命名为ma-{yyyymmddhh}.log,然后向nginx发送USR1信号令其重新打开日志文件。

然后再/etc/crontab里加入一行:

  1. 59 * * * * root /path/to/directory/rotatelog.sh

在每个小时的59分启动这个脚本进行日志轮转操作。

测试

下面可以测试这个系统是否能正常运行了。我昨天就在我的博客中埋了相关的点,通过http抓包可以看到ma.js和1.gif已经被正确请求:

Nginx

图6. http包分析ma.js和1.gif的请求

同时可以看一下1.gif的请求参数:

Nginx

图7. 1.gif的请求参数

相关信息确实也放在了请求参数中。

然后我tail打开日志文件,然后刷新一下页面,因为没有设access log buffer, 我立即得到了一条新日志:

  1. 1351060731.360^A0.0.0.0^Awww.codinglabs.org^Ahttp://www.codinglabs.org/^ACodingLabs^A^A1024^A1280^A24^Azh-CN^AMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4^A4d612be64366768d32e623d594e82678^AU-1-1

注意实际上原日志中的^A是不可见的,这里我用可见的^A替换为方便阅读,另外IP由于涉及隐私我替换为了0.0.0.0。

看一眼日志轮转目录,由于我之前已经埋了点,所以已经生成了很多轮转文件:

Nginx

图8. 轮转日志

关于分析

通过上面的分析和开发可以大致理解一个网站统计的日志收集系统是如何工作的。有了这些日志,就可以进行后续的分析了。本文只注重日志收集,所以不会写太多关于分析的东西。

注意,原始日志最好尽量多的保留信息而不要做过多过滤和处理。例如上面的MyAnalytics保留了毫秒级时间戳而不是格式化后的时间,时间的格式化是后面的系统做的事而不是日志收集系统的责任。后面的系统根据原始日志可以分析出很多东西,例如通过IP库可以定位访问者的地域、user agent中可以得到访问者的操作系统、浏览器等信息,再结合复杂的分析模型,就可以做流量、来源、访客、地域、路径等分析了。当然,一般不会直接对原始日志分析,而是会将其清洗格式化后转存到其它地方,如MySQL或HBase中再做分析。

分析部分的工作有很多开源的基础设施可以使用,例如实时分析可以使用Storm,而离线分析可以使用Hadoop。当然,在日志比较小的情况下,也可以通过shell命令做一些简单的分析,例如,下面三条命令可以分别得出我的博客在今天上午8点到9点的访问量(PV),访客数(UV)和独立IP数(IP):

  1. awk -F^A ‘{print $1}’ ma-2012102409.log | wc -l
  2. awk -F^A ‘{print $12}’ ma-2012102409.log | uniq | wc -l
  3. awk -F^A ‘{print $2}’ ma-2012102409.log | uniq | wc -l

其它好玩的东西朋友们可以慢慢挖掘。

参考

GA的开发者文档:https://developers.google.com/analytics/devguides/collection/gajs/

一篇关于实现nginx收日志的文章:http://blog.linezing.com/2011/11/%E4%BD%BF%E7%94%A8nginx%E8%AE%B0%E6%97%A5%E5%BF%97

关于Nginx可以参考:http://wiki.nginx.org/Main

OpenResty的官方网站为:http://openresty.org

ngx_lua模块可参考:https://github.com/chaoslawful/lua-nginx-module

本文http抓包使用Chrome浏览器开发者工具,绘制思维导图使用Xmind,流程和结构图使用Tikz PGF
转自:http://blog.codinglabs.org/articles/how-web-analytics-data-collection-system-work.html

nginx反向代理缓存配置

这里给出示例,并详解。

  1. http {
  2. […]
  3. […]
  4.  
  5. proxy_cache_path  /data/nginx/cache/one  levels=1:2   keys_zone=one:10m max_size=10g;
  6. proxy_cache_key  "$host$request_uri";
  7.  
  8. server {
  9.     server_name devops.webres.wang webres.wang;
  10.     root /home/devops.webres.wang/web;
  11.     index index.php index.html index.htm;
  12.     location / {
  13.         proxy_pass http://127.0.0.1:8080;
  14.         proxy_set_header  Host "devops.webres.wang";
  15.         proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;
  16.         #开启反向代理缓存,并使用zone name为one的缓存。
  17.         proxy_cache one;
  18.         #设置状态码为200 302过期时间为10分钟
  19.         proxy_cache_valid  200 302  10m;
  20.         #设置状态码404的过期时间为1分钟
  21.         proxy_cache_valid  404      1m;
  22.     }
  23.     #清除缓存
  24.     location ~ /purge(/.*) {
  25.         #允许的IP
  26.         allow 127.0.0.1;
  27.         deny all;
  28.         proxy_cache_purge one $host$1$is_args$args;
  29.     }
  30. }
  31.  
  32. }

反向代理的缓存主要涉及以下几个命令:
proxy_cache_path proxy_cache_key proxy_cache proxy_cache_valid。

proxy_cache_path
这个是设置缓存的目录,语法如下:
proxy_cache_path path [ levels = levels ] keys_zone = name : size [ inactive = time ] [ max_size = size ] [ loader_files = number ] [ loader_sleep = time ] [ loader_threshold = time ]
可放置的上下文:
http
参数解释:
[ levels = levels ]:
设置缓存目录层数,如levels=1:2,表示创建两层目录缓存,最多创建三层。第一层目录名取proxy_cache_key md5的最后一个字符,第二层目录名取倒数2-3字符,如:
proxy_cache_key md5为b7f54b2df7773722d382f4809d65029c,则:
levels=1:2为/data/nginx/cache/c/29/b7f54b2df7773722d382f4809d65029c
levels=1:2:3为/data/nginx/cache/c/29/650/b7f54b2df7773722d382f4809d65029c

keys_zone = name : size:
定义缓存区域名称及大小,缓存名称用于proxy_cache指令设置缓存放置在哪,如proxy_cache one,则把缓存放在zone名称为one的缓存区,即proxy_cache_path指定的具体位置。

proxy_cache_key
这个指令是设置以什么参数md5得到缓存的文件名,默认为$scheme$proxy_host$request_uri,即以协议、主机名、请求uri(包含参数)作md5得出缓存的文件名。
proxy_cache_key与下面的清缓存功能(purge cache)有很大关系。
可放置在上下文,http server location

proxy_cache
反向代理缓存设置指令,语法proxy_cache zone | off,默认为off。上下文:http server location。
可以放到指定location,这样匹配此location的url才被缓存。

proxy_cache_valid
设置指定状态码的缓存时间,语法proxy_cache_valid [ code …] time。

另外,清缓存需要安装插件ngx_cache_purge,安装方法如下:

  1. cd /tmp
  2. wget http://labs.frickle.com/files/ngx_cache_purge-2.1.tar.gz
  3. tar xzf ngx_cache_purge-2.1.tar.gz
  4. cd /tmp
  5. wget http://nginx.org/download/nginx-1.4.2.tar.gz
  6. tar xzf nginx-1.4.2.tar.gz
  7. cd nginx-1.4.2
  8. ./configure –prefix=/usr/local/nginx  –add-module=/tmp/ngx_cache_purge-2.1
  9. make && make install

参考:
http://wiki.nginx.org/HttpProxyModule
http://labs.frickle.com/nginx_ngx_cache_purge/

Ubuntu 12.04安装配置Postfix dovecot cyrus sasl(mysql虚拟用户)

本文是基于ubuntu 12.04配置的邮件服务器,利用postfix提供邮件smtp服务,dovecot提供pop3或imap代理收信服务。使用mysql管理和验证邮件用户。以下操作经本人亲试通过,涉及域名webres.wang的请替换为自己的。

一、安装必要包

  1. apt-get install postfix postfix-mysql postfix-doc mysql-client mysql-server dovecot-common dovecot-imapd dovecot-pop3d libsasl2-2 libsasl2-modules libsasl2-modules-sql sasl2-bin libpam-mysql openssl telnet mailutils dovecot-mysql

二、设置MySQL数据库

  1. mysql -u root -p
  1. mysql> CREATE DATABASE mail;
  2. mysql> USE mail;
  3. mysql> GRANT SELECT, INSERT, UPDATE, DELETE ON mail.* TO ‘mail_admin’@’localhost’ IDENTIFIED BY ‘password-for-mail_admin’;
  4. mysql> GRANT SELECT, INSERT, UPDATE, DELETE ON mail.* TO ‘mail_admin’@’127.0.0.1’ IDENTIFIED BY ‘password-for-mail_admin’;
  5. mysql> FLUSH PRIVILEGES;
  6. mysql> CREATE TABLE domains (domain varchar(50) NOT NULL, PRIMARY KEY (domain) );
  7. mysql> CREATE TABLE forwardings (source varchar(80) NOT NULL, destination TEXT NOT NULL, PRIMARY KEY (source) );
  8. mysql> CREATE TABLE users (email varchar(80) NOT NULL, password varchar(20) NOT NULL, PRIMARY KEY (email) );
  9. mysql> CREATE TABLE transport ( domain varchar(128) NOT NULL default ”, transport varchar(128) NOT NULL default ”, UNIQUE KEY domain (domain) );
  10. mysql> quit

注:请替换password-for-mail_admin为用户mail_admin的密码,以下出现password-for-mail_admin的也请替换下。

三、配置Postfix使用MySQL

文件:/etc/postfix/mysql-virtual_domains.cf

  1. user = mail_admin
  2. password = password-for-mail_admin
  3. dbname = mail
  4. query = SELECT domain AS virtual FROM domains WHERE domain=’%s’
  5. hosts = 127.0.0.1

文件:/etc/postfix/mysql-virtual_forwardings.cf

  1. user = mail_admin
  2. password = password-for-mail_admin
  3. dbname = mail
  4. query = SELECT destination FROM forwardings WHERE source=’%s’
  5. hosts = 127.0.0.1

文件:/etc/postfix/mysql-virtual_mailboxes.cf

  1. user = mail_admin
  2. password = password-for-mail_admin
  3. dbname = mail
  4. query = SELECT CONCAT(SUBSTRING_INDEX(email,’@’,-1),’/’,SUBSTRING_INDEX(email,’@’,1),’/’) FROM users WHERE email=’%s’
  5. hosts = 127.0.0.1

文件:/etc/postfix/mysql-virtual_email2email.cf

  1. user = mail_admin
  2. password = password-for-mail_admin
  3. dbname = mail
  4. query = SELECT email FROM users WHERE email=’%s’
  5. hosts = 127.0.0.1

设置权限:

  1. chmod o= /etc/postfix/mysql-virtual_*.cf
  2. chgrp postfix /etc/postfix/mysql-virtual_*.cf

建立用户:

  1. groupadd -g 5000 vmail
  2. useradd -g vmail -u 5000 vmail -d /home/vmail -m

配置postfix:

  1. postconf -e ‘myhostname = webres.wang’
  2. postconf -e ‘mydestination = webres.wang, localhost, localhost.localdomain’
  3. postconf -e ‘mynetworks = 127.0.0.0/8’
  4. postconf -e ‘message_size_limit = 30720000’
  5. postconf -e ‘virtual_alias_domains =’
  6. postconf -e ‘virtual_alias_maps = proxy:mysql:/etc/postfix/mysql-virtual_forwardings.cf, mysql:/etc/postfix/mysql-virtual_email2email.cf’
  7. postconf -e ‘virtual_mailbox_domains = proxy:mysql:/etc/postfix/mysql-virtual_domains.cf’
  8. postconf -e ‘virtual_mailbox_maps = proxy:mysql:/etc/postfix/mysql-virtual_mailboxes.cf’
  9. postconf -e ‘virtual_mailbox_base = /home/vmail’
  10. postconf -e ‘virtual_uid_maps = static:5000’
  11. postconf -e ‘virtual_gid_maps = static:5000’
  12. postconf -e ‘smtpd_sasl_auth_enable = yes’
  13. postconf -e ‘broken_sasl_auth_clients = yes’
  14. postconf -e ‘smtpd_sasl_authenticated_header = yes’
  15. postconf -e ‘smtpd_recipient_restrictions = permit_mynetworks, permit_sasl_authenticated, reject_unauth_destination’
  16. postconf -e ‘smtpd_use_tls = yes’
  17. postconf -e ‘smtpd_tls_cert_file = /etc/postfix/smtpd.cert’
  18. postconf -e ‘smtpd_tls_key_file = /etc/postfix/smtpd.key’
  19. postconf -e ‘proxy_read_maps = $local_recipient_maps $mydestination $virtual_alias_maps $virtual_alias_domains $virtual_mailbox_maps $virtual_mailbox_domains $relay_recipient_maps $relay_domains $canonical_maps $sender_canonical_maps $recipient_canonical_maps $relocated_maps $transport_maps $mynetworks $virtual_mailbox_limit_maps’
  20. postconf -e ‘virtual_transport = dovecot’
  21. postconf -e ‘local_transport = dovecot’

四、为postfix创建证书:

  1. cd /etc/postfix
  2. openssl req -new -outform PEM -out smtpd.cert -newkey rsa:2048 -nodes -keyout smtpd.key -keyform PEM -days 365 -x509

更改证书权限:

  1. chmod o= /etc/postfix/smtpd.key

五、配置saslauthd

  1. mkdir -p /var/spool/postfix/var/run/saslauthd
  2. cp -a /etc/default/saslauthd /etc/default/saslauthd.bak

编辑文件:/etc/default/saslauthd,按以下内容修改:

  1. START=yes
  2. DESC="SASL Authentication Daemon"
  3. NAME="saslauthd"
  4. MECHANISMS="pam"
  5. MECH_OPTIONS=""
  6. THREADS=5
  7. OPTIONS="-c -m /var/spool/postfix/var/run/saslauthd -r"

文件:/etc/pam.d/smtp

  1. auth    required   pam_mysql.so user=mail_admin passwd=password-for-mail_admin host=127.0.0.1 db=mail table=users usercolumn=email passwdcolumn=password crypt=1
  2. account sufficient pam_mysql.so user=mail_admin passwd=password-for-mail_admin host=127.0.0.1 db=mail table=users usercolumn=email passwdcolumn=password crypt=1

文件:/etc/postfix/sasl/smtpd.conf

  1. pwcheck_method: saslauthd
  2. mech_list: plain login
  3. allow_plaintext: true
  4. auxprop_plugin: sql
  5. sql_engine: mysql
  6. sql_hostnames: 127.0.0.1
  7. sql_user: mail_admin
  8. sql_passwd: password-for-mail_admin
  9. sql_database: mail
  10. sql_select: select password from users where email = ‘%u@%r’

设置权限:

  1. chmod o= /etc/pam.d/smtp
  2. chmod o= /etc/postfix/sasl/smtpd.conf

重启服务:

  1. adduser postfix sasl
  2. service postfix restart
  3. service saslauthd restart

六、配置Dovecot

文件:/etc/postfix/master.cf,按如下修改

取消submission配置的注释:

  1. #submission inet n       –       –       –       –       smtpd
  2. #  -o syslog_name=postfix/submission
  3. #  -o smtpd_tls_security_level=encrypt
  4. #  -o smtpd_sasl_auth_enable=yes
  5. #  -o smtpd_client_restrictions=permit_sasl_authenticated,reject
  6. #  -o milter_macro_daemon_name=ORIGINATING
  7.  改为
  8. submission inet n       –       –       –       –       smtpd
  9.   -o syslog_name=postfix/submission
  10.   -o smtpd_tls_security_level=encrypt
  11.   -o smtpd_sasl_auth_enable=yes
  12.   -o smtpd_client_restrictions=permit_sasl_authenticated,reject
  13.   -o milter_macro_daemon_name=ORIGINATING

文件尾增加:

  1. dovecot   unix  –       n       n       –       –       pipe
  2.     flags=DRhu user=vmail:vmail argv=/usr/lib/dovecot/deliver -d ${recipient}
  1. cp -a /etc/dovecot/dovecot.conf /etc/dovecot/dovecot.conf.bak

清空文件/etc/dovecot/dovecot.conf,加入如下:

  1. log_timestamp = "%Y-%m-%d %H:%M:%S "
  2. mail_location = maildir:/home/vmail/%d/%n/Maildir
  3. namespace {
  4.   inbox = yes
  5.   location =
  6.   prefix = INBOX.
  7.   separator = .
  8.   type = private
  9. }
  10. passdb {
  11.   args = /etc/dovecot/dovecot-sql.conf
  12.   driver = sql
  13. }
  14. protocols = imap pop3
  15. disable_plaintext_auth = no
  16. auth_mechanisms = plain login
  17. service auth {
  18.   unix_listener /var/spool/postfix/private/auth {
  19.     group = postfix
  20.     mode = 0660
  21.     user = postfix
  22.   }
  23.   unix_listener auth-master {
  24.     mode = 0600
  25.     user = vmail
  26.   }
  27.   user = root
  28. }
  29. ssl = required
  30. ssl_cert = </etc/ssl/certs/dovecot.pem
  31. ssl_key = </etc/ssl/private/dovecot.pem
  32. userdb {
  33.   args = uid=5000 gid=5000 home=/home/vmail/%d/%n allow_all_users=yes
  34.   driver = static
  35. }
  36. protocol lda {
  37.   auth_socket_path = /var/run/dovecot/auth-master
  38.   log_path = /home/vmail/dovecot-deliver.log
  39.   postmaster_address = [email protected]
  40. }
  41. protocol pop3 {
  42.   pop3_uidl_format = %08Xu%08Xv
  43. }
  1. cp -a /etc/dovecot/dovecot-sql.conf /etc/dovecot/dovecot-sql.conf.bak

文件:/etc/dovecot/dovecot-sql.conf

  1. driver = mysql
  2. connect = host=127.0.0.1 dbname=mail user=mail_admin password=password-for-mail_admin
  3. default_pass_scheme = CRYPT
  4. password_query = SELECT email as user, password FROM users WHERE email=’%u’;
  1. service dovecot restart
  2.  
  3.  
  4. chgrp vmail /etc/dovecot/dovecot.conf
  5. chmod g+r /etc/dovecot/dovecot.conf

七、设置Mail Aliases

文件/etc/aliases

  1. postmaster: root
  2. root: [email protected]

八、测试

  1. mysql -u root -p
  1. USE mail;
  2. INSERT INTO domains (domain) VALUES (‘webres.wang’);
  3. INSERT INTO users (email, password) VALUES (‘[email protected]’, ENCRYPT(‘password-for-sales’));
  4. quit

这里添加了一个[email protected]的用户,密码为password-for-sales

最后,可以使用邮件客户端,如foxmail进行收信和发信的测试。

ubuntu 12.04 163 apt source list

  1. deb http://mirrors.163.com/ubuntu/ precise main restricted
  2. deb-src http://mirrors.163.com/ubuntu/ precise main restricted
  3.  
  4. ## Major bug fix updates produced after the final release of the
  5. ## distribution.
  6. deb http://mirrors.163.com/ubuntu/ precise-updates main restricted
  7. deb-src http://mirrors.163.com/ubuntu/ precise-updates main restricted
  8.  
  9. ## N.B. software from this repository is ENTIRELY UNSUPPORTED by the Ubuntu
  10. ## team. Also, please note that software in universe WILL NOT receive any
  11. ## review or updates from the Ubuntu security team.
  12. deb http://mirrors.163.com/ubuntu/ precise universe
  13. deb-src http://mirrors.163.com/ubuntu/ precise universe
  14. deb http://mirrors.163.com/ubuntu/ precise-updates universe
  15. deb-src http://mirrors.163.com/ubuntu/ precise-updates universe
  16.  
  17. ## N.B. software from this repository is ENTIRELY UNSUPPORTED by the Ubuntu
  18. ## team, and may not be under a free licence. Please satisfy yourself as to
  19. ## your rights to use the software. Also, please note that software in
  20. ## multiverse WILL NOT receive any review or updates from the Ubuntu
  21. ## security team.
  22. deb http://mirrors.163.com/ubuntu/ precise multiverse
  23. deb-src http://mirrors.163.com/ubuntu/ precise multiverse
  24. deb http://mirrors.163.com/ubuntu/ precise-updates multiverse
  25. deb-src http://mirrors.163.com/ubuntu/ precise-updates multiverse

u盘安装ubuntu server系统

在网上找了很多教程,都不起效,提示:“从光盘上读取数据出错”。
总结出了几个关键点。
首先,版本,Ubuntu 12.04 Server,一般的U盘安装都会报:“从光盘上读取数据出错”。如果是桌面版(Desktop),则可以正常安装。
其次,ISO转化成U盘的安装工具,选择win32diskimager,其他工具都会转化的时候可以正常制作成功,但是在安装过程会报:“从光盘上读取数据出错”。在这两个点上面,我折腾了很久,用了很多尝试方法,包括:
无光驱U盘安装 ubuntu server 12.04.1 跳过光驱检测的方法
完成之后打开U盘目录下的isolinuxsyslinux.cfg,将default vesamenu.c32注释为 # default vesamenu.c32
按了F6后面有启动参数添加栏,在后方输入:install cdrom-detect/try-usb=true 并回车,进入安装
以上这些方法都是坑爹的。
只需要选择win32diskimager制作U盘安装程序,就可以正常安装Ubuntu 12.04 Server。
win32diskimager是一款绿色软件,无需安装。解压后运行exe文件即可,界面如下:
Ubuntu
文本框用来输入文件完整地址,后面的文件夹图标是浏览窗口,默认只能识别img文件。只需要将iso文件全路径输入在Image File中。
填好镜像的完整地址后右边有个下拉列表用来选择移动设备,千万别选错了!建议只插一个U盘,以免误操作。
之后点击Wirte按钮就开始写入了。写入后重启,从U盘启动就可以进入Ubuntu 12.04 Server安装程序了!
转自:http://www.xiaoyaochong.net/wordpress/?p=137

开启tomcat状态页面

1、用户设置
先进入Tomcat/conf/tomcat-users.xml 创建一个新的角色,如:

  1. <role rolename="jkb"/>

并创建一个用户,把刚才创建的角色分配给此用户,如

  1. <user username="jkb" password="jkb” roles="jkb"/>

2、安全设置
然后进入tomcat/webapps/manager/WEB-INF/web.xml为刚才新建角色添加权限(仅具有访问状态页的权限),如:

  1. <security-constraint>
  2. <web-resource-collection>
  3. <web-resource-name>Status interface</web-resource-name>
  4. <url-pattern>/status/*</url-pattern>
  5. </web-resource-collection>
  6. <auth-constraint>
  7. <role-name>jkb</role-name>
  8. <role-name>manager-gui</role-name>
  9. <role-name>manager-script</role-name>
  10. <role-name>manager-jmx</role-name>
  11. <role-name>manager-status</role-name>
  12. </auth-constraint>
  13. </security-constraint>

然后重启Tomcat。访问状态页校验是否生效。
提示:此步的web.xml,如果是ubutnu系统,则在/usr/share/tomcat-admin/manager/WEB_INF/web.xml。

tar增量备份

现在我们来展示一个使用tar工具来增量备份的例子。

一、增量备份

1、新建backup目录,里面新建file1,file2,file3文件

  1. mkdir backup/
  2. touch backup/{file1,file2,file3}

2、进行完整备份

  1. tar -g tarinfo -czf backup-full.tar.gz backup/

3、新增文件到backup

  1. touch backup/file4

4、进行增量备份

  1. tar -g tarinfo -czf backup-incre1.tar.gz backup/

5、查看增量备份文件

  1. tar -ztf backup-incre1.tar.gz

二、进行还原

1、删除backup目录

  1. rm -rf backup/

2、执行还原操作

  1. tar xzf backup-full.tar.gz
  2. tar xzf backup-incre1.tar.gz

现在已经完成tar的还原操作。其它tar的增量备份只需要指定-g参数,tarinfo文件则是用来记录备份的一些信息。

ubuntu安装mongodb数据库服务器

1、mongodb安装

  1. sudo apt-key adv –keyserver keyserver.ubuntu.com –recv 7F0CEB10
  2. sudo echo "deb http://downloads-distro.mongodb.org/repo/ubuntu-upstart dist 10gen" > /etc/apt/sources.list.d/10gen.list
  3. sudo apt-get update
  4. sudo apt-get install mongodb-10gen

2、mongodb管理

  1. 启动:sudo /etc/init.d/mongodb start
  2. 关闭:sudo /etc/init.d/mongodb stop

ubuntu网络配置

一、dhcp自动获取IP

编辑/etc/network/interfaces

  1. auto lo                                       # 开机自动激lo接口
  2. iface lo inet loopback                        # 配置lo接口为环回口
  3. # The primary network interface (配置主网络接口)
  4. auto eth0                                     #开机自动激活eth0接口
  5. iface eth0 inet dhcp                          #配置eth0接口为DHCP自动获取

重启网络:

  1. sudo /etc/init.d/networking restart

二、配置静态IP

编辑/etc/network/interfaces

  1. # The loopback network interface(配置环回口)
  2.   auto lo                                       # 开机自动激lo接口
  3.   iface lo inet loopback                        # 配置lo接口为环回口
  4.   # The primary network interface (配置主网络接口)
  5.   auto eth0                                     #开机自动激活eth0接口
  6.   iface eth0 inet static                        #配置eth0接口为静态设置IP地址
  7.   address 10.16.3.99
  8.   netmask 255.255.255.0
  9.   gateway 10.16.3.1

重启网络:

  1. sudo /etc/init.d/networking restart

ubuntu 11.10 安装apache2 tomcat6(ajp)

一、安装apache2

  1. sudo apt-get install apache2

启动两个代理模块:

  1. sudo a2enmod proxy_ajp
  2. sudo a2enmod proxy

二、安装tomcat6

  1. sudo apt-get install tomcat6

三、安装sun-java6-jdk

  1. sudo apt-get install python-software-properties
  2. sudo add-apt-repository ppa:ferramroberto/java
  3. sudo apt-get update
  4. sudo apt-get install sun-java6-jdk

四、整合配置

1、打开/etc/apache2/sites-enabled/000-default,增加:

  1. ProxyPass / ajp://127.0.0.1:8009/
  2. ProxyPassReverse / ajp://127.0.0.1:8009/

2、打开/etc/tomcat6/server.xml,找到:

  1. <Host name="localhost" appBase="webapps"
  2.        unpackWARs="true" autoDeploy="true">

后面添加如下内容:

  1. <Context path="" docBase="/var/www" debug="0" reloadable="true" />

3、设置环境变量

  1. JAVA_HOME=/usr/lib/jvm/java-6-sun
  2. sudo echo "JAVA_HOME=/usr/lib/jvm/java-6-sun" >>/etc/environment
  3. /etc/environment

4、添加tomcat ajp支持
在/etc/tomcat6/server.xml中找到:

  1. <!–
  2.     <Connector port="8009" protocol="AJP/1.3" redirectPort="8443" />
  3.     –>

删除注释。

五、测试

可以下载jsp的探针测试:
http://devops.webres.wang/wp-content/uploads/2012/11/p.jsp.zip