招聘兼职:一个比较复杂的apache日志分析模块
招聘兼职
Golang完成一个Apache日志分析工具,日志格式是自定义的,分析的结果也是自定义的。
软件功能综述
根据配置文件解析日志配置文件类似ini,联系最后后发给你。
命令行参数
- 需要记录的信息有date、user、ip、filename(下载文件名)、unit(单位,有篇,期刊论文;集,视频;页,考试网页;)。
- filename有两类,一类是下载的文件名,这类是下载的pdf、caj、swf等文件;有时候是页面标题
- 同一个用户在30秒内(是interval参数指定的30s),下载同一篇文章或访问同一个页面,所一次有效记录。
- 默认解析日志时间范围为昨天一整天。
- 昨天的日志可能横跨两个文件log_2015-06-09.log和log_2015-06-10.log.(apache日志bug,6.9靠近23:55分之后的日志可能会写入到log_2015-06-10.log文件中)
参数:
- -n,—name 指定ini文件中的对应域,不指定解析所有存在的域
- -f,—file 指定单个日志文件
- -d,—dir 指定一个目录下的所有日志文件
- —date-start 指定开始日期,含开始日期,默认开始日期为昨天开始
- —date-end 指定结束日期,不含结束日期,默认结束日期为今天开始
- -s,—save-file 指定保存文件,指定了保存文件的,同时保存分析结果到文件,如果是search类,保存文件名在加上search_,例如-s mylog.log,search类就是search_mylog.log
- -q,—save-sql true或者false,表明是否保存到数据库
- -p,—postfix 域名后缀,例如com
原始日志中的域名,有些是带有后缀的,如www.163.com解析日志的时候,如果有域名后缀,就把域名后缀去掉。仅保留www.163。
以上部分功能,具体功能联系后发给您
价格面议,联系方式:26365685# $qq.com
共 0 个回复