首页 新闻 会员 周边

一个需求,通过读取日志文件.txt 来获得,来获得ip session 访问时间 热点网页 访问轨迹

-1
悬赏园豆:160 [待解决问题]

日志格式 .txt

大概这样的

127.0.0.1 --【05/feb/2018:09:58 +0800】"post"  /login.do http/1.1 200 6339 http-bio-81-exec-10 2

127.0.0.1 --【05/feb/2018:09:58 +0800】"post"  /login.do http/1.1 200 6339 http-bio-81-exec-10 2

 

一条为一行,

而且数据量非常大 ,各位大神有何高见

(我的思路是 先一行一行读 然后 提取 关键字段 存数据库 然后更具 字段重复的多的排 热点网页 但是 访问轨迹 访问时间 一脸蒙蔽  )

哪个好心的人帮帮我 啊 我已经想了好久了

publicmain的主页 publicmain | 初学一级 | 园豆:10
提问于:2018-03-07 18:32

用哪个编程语言?

dudu 6年前
< >
分享
所有回答(2)
1
dudu | 园豆:30943 (高人七级) | 2018-03-07 20:39
0

假设是日志Append尾部:

读行ReadLine有现成的就不说了 —— 自己去抄出来;

但是在(这个函数中实现里面)读的时候记下Seek位置,从而把字节游标到达你的(可追溯位置)行游标。

如果是Insert的头部的更简单一些,只需要从Position=0读并记下长度(文件的总长度是变化的)。

花飘水流兮 | 园豆:13560 (专家六级) | 2018-03-08 14:32
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册