首先要处理的txt数据格式如下:
1 2012-02-27 17:42:32 1 2012-02-27 17:36:00 1 2012-02-27 17:09:28 1 2012-02-27 17:36:33 1 2012-02-27 17:35:50 2 2012-02-27 20:52:04 2 2012-02-27 17:50:12 2 2012-02-27 19:52:00 2 2012-02-27 15:52:12 2 2012-02-27 16:49:30 2 2012-02-27 22:50:15 2 2012-02-27 13:50:11 2 2012-02-27 15:49:30 3 2012-02-27 20:32:16 3 2012-02-27 21:55:12 3 2012-02-27 21:43:29 3 2012-02-27 19:40:07
……
数据分两列,第一列是id编号,第二列为日期时间datetime,数据量有15w行左右。
要求:将根据id编号将datetime进行分组存放,然后按照时间大小进行排序。比如说id为1的时间有5行,需要将这5行时间数据进行排序。
请问下使用什么容器可以做到,我设想将每一列分别存放为一个List,但是两个表的对应关系不知道怎么处理,希望有过经验的朋友指导下,谢谢!
15W要一次性全部取出来?
不用一次,可以分批处理。每个id对应的时间排序完成后,进行相邻时间间隔运算,把结果保存就行了。
实现了,逐行读取,进行简单的判断,然后用一个SortSet存储每个id对应的datetime。