1. 程序or脚本每天定时扫描源目录
源目录中有类似如下的用户信息文件
user_info_20120710.txt.Z
user_info_20120711.txt.Z
user_info_20120712.txt.Z
user_info_20120713.txt.Z
。。。
。。。
用户信息文件为打包格式,带后缀.Z,文件命名规则为user_info_YYMMDD.txt.Z
YY为年份后两位,MM为月,DD为日期。
用户信息文件的每一行为一个用户的信息。
2. 如果有新增日期的用户信息文件,解压之,保存到目的目录,在目的目录下以日期来创建子目录,将用户信息文件保存在此目录下。
3. 需要程序or脚本可配置按记录数将原始的已解压的用户信息文件拆分为多个子文件,生成的用户信息文件命名规则如下:YYYYMMDD.XXXXXX.txt,XXXXXX为子用户信息文件序号,从0到999999。
(注:user_info_YYMMDD.txt.Z是百千万行数量级的)
要求:
1.请基于linux操作系统,用C程序和SHELL脚本分别实现上述功能。(优先使用C程序编写)
2.源目录和目的目录可配置,子文件的行数可配置。
3.如果用C程序实现,考虑到文件多,且比较大,请用多线程原理,并用makefile编译。(配置请单独放到配置文件中)
4.如果SHELL脚本实现,请设置成定时任务,并编写安装手册。(内容包括如何设置定时任务,如何使用脚本,脚本所带参数的含义)
这个看起来不是一个具体的技术问题,而是一个项目需求,您可以到智城(taskcity.com)之类的外包网站发包。