背景:
采用7Z的lzma2算法,
WPS表格内有1048575行相同的文字,比如:“合理”这个词汇,
将此表格复制1000个得到文件共5.02 GB
目的:
以不断复制和压缩的方式达到增加相同文字的词汇量遍数
操作:
第一次压缩:1000个WPS表格文件共5.02 GB压缩后为1.00 MB;
第二次压缩:将压缩包1.00 MB复制1000个共0.97 GB再次进行压缩后为409 KB ;
第三次压缩:将压缩包409 KB 复制2557个共0.99 GB再次进行压缩后为414 KB。
疑惑:
1.第N次压缩后,在不解压的情况下,表格内的“合理”这个词语的遍数是否会随着文件不断复制和压缩而增加这个词语的遍数?
2.此时不断复制后再进行压缩的体积不断变小,是否为正常?
3.第二、三次压缩后的原文件内容会变动吗?