实现多篇文档的词频统计,输入到另一个新的文档里面,并且能够打印出该词来自于哪篇文档。
python有个软件包nltk http://www.nltk.org/ ,这里有很多的语言处理工具,估计可以帮到你
使用python的列表等就可以实现,参考 http://code.activestate.com/recipes/576699-python-word-frequency-count-using-sets-and-lists/
http://www.cnblogs.com/killbug/archive/2012/09/02/2668007.html
希望能帮助到你