这个你让人来判断都不太准确,更别说机器了。感性的东西你认为计算机能理解吗?你问计算机这个女的漂亮吗?你认为它会以什么标准来告诉你呢?或许生物计算机可以解决这个问题,目前各国都在如火如茶的研究这个。
- -弄个粗话匹配字典,匹配率高于某个值,视为粗话。。。
当然这种需要加入语境判断。
这个我之前好像有看到过人提过一段,就是你需要匹配字典.
好坏话和中性字典各一个,然后加入语境判断,不过这个可能会比较复杂吧,估计得你自己一个一个去添加,或者能在网上找到资源是最好的.
但是判断也不是一定准的,你可能还需要将一些本来带有歧义的语句自己添加进去.
定义白名单、黑名单。名单中可以是字、词、句。同时要结合汉语语法的知识做一些推测性的判断,准确度稳定在一个比例即可
设定对应的词库,通过流行的匹配度算法,来识别。注意否定词...