从逻辑上来说,
第一段 AABBCCDD
第二段 AABCCDDE
他有以下几种可能
1、删除第3字符,在后面添加符E
2、将第4字符修改为C,第6字符修改为D,第8字符修改为E
当然还有其他可能,所以逻辑上是没有一个唯一合理的判断,最多只能从几种可能里面选择一种
你是无法从结果判断过程中,是删除再添加,还是修改。
我所说的字符串是以句子为单位的。
AABB.CCDD.
AABB.EE.FF.
正则表达式找出修改版多出的,少的,不同的。表达式具体怎么写我也不会。估计得花点功夫了
以参考下LCS之类的算法实现找到最长公共子序列,然后对比两个串,不过就像楼上说的,这个并没有一个唯一合理的判断,可能存在好几种办法来完成这个修改
ps:貌似知乎有这个功能?不知道他们怎么做的