import re
# 这是一个包含一些常见颜色的列表,你可以根据需要扩展它
colors = ["黑", "红紫", "红","白", "青绿色?"]
# 这是你要搜索的文档
document = "黑这是一个黑色的白猫,它有一双青绿色的大红眼睛;青绿的眼睛里透着红紫"
# 创建一个正则表达式,它会匹配任何颜色字词
regex = "|".join(colors)
print(regex)
# 使用正则表达式查找所有颜色字词
matches = re.findall(regex, document)
# 打印所有找到的颜色字词
for match in matches:
print(match)
问题就是不清楚总共有哪些?此外还要根据字词出现的位置进行排列分类。感到非常难搞。大哥,谢谢你
@等月亮爬上坡: 我感觉层主的回答很清晰,可以回答你的问题。然后你又另外提问了两个问题:
1、不清楚总共有哪些?
答:这个需要你在colors数组里自己添加,如果你是想让电脑帮你识别那种词是代表颜色的话,(我的认知里)要用机器学习。因为电脑并不能知道颜色这种东西,要么你和它说,要么它得有个方法知道,然后才能筛选。
2、还要根据字词出现的位置进行排列分类
答:不懂你的描述