首页 新闻 会员 周边

正则表达式,Python.re

0
[已解决问题] 解决于 2024-03-18 16:55

怎么用正则表达式去遍历一份·中文文档里所有有关颜色的字词?如黑。红,白,红紫,青绿这些?但是我找不到规律。求帮忙

等月亮爬上坡的主页 等月亮爬上坡 | 初学一级 | 园豆:110
提问于:2024-01-20 16:52
< >
分享
最佳答案
0
import re

# 这是一个包含一些常见颜色的列表,你可以根据需要扩展它
colors = ["黑", "红紫", "红","白", "青绿色?"]

# 这是你要搜索的文档
document = "黑这是一个黑色的白猫,它有一双青绿色的大红眼睛;青绿的眼睛里透着红紫"

# 创建一个正则表达式,它会匹配任何颜色字词
regex = "|".join(colors)
print(regex)

# 使用正则表达式查找所有颜色字词
matches = re.findall(regex, document)

# 打印所有找到的颜色字词
for match in matches:
    print(match)
奖励园豆:5
邪王暗焰 | 菜鸟二级 |园豆:436 | 2024-01-23 08:51

问题就是不清楚总共有哪些?此外还要根据字词出现的位置进行排列分类。感到非常难搞。大哥,谢谢你

等月亮爬上坡 | 园豆:110 (初学一级) | 2024-01-23 08:54

@等月亮爬上坡: 我感觉层主的回答很清晰,可以回答你的问题。然后你又另外提问了两个问题:
1、不清楚总共有哪些?
答:这个需要你在colors数组里自己添加,如果你是想让电脑帮你识别那种词是代表颜色的话,(我的认知里)要用机器学习。因为电脑并不能知道颜色这种东西,要么你和它说,要么它得有个方法知道,然后才能筛选。
2、还要根据字词出现的位置进行排列分类
答:不懂你的描述

AtanChen | 园豆:460 (菜鸟二级) | 2024-01-31 10:09
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册