首页 新闻 搜索 专区 学院

python bs4爬取

0
悬赏园豆:50 [已解决问题] 解决于 2020-07-17 20:11

想爬取这块的公司信息

九日超级无敌NB的主页 九日超级无敌NB | 初学一级 | 园豆:15
提问于:2020-07-17 14:52
< >
分享
最佳答案
0

url给我个,我直接帮你写好算了,先看看基础吧年轻人,楼上的先学点基础再教人
app.xml

<android.view.view class='android.view.view' content-des="识别">xx</android.view.view>
import bs4

data = open('app.xml','r',encoding='utf8').read()
soup = bs4.BeautifulSoup(data,'xml') #解析成xml对象
x = soup.find('android.view.view')  #获取对应标签    #find和find_all区别一个取第一个,一个取所有这里自己区别
print(x.get('content-des'))  #拿属性
#打印效果  识别

基础知识https://www.cnblogs.com/pythonywy/p/11134481.html

操作相关https://www.cnblogs.com/pythonywy/p/11308818.html

收获园豆:50
小小咸鱼YwY | 老鸟四级 |园豆:2547 | 2020-07-17 15:51

谢谢!但是我想爬取所有的话用find_all() 底下那个就报错了

九日超级无敌NB | 园豆:15 (初学一级) | 2020-07-17 20:58

已经解决啦谢谢٩(๑❛ᴗ❛๑)۶

九日超级无敌NB | 园豆:15 (初学一级) | 2020-07-17 21:45

@九日超级无敌NB: 好的,基础很重要,代码啥的都是小事

小小咸鱼YwY | 园豆:2547 (老鸟四级) | 2020-07-18 11:18
其他回答(1)
0

tag=soup.p['class']="android.view.View"
改为这样试试

Ctrl` | 园豆:2877 (老鸟四级) | 2020-07-17 15:12

支持(0) 反对(0) 九日超级无敌NB | 园豆:15 (初学一级) | 2020-07-17 16:52
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册