首页 新闻 会员 周边
2
回答数

待解决问题 100 中国商标网 Python爬虫

URL= 'http://wsjs.saic.gov.cn/txnS02.do?locale=zh_CN&y7bRbP=Kao8raqIoSZIoSZIouBePpcafi7L9gdd4rAz7BGJ
1
回答数

待解决问题 5 scrapy 抓取到的内容是一段一段的,不是整体

示例页面: finance.eastmoney.com/news/1345,20181129995332038.html item['Content'] = response.xpath('//div
2
回答数

待解决问题 15 python不能导入模块

2个模块在同一个目录下,但是代码不能正常运行,提示不能引入模块,怎么回事呢?
3
回答数

已解决问题 5 请教关于爬虫提取非结构化数据的方法

网络爬虫,提取指定网页上的结构化数据,可以采用各种方法,自己编写爬虫,使用框架等。 那么提取网页上非结构化数据,要用什么方法呢?有人说用正则去匹配,但它不是非结构化的么?怎么用通用的方法去获取? 也可
3
回答数
9
回答数

待解决问题 初学IT应该看什么书?

初学IT,不知道应该看什么书,从看什么开始,大家给个推荐?????????????
4
回答数

待解决问题 200 Python获取下载PDF链接

网站产品页面:https://www.cn-abs.com/product.html#/detail/document 背景:这个网站需要注册登录,其中PDF文件需要付费下载,但是我有付费下载账号,可
2
回答数

回答被采纳 关于scrapy爬取数据保存为csv格式

各位大佬我想问一下,就是用scrapy框架爬取下来的数据想要保存为csv格式的文件,那个对应的pipelines模块怎么写呀,求大佬指点
2
回答数

回答被采纳 100 Python错误:Traceback (most recent call last):感觉是软件出了问题

首先粘贴代码: shopping={} key1=input('请输入要存入的商品名称:') value1=input('请输入商品的金额(数字):') if value1.isdigit(): va
1
回答数

回答被采纳 10 scrapy爬虫问题

代码: -- coding: utf-8 -- import scrapy from scrapy import Spider, Request class ZhihuSpider(Spider):
3
回答数

待解决问题 100 正则表达式 提取tr td之间的数据

<tr data-period="19001"> <td>19001</td> <td class="bd"></td> <td class="ball_brown" data-award="1" d
1
回答数

回答被采纳 scrapy无法下载图片 管道 也打开了pipelines.py 里定义的类,get_media_requests不重载

items也引入了 obj_item = XiaohuaItem() obj_item['name'] = name obj_item['src'] = src yield obj_item #set
1
回答数

回答被采纳 40 Pycharm一键安装依赖包

中午一不小心卸载了pycharm,重新装了,在项目底下通过 pip freeze > requests.txt把项目需要的依赖导出来了,在新的python3.5中执行pip3 install -r r
7
回答数

待解决问题 10 软件开发中有没有必要使用错误码?

有些系统中设计了错误码,当发生错误时直接返回错误码和错误消息. 我觉得返回错误消息,告诉错误的原因是必须的. 但是错误码的必要性在哪里呢?只是为了出现错误时根据错误码快速定位出错的地方吗?直接全局搜索
12
回答数

回答被采纳 园友们好,手腕被桌子磨得生疼怎么办?

如题,由于长期使用鼠标,手腕被磨得快秃噜皮了,园友们有这种情况吗?怎么处理的?
2
回答数

回答被采纳 Python selenium 获取到的cookie和自己查看的不一样?

用的get_cookies()方法获取到的cookie是这样的:[{u'domain': u'.weixin.***.com', u'secure': False, u'value': u'BBB25
1
回答数

待解决问题 50 Python爬虫,用scrapy框架和scrapy-splash爬豆瓣读书设置代理不起作用,有没有大神帮忙看一下,谢谢

用scrapy框架和scrapy-splash爬豆瓣读书设置代理不起作用,代理设置后还是提示需要登录。 settings内的FirstSplash.middlewares.FirstsplashSpi
4
回答数

待解决问题 100 求助!爬取json接口的数据,返回的数据不完整,但用浏览器中(如图)可以看到

爬取json接口的数据,返回的数据不完整,但用浏览器中(如图)可以看到 import urllib.request url='http://www.airbnb.cn/api/v2/explore_t
4
回答数

已解决问题 遇到一道python面试题,求解

求结果: v1 = 1 or 3 v2 = 1 and 3 v3 = 0 and 2 and 1 v4 = 0 and 2 or 1 v5 = 0 and 2 or 1 or 4 v6 = 0 or
3
回答数

待解决问题 50 python 小萌新遭遇AttributeError错误,求大神指点!

import pandas import csv import pandas as pd import numpy as np tweets=pd.read_csv('C:\Users\zhang\z
1
回答数

回答被采纳 50 用ssh-keygen生成的公钥和私钥如何在java中转为RSAPublicKey和RSAPrivateKey

公钥和私钥是用"ssh-keygen -t rsa"生成的,我把生成的公钥以字符串的形式传入下面的函数(从网上找的)就会报错。 public static PublicKey string2Publi
1
回答数

回答被采纳 cmd环境下运行python程序,导入pandas包发现报错importerror..

请教下,安装python后,环境变量也设置好了。用pip命令安装pandas和numpy 也都成功了。 但是在cmd环境下运行python命令,导入pandas包的时候,却报错: ImportErro
3
回答数

待解决问题 5 我爬到了图片url,但不知道如何保存,并给这些文件取个随机名字。

import requests url = 'https://www.pixiv.net/ranking.php?mode=daily' headers = {'User-Agent': 'Mozil
1
回答数

待解决问题 100 flask实现异步响应HTTP请求

最近做一个flask+selenium的模拟登录爬虫爬数据的接口;我这边需要提供一个HTTP的异步回调接口,具体来说就是公司php后台发送请求给我之后,我模拟登录判断登录是否成功,如果不成功返回一个状