今天尝试使用selenium爬取一个动态加载的网站,可是爬取到的还是它的js脚本,而不是F12后得到的html,这是为什么呢?
from selenium import webdriver
import time
brower = webdriver.Chrome()
brower.get('http://m.taduo.net/manhua/2/8.html')
time.sleep(5)
#res = brower.find_element_by_id('manga')
print(brower.page_source)
brower.close()
你可以看看美团,页面就js。
sleep 很不科学,你可以注入js,等js load后 执行自己的代码。
可以实现主动注入js吗,不好意思哈,我对web不太熟悉
@火腿烧豆腐: 别说注入,你能想到的以及你没想到的方式都可以。
@花飘水流兮: 谢谢