Board logo

标题: python--爬虫--获取和解析存储网页内容--以薄荷网为例(7) [打印本页]

作者: look_w    时间: 2019-5-16 15:02     标题: python--爬虫--获取和解析存储网页内容--以薄荷网为例(7)

requests实例
实例1:京东商品页面的爬取

现在我们利用requests库爬取京东的商品信息

首先引入requests库

import requests



复制代码然后爬取页面

r =requests.get("https://item.jd.com/4645290.html")



复制代码然后我们测试状态码,编码和内容

r.status_code
r.encoding
r.text[:1000]



可以看到输出了获取到的页面内容前1000个字符。

到此,说明我们已经成功利用requests库获取到了商品页面的信息。

完整的爬取代码

import requests
url = "https://item.jd.com/4645290.html"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取失败")




欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/) Powered by Discuz! 7.0.0