python--爬虫--获取和解析存储网页内容--以薄荷网为例（7）

论坛元老

Rank: 8 Rank: 8

UID: 1066743

1^#

打印

字体大小: tT

look_w发表于 2019-5-16 15:02 | 只看该作者

python--爬虫--获取和解析存储网页内容--以薄荷网为例（7）

requests实例
实例1：京东商品页面的爬取

现在我们利用requests库爬取京东的商品信息

首先引入requests库

import requests

复制代码然后爬取页面

r =requests.get("https://item.jd.com/4645290.html")

复制代码然后我们测试状态码,编码和内容

r.status_code
r.encoding
r.text[:1000]

可以看到输出了获取到的页面内容前1000个字符。

到此，说明我们已经成功利用requests库获取到了商品页面的信息。

完整的爬取代码

import requests
url = "https://item.jd.com/4645290.html"
try:
r = requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
print(r.text[:1000])
except:
print("爬取失败")

收藏分享评分

回复引用

订阅 TOP

返回列表