赞
踩



1、点击Network,刷新页面,所有的加载资源会在左方出现
2、我们发现有一个【hotSearch】这个就是热搜的链接
3、点击下方的【{}】这个小图标,格式化一下json信息


如图所示请求成功

1、将返回数据(string)转为dict
2、经过分析发现热搜主要在一个列表里:
json.loads(url.text)['data']['realtime']3、获取
4、继续分析(大家可以继续分析,里面的分类还有很多,我这里就不分析了)

import json
import re
import openpyxl
import requests
from lxml import etree
wb = openpyxl.Workbook()
ws = wb.active
ws.append(['顺序','热搜分类','热搜关键词'])
url = requests.get("https://weibo.com/ajax/side/hotSearch")
# url.encoding= "gbk"
# print(url.text)
data = json.loads(url.text)['data']['realtime']
for i in data:
# print(i)
try:
print(f'热搜:{i["realpos"]}, 热搜分类[{i["category"]}], 热搜关键词:{i["word"]}')
ws.append([i["realpos"],i["category"],i["word"]])
except:
pass
wb.save("热搜.xlsx")
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。