有以下文件
info.txt
, 想要读取其中的 fileVideoId, 组成一个列表后返回.
[{"source":1,"fileVideoId":10001,"videoId":"ks009182837mgsciro","materialId":190929}]
[{"source":1,"fileVideoId":10002,"videoId":"ks009182837mgsciro","materialId":190930}]
[{"source":1,"fileVideoId":10003,"videoId":"ks009182837mgsciro","materialId":190931}]
[{"source":1,"fileVideoId":10004,"videoId":"ks009182837mgsciro","materialId":190932}]
import json
json_path = "info.txt"
fileVideoIds = []
with open(json_path, 'r') as load_f:
lines = load_f.readlines()
for line in lines:
arr = json.loads(line)
for data in arr:
fileVideoIds.append(data.get('fileVideoId'))
print(fileVideoIds)
运行结果:
[10001, 10002, 10003, 10004]
我们知道在爬虫的过程中我们对于爬取到的网页数据需要进行解析,因为大多数数据是不需要的,所以我们需要进行数据解析,常用的数据解析方式有正则表达式,xpath,bs4。
这次我们来介绍一下另一个数据解析库–jsonpath,在此之前我们需要先了解一下什么是json。欢迎收藏学习,喜欢点赞支持。
一、初识Json
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后
在 Python 中获取 JSON 数据的值通常有两种方法:
使用 json 模块中的 loads() 函数将 JSON 字符串转换为 Python 字典, 然后使用字典访问方法获取值:
import json
json_data = '{"key": "value"}'
data = json.loads(json_data)
value = data['key']
print(valu...
思路就是:字符串是个json格式(或转为json格式),然后str转为字典dict,然后循环遍历按照key来取值。
你的data是个字典 然后item_list是data的Key ,item_list是个数组,这个里面的数组中的每个元素都是一个字典。
因此就是dict多级路径按key取值。
CondaSSLError: OpenSSL appears to be unavailable on this machine. OpenSSL is required to download an
10175