在编程数据处理时,经常能碰到多级包含多类型的字典,例如下图:
客户要求取到所有根部key,value并写入DataFrame中,下面用我的方法来实现:
#新建存放key,value的数组
data = []
#重名计数变量
name_count=1
other_count=1
#取到字典
A=eval(response.text)
d=A["data"]
#循环遍历字典
for k, v in d.items():
#print(k,v)
if isinstance(v, dict):
# 如果字典中的值是字典类型,继续判断是否数组
for sub_k, sub_v in v.items():
#print(type(sub_v))
if isinstance(sub_v, list):
#print(sub_v)
#如果时数组则循环数组
for sub_1_lst in sub_v:
#判断数组中的字典类型
if isinstance(sub_1_lst, dict):
#print(list(sub_v[0].keys()))
#继续循环遍历数组中的每个字典
for sub_1_k, sub_1_v in sub_1_lst.items():
#print(sub_1_k, sub_1_v)
#以下时重名判断,根据需要自定义
if sub_1_k=="name" :
data.append(( sub_1_k+str(name_count), sub_1_v))
name_count+=1
elif sub_1_k=="riskPremSum":
data.append(( sub_1_k+str(other_count), sub_1_v))
other_count+=1
else:
data.append(( sub_1_k, sub_1_v))
#如果不是字典则再次判断是否时数组
elif isinstance(v, list):
# 如果字典中的值是列表类型
for i, item in enumerate(v):
print(i,item)
#继续循环遍历数组中的每个字典
if isinstance(item, dict):
# 如果列表中的元素是字典类型,
for sub_k, sub_v in item.items():
#以下时重名判断,根据需要自定义
if sub_k=="name" :
data.append((sub_k+str(name_count), sub_v))
name_count+=1
elif sub_k=="riskPremSum":
data.append((sub_k+str(other_count), sub_v))
other_count+=1
else:
data.append((sub_k, sub_v))
else:
data.append((k + '.' + str(i), item))
#如果非字典非数组则直接写入
else:
if k=="name" :
data.append((k+str(name_count), v))
name_count+=1
elif k=="riskPremSum":
data.append((k+str(other_count), v))
other_count+=1
else:
data.append((k, v))
结果
写入DataFrame
df=pd.DataFrame({"a":[]})
for ss in data:
#print(ss)
df.loc[0,ss[0]]=ss[1]
df
以上是我个人的笨方法,整体思路就是逐级读取判断,弊端就是字典的层数少,chatGPT给我的是递归方法,我没太理解,同学们如果还有更好的方法欢迎指导,谢谢!