# -*- coding: utf-8 -*-
# @Time : 2020/5/12 14:56
# @Author : 结尾!!
# @FileName: day01-将所有前3万的关键词汇总.py
# @Software: PyCharm
import pandas as pd
import os
def concat_file(file):
df_demo=pd.read_excel(f"./美国2019年后台6月至9月品牌分析数据/{file}",encoding='utf-8',header=None)
df_demo.head()
date_day='20'+df_demo.iloc[0,4][-7:-1]
df_demo.columns=df_demo.loc[1].values #重新定义列名称。
df_demo.drop(index=[0,1],axis=0,inplace=True) #在原有的数据基础上删除第一行和第二行的数据,axis=0 代表行,
df_demo["date_day"]=date_day
return df_demo[["搜索词","搜索频率排名","date_day"]][:30000]
file_list=os.listdir("./美国2019年后台6月至9月品牌分析数据")
if __name__ == '__main__':
dt = []
for each in file_list:
print(each)
df = concat_file(each)
dt.append(df)
df1 = pd.concat(dt).reset_index(drop=True)
df1.to_excel("63万条.xlsx", encoding="utf-8")