# 读取数据
data = pd.read_excel('C:/Users/yyz/Desktop/python办公技巧/data/百度经纬度转高德.xlsx')
data.head()
wd = data['纬度'].tolist()
jd = data['经度'].tolist()
# 定义一个空列表
li1 = []
for i in range(len(data)):
j = bdToGaoDe(jd[i],wd[i])
li1.append(j)
data['经度_re'] = [i[0] for i in li1]
data['纬度_re'] = [i[1] for i in li1]
data.head()
5、Excel文件批量合并
5.1 工具包
# 导入工具包
import pandas as pd
import os
5.2 获取文件列表
# 设置文件路径
path = 'C:/Users/yyz/Desktop/python办公技巧/data/数据合并/'
# 空列表, 用于存放文件路径
files = []
for file in os.listdir(path):
if file.endswith(".xlsx"):
files.append(path+file)
# 查看列表
files
5.3 转换存储数据
# 定义一个空的dataframe
data = pd.DataFrame()
# 遍历所有文件
for file in files:
datai = pd.read_excel(file)
datai_len = len(datai)
data = data.append(datai) # 添加到总的数据中
print('读取%i行数据,合并后文件%i列, 名称:%s'%(datai_len,len(data.columns),file.split('/')[-1]))
# 查看是否全部读取,格式是否出错
# 重置索引
data.reset_index(drop=True,inplace=True)
6、Word文件批量转pdf
只能转docx文件,转doc文件会报错, 工具包安装
pip install docx2pdf
6.1 导入工具包
# 安装工具包:
# 导入工具包
from docx2pdf import convert
import os
# 文件位置
path = 'C:/Users/yyz/Desktop/python办公技巧/data/word转pdf/'
# 定义空list,存放文件列表
files = []
for file in os.listdir(path):
if file.endswith(".docx"):
files.append(path+file)
files
for file in files:
convert(file,file.split('.')[0]+'.pdf')
print(file+'转换成功')
import pandas as pd
import os
os.chdir('C:/Users/yyz/Desktop/python办公技巧/data/word信息/')
lis1=[]
for file in os.listdir('.'):
if file.endswith('.docx'):
doc = docx.Document('./'+file)
biaoges = doc.tables
rowi = len(biaoges[0].rows)
for i in range(1,rowi):
lis1.append([biaoges[0].cell(i,0).text,
biaoges[0].cell(i,1).text,
biaoges[0].cell(i,2).text,
biaoges[0].cell(i,3).text,
biaoges[0].cell(i,4).text])