当前位置:   article > 正文

Python 快速入门,读取excel-xlsx格式的表_python pandas 读取xlsx文件

python pandas 读取xlsx文件

1、下面是一张储存了数据的excel-xlsx格式的表,用python读取第3行到12行的数据,不要表头和表尾

2、注意时间需要设置为文本格式


3、准备python脚本和需要用到pandas库

当前python环境:3.9.11

下载第三方库:

pip install pandas

4、读取excel表格的python脚本

skiprows=1和iloc[:-1],分别代表读取指定excel的时候。跳过前一行,然后去掉最后一行,返回剩余的数据
  1. import pandas as pd
  2. def test_01():
  3. # lists=['学生成绩表.xlsx']
  4. # for i in lists:
  5. dfs = []
  6. # 从指定的Excel文件中读取数据,跳过前一行,然后去掉最后一行,返回剩余的数据。
  7. df = pd.read_excel('学生成绩表.xlsx', skiprows=1).iloc[:-1]
  8. dfs.append(df)
  9. combined_df = pd.concat(dfs, ignore_index=True)
  10. # 将合并后的 DataFrame 转换为列表
  11. combined_list = combined_df.values.tolist()
  12. # 输出合并后的列表
  13. print(combined_list)
  14. print(len(combined_list))

运行脚本后,读取到了第3行到12行的数据。被读取的表和脚本放在同一目录

5、把读取到的excel数据汇总到一张新表中且新表从指定行数第4行,插入数据

startrow=3代表数据从第4行开始插入
  1. import pandas as pd
  2. def test_01():
  3. # lists=['学生成绩表.xlsx']
  4. # for i in lists:
  5. dfs = []
  6. # 从指定的Excel文件中读取数据,跳过前一行,然后去掉最后一行,返回剩余的数据。
  7. df = pd.read_excel('学生成绩表.xlsx', skiprows=1).iloc[:-1]
  8. dfs.append(df)
  9. combined_df = pd.concat(dfs, ignore_index=True)
  10. # 将合并后的 DataFrame 转换为列表
  11. combined_list = combined_df.values.tolist()
  12. # 输出合并后的列表
  13. print(combined_list)
  14. print(len(combined_list))
  15. # 创建一个 DataFrame 对象
  16. df = pd.DataFrame(combined_list[1:], columns=combined_list[0])
  17. # 将df中的数据导出到名为:######.xlsx的Excel文件中,不包含索引,从文件的第4行开始写入数据。
  18. df.to_excel('学生成绩01.xlsx', index=False,startrow=3)
  19. test_01()

执行成功,生成的表中数据如下:

6、多张格式一样的表的数据合到一张新的excel表中

表2、表3

python脚本,采用的是for循环读取list集合里的表格
 

  1. import pandas as pd
  2. def test_01():
  3. lists=['学生成绩表.xlsx','学生成绩表2.xlsx','学生成绩表3.xlsx']
  4. dfs = []
  5. for file in lists:
  6. # 从指定的Excel文件中读取数据,跳过前一行,然后去掉最后一行,返回剩余的数据。
  7. df = pd.read_excel(file, skiprows=1).iloc[:-1]
  8. dfs.append(df)
  9. combined_df = pd.concat(dfs, ignore_index=True)
  10. # 将合并后的 DataFrame 转换为列表
  11. combined_list = combined_df.values.tolist()
  12. # 输出合并后的列表
  13. print(combined_list)
  14. print(len(combined_list))
  15. # 创建一个 DataFrame 对象
  16. df = pd.DataFrame(combined_list[1:], columns=combined_list[0])
  17. # 将df中的数据导出到名为:######.xlsx的Excel文件中,不包含索引,从文件的第4行开始写入数据。
  18. df.to_excel('学生成绩汇总.xlsx', index=False,startrow=3)
  19. test_01()

执行成功:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/817011
推荐阅读
相关标签
  

闽ICP备14008679号