Pandas数据导入与保存

2025-05-14 | 开发

文章目录

1. 数据导入
2. 数据保存

目的：

数据导入：excel, csv文件
数据导出
基本统计
缺省数据处理

数据导入

数据是分析基础，实际工作中，数据来自于企业内部数据，网络数据，开源数据集；

方法	说明
`pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, ...)`	读取CSV文件
`pd.read_excel(io, sheet_name=0, names=None, index_col=None, usecols=None, ...)`	读取Excel文件
`pd.read_json(path_or_buf=None, orient=None, typ='frame', dtype=None, ...)`	读取JSON文件

读取excel文件

import pandas as pd
import numpy as np
# 读取excel文件
fpath = r'data\test.xlsx'
pdata = pd.read_excel(fpath)
pdata

读取csv文件

# 读取csv文件
fpath = r'data\GDP.csv'
pdata = pd.read_csv(fpath, encoding='gbk')
pdata

导入csv指定列

# 导入指定列
fpath = r'data\GDP.csv'
pdata = pd.read_csv(fpath,usecols = ['Country Name','1990'], encoding='gbk')
pdata

导入csv指定表头

# 导入指定表头
fpath = r'data\GDP.csv'
pdata = pd.read_csv(fpath,header=1, encoding='gbk')
pdata

csv无表头指定None

1
2
3

# 无表头指定None
pdata = pd.read_csv(fpath,header=None, encoding='gbk')
pdata

数据保存

# 保存文件
import pandas as pd
import numpy as np
# 读取excel文件
fpath = r'data\GDP.csv'
csv_path1 = r'data\new_GDP_1.csv'
csv_path2 = r'data\new_GDP_2.csv'
csv_path3 = r'data\new_GDP_3.csv'
pdata = pd.read_csv(fpath, encoding='gbk')
# 保存格式带索引
pdata.to_csv(csv_path1)
# 保存格式不带索引
pdata.to_csv(csv_path2, index=False)
# 保存格式不带索引,保存指定列
pdata.to_csv(csv_path3, index=False, columns=['1990','1991'])