pandas 快速入门(三)

如何读取和写入表格数据?

pandas 快速入门(三)

希望分析泰坦尼克号乘客数据,该数据以 CSV 文件形式提供。

titanic = pd.read_csv("data/titanic.csv")
  • pandas 提供了 read_csv() 函数,用于将以 csv 文件形式存储的数据读取到 pandas DataFrame 中。pandas 开箱即用地支持许多不同的文件格式或数据源(csv, excel, sql, json, parquet 等),每种都带有 read_* 前缀。

读取数据后,请务必检查数据。显示 DataFrame 时,默认会显示前 5 行和后 5 行。

我想查看 pandas DataFrame 的前 8 行。

pandas 快速入门(三)

  • 要查看 DataFrame 的前 N 行,请使用 head() 方法,并将所需的行数(在此例中为 8)作为参数。

想查看最后 N 行吗?pandas 也提供了 tail() 方法。例如,titanic.tail(10) 将返回 DataFrame 的最后 10 行。

通过请求 pandas 的 dtypes 属性,可以检查 pandas 如何解释每个列的数据类型。

pandas 快速入门(三)

我的同事要求将泰坦尼克号数据转换为电子表格。

titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)

虽然 read_* 函数用于将数据读取到 pandas 中,但 to_* 方法用于存储数据。to_excel() 方法将数据存储为 Excel 文件。在此示例中,sheet_name 被命名为 passengers,而不是默认的 Sheet1。通过设置 index=False,行索引标签不会保存到电子表格中

记住

  • 通过 read_* 函数支持从多种不同文件格式或数据源将数据导入 pandas。
  • 通过不同的 to_* 方法提供将数据从 pandas 导出。
  • head/tail/info 方法和 dtypes 属性方便进行首次检查。
  • DataFrame 中的数据类型包括整数(int64)、浮点数(float64)和字符串(object)和整数(也称为 integer)等。
© 版权声明

相关文章

暂无评论

none
暂无评论...