Python数据分析入门（pdf+epub+mobi+txt+azw3）

推荐书计算机/网络类电子书 2019-12-06 1.58 K 0 Python

3 数据的存取与清洗

学习目标

● 掌握TXT、CSV、XLSX、JSON文件的存取，以及使用Python操作MySQL

数据库的知识

● 掌握pandas、NumPy的基本用法，并学习使用pandas进行数据的清洗

● 学习在数据处理中使用自定义日志文件记录操作

3.1 数据存取

这里重点讨论数据的存储问题。因为存储数据是为了利用数据进行建模分析，那么选择恰当的数据存储方式会使得数据的提取更加方便快捷。本书将利用Python内建（built-in）的函数介绍基本的文件操作，利用第三方库对CSV、TXT、JSON、XLSX等格式的文件进行存储，以及利用Python操作MySQL数据库。

3.1.1 基本文件操作

相信了解Python基础语法的读者都知道文件操作涉及open函数，那么先从open函数开始吧。如果忘记open函数的用法了，怎么办？其实淡忘是正常的，即使是熟练的程序员有时候也会忘记函数的用法。这时候应该首先尝试查看帮助文档而不是上网查用法。学习查看帮助文档也是一项可以让我们受益很多的技能。下面尝试一下，熟悉查看帮助文档的读者可以跳过这段。

这里使用IPython交互界面进行测试（建议使用IPython，在Spyder和PyCharm内部均可使用，Ubuntu下直接在终端输入 ipython 即可），当然在Python自带的IDLE的交互界面亦可，不建议直接在Windows终端上操作。

输入：help（open）或者print（open.__doc__）

运行输出如下（这里分段解释）。

首先是一行提示信息，该信息表示这是关于属于io模块内建函数open的帮助文档。之后就是 open 函数的参数列表。在查看参数列表时，要注意只有 file是必须的参数，其他参数是可选的，即使不输入它们也都有默认值。再往后，介绍open的功能以及失败时的报错信息。

声明：

推书365展示内容收集于网络，仅用于免费的知识分享交流和学习！版权归出版方所有。

如有侵权，请联系本站进行删除，感谢您的理解与包容！

如果您喜欢本站推荐书籍等资源，请支持购买正版，谢谢合作！