山东省高中信息技术学业水平考试试题网 - 数据与计算|信息系统与社会|数据与数据结构|网络基础|数据管理与分析|移动应用设计|三维设计与创意|开源硬件项目设计|算法初步|智能系统初步

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 262|回复: 0
收起左侧

初学者想学数据分析,这五个Python库,简直就是为初学者量身定制

[复制链接]

260

主题

659

帖子

214748万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2147483647
QQ
发表于 2019-2-14 08:21:15 | 显示全部楼层 |阅读模式


如果你已经决定把Python作为你的编程语言,那么,你脑海中的下一个问题会是:"进行数据分析有哪些Python库可用?"

Numpy




对于科学计算,它是Python创建的所有更高层工具的基础。以下是它提供的一些功能:

1. N维数组,一种快速、高效使用内存的多维数组,它提供矢量化数学运算 。

2. 你可以不需要使用循环,就对整个数组内的数据行标准数学运算。

3. 非常便于传送数据到用低级语言(如C或C++)编写的外部库,也便于外部库以Numpy数组形式返回数据。

NumPy不提供高级数据分析功能,但有了对NumPy数组和面向数组的计算的理解,能帮助你更有效地使用像Pandas之类的工具。

Scipy




Scipy库依赖于NumPy,它提供便捷和快速的N维向量数组操作。SciPy库的建立就是和NumPy数组一起工作,并提供许多对用户友好的和有效的数值例程,如:数值积分和优化。SciPy提供模块用于优化、线性代数、积分以及其它数据科学中的通用任务。

Pandas




Pandas包含高级数据结构,以及和让数据分析变得快速、简单的工具。它建立在NumPy之上,使以NumPy为中心的应用变得简单。

1. 带有坐标轴的数据结构,支持自动或明确的数据对齐。这能防止由于数据没有对齐,以及处理不同来源的、采用不同索引的数据而产生的常见错误。

2. 使用Pandas更容易处理缺失数据。

3. 合并流行数据库(如:基于SQL的数据库)中能找到 的关系操作。

Pandas是进行数据清洗/整理(data munging)的最好工具。

Matplotlib




Matlplotlib是Python的一个可视化模块。它让你方便地制作线条图、饼图、柱状图以及其它专业图形。使用Matplotlib,你可以定制所做图表的任一方面。在IPython中使用时,Matplotlib有一些互动功能,如:缩放和平移。它支持所有的操作系统下不同的GUI后端(back ends),并且可以将图形输出为常见地矢量图和图形格式,如:PDF、SVG、JPG、PNG、BMP和GIF等。

Scikit-learn




Scikit-learn是一个用于机器学习的Python模块。它建立在Scipy之上,提供了一套常用机器学习算法,让使用者通过一个统一的接口来使用。Scikit-learn有助于你迅速地在你的数据集上实现流行的算法。

最后小编推荐一门对于初学者比较友好的一本数据分析书籍《利用Python进行数据分析》




关注后私信【数据分析】领取《利用Python进行数据分析》PDF书籍

  
山东省高中信息技术学业水平考试系统(山东省高中信息技术学考系统):https://pan.baidu.com/s/1pMNLBaZ5BHR92uPMCFtbZg

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
楼主热帖
+1
262°C
沙发哦 ^ ^ 马上

帖子地址: 

教书育人!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

百度一下 百度二下 百度三下 开门大吉

QQ|Archiver|手机版|小黑屋|山东省高中信息技术学业水平考试试题网 ( 鲁ICP备16049757号 )|网站地图

GMT+8, 2019-10-18 16:51 , Processed in 0.412542 second(s), 34 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表
潍坊行知学校信息技术交流QQ群:
潍坊行知学校信息技术
潍坊行知学校复读招生官方QQ群:
潍坊行知学校复读招生