Python数据分析“数据分析是Python的杀手锏。”
——佚名
数据分析在自然科学、生物医学和社会科学领域有着悠久的历史。目前,如雷贯耳的大数据虽然尚没有严格的定义,但是它对数据分析工作的影响是毋庸置疑的。下面列举几个与大数据相关的趋势。
世界人口持续增长。
越来越多的数据被搜集和存储。
电脑芯片集成的晶体管数量不可能无限增长。
政府、科学界、工业界和个人对数据洞察力的需求与日俱增。
随着数据科学的炒作,数据分析也呈现流行之势。与数据科学类似,数据分析也致力于从数据中提取有效信息。为此,我们需要用到统计学、机器学习、信号处理、自然语言处理和计算机科学领域中的各种技术。
在http://www.xmind.net/m/WvfC/页面上,可以找到一幅描绘与数据分析相关Python软件的脑图。首先要知道的是,Python生态系统已经非常完备,具有诸如NumPy、SciPy和matplotlib等著名的程序包。当然,这没有什么好奇怪的,因为Python自1989年就诞生了。Python易学、易用,并且与其他程序设计语言相比语法简练,可读性非常强,即使从未接触过Python的人,也可以在几天内掌握该语言的基本用法,对熟悉其他编程语言的人来说尤其如此。你无需太多的基础知识,就能顺畅地阅读本书。此外,关于Python的书籍、课程和在线教程也非常多。
第1章 Python程序库入门 1.1 本书用到的软件1.2 从源代码安装NumPy、SciPy、matplotlib和Ipython1.3 用setuptools安装1.4 NumPy数组1.5 一个简单的应用1.6 将IPython用作shell1.7 学习手册页1.8 IPython notebook1.9 从何处寻求帮助和参考资料1.10 小结第2章 NumPy数组 2.1 NumPy数组对象2.2 创建多维数组2.3 选择NumPy数组元素2.4 NumPy的数值类型2.5 一维数组的切片与索引2.6 处理数组形状2.7 创建数组的视图和拷贝2.8 花式索引2.9 基于位置列表的索引方法2.10 用布尔型变量索引NumPy数组2.11 NumPy数组的广播2.12 小结第3章 统计学与线性代数第4章 pandas入门第5章 数据的检索、加工与存储第6章 数据可视化第7章 信号处理与时间序列第8章 应用数据库第9章 分析文本数据和社交媒体第10章 预测性分析与机器学习第11章 Python生态系统的外部环境和云计算第12章 性能优化、性能分析与并发性附录A 重要概念附录B 常用函数附录C 在线资源
相关资源:敏捷开发V1.0.pptx