为什么要写这本书
在我做数据分析培训和咨询的过程中,经常会有学员来问我,有没有合适的统计分析方面的参考书可以推荐。被学员问得多了,慢慢地就有了写本书的冲动,一是毕竟自己写的书和培训的内容比较配套,二是写书对自己来说也是一个总结和提高的过程吧。
“理想很丰满,现实很骨感”,原来觉得自己手里有不少案例,各种工具的使用也算是比较熟练,写起书来应该得心应手,进度也会比较快,但是真到开始动手写作时,才发现并不是那么简单。从框架目录的确定、章节内容的选择、语言风格的打磨,到分析结果截图的选择等,每一个环节都需要细细地思量和斟酌。这本书的写作使我从2016年4月到11月的这段时间非常疲劳,颈椎病也复发了,因为在写书的同时,我的数据分析方面的培训并没有停止。
我在写作本书的时候,给自己规定了几个原则:
一是要实用,要能够解决企业工作中的实际问题。二是要尽可能地降低读者上手的难度,那种操作非常繁复、需要强大坚实的统计分析理论基础,或者需要编程才能实现的功能,我都没有放在本书中。原因很简单,即使本书讲了那些难度比较大的内容,读者也很难真正应用起来。
三是语言风格尽可能轻松活泼一点,尽量避免很严肃、很晦涩的专业术语,我很难做到“寓教于乐”,但还是尽己所能让本书的阅读轻松一点吧。
在本书的写作过程中,我经常提醒自己这三条原则,并且要求自己遵守它们。
简言之,给读者带来一本“有用的、上手比较容易的、读起来比较轻松的”数据分析书,这就是我写这本书的原则和动力。
[第1章 什么是数据分析1.1 一眼就看到结论还需要数据分析吗](https://yq.aliyun.com/articles/118532/)1.1.1 企业数据量1.1.2 数据复杂度1.1.3 数据颗粒度1.2 数据分析能给我们带来什么1.2.1 了解数据的整体状况1.2.2 快速查询数据1.2.3 数据之间关系的探索1.2.4 业务预测1.3 数据分析的几大抓手1.3.1 足够多的数据1.3.2 数据质量1.3.3 合适的工具1.3.4 分析结果的呈现1.4 数据分析的流程1.4.1 数据采集1.4.2 数据整理1.4.3 制表1.4.4 数据分析1.4.5 数据展示(呈现)1.5 如何成为数据分析高手1.5.1 “拳不离手,曲不离口”1.5.2 熟练掌握常用工具1.5.3 最好能编点程序1.5.4 一定要通晓业务[第2章 数据分析的理论、工具、模型2.1 基本概念和术语](https://yq.aliyun.com/articles/118578/)2.1.1 基本概念2.1.2 术语2.2 选择称手的软件工具2.2.1 EXCEL2.2.2 VBA2.2.3 Access2.2.4 SPSS2.2.5 XLSTAT2.2.6 Modeler2.2.7 R语言2.3 在分析需求和模型之间搭起桥梁2.3.1 识别需求2.3.2 分解需求2.3.3 选择工具和模型[第3章 数据采集与整理3.1 数据采集的几条重要原则](https://yq.aliyun.com/articles/118590/)3.1.1 要足够“复杂”3.1.2 要足够“细”3.1.3 要有“跨度”3.1.4 要有可行性3.2 用“逐步推进法”推测需要的数据3.3 耗时耗力的数据整理过程3.3.1 重复、空行、空列数据删除3.3.2 缺失值的填充和分析3.3.3 数据间逻辑的排查3.4 数据量太大了怎么办3.4.1 放到数据库中处理3.4.2 用专业工具处理3.4.3 数据抽样