《数据整理实践指南》一导读

    xiaoxiao2024-04-18  13

    前 言

    数据整理实践指南本书使用的体例提示 这个图标代表小窍门、建议或一般注解。警告 这个图标代表警示或警告。代码范例的使用本书是帮助你完成工作的。一般说来,你可以在没有我们许可的情况下,在程序和文件里使用本书中的代码,除非你在重复创建代码中极为重要的一部分。比如说,写一段程序要用好几段本书中的代码,不需要经过许可。而销售或发布来自O’Reilly书籍中配套的CD-ROM是需要经过许可的。通过引用本书内容和代码示例回答问题不需经过许可。但将来自本书的大量代码示例合并到你的产品文档时,必须经过许可。

    如果能够标明引用的出处,我们将非常感激,但不做硬性要求。一个出处通常应包含题目、作者、出版社和国际标准图书编号(ISBN, International Standard Book Number)。例如:“Bad Data Handbook, Q. Ethan McCallum (Q’Reilly). Copyright 2013 Q. McCallum, 978-1-449-32188-8.”

    如果你认为代码示例的使用已超出正常使用的范围或者超出了上面的许可范围,请使用permissions@oreilly.com随时联系我们。

    Safari®图书在线图像说明文字   Safari 图书在线(www.safaribooksonline.com)是一种按需数字化图书馆。它提供的专业内容都来自科技和商业领域的世界顶级作者。既有书籍也有视频形式。

    技术专业人员、软件开发人员、网页设计师以及商业和创新型人才将Safari 图书在线作为他们研究、处理问题、学习和认证培训的首选。

    Safari图书在线为各种组织、政府机构和个人提供一系列的产品组合和计价程序。订阅者可以在完全可搜索的数据库中访问成千上万的书籍、培训视频以及出版前的手稿。这些数据库来自诸如O’Reilly Media、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Focal Press、Cisco Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones & Bartlett、Course Technology等的很多其他来源。如想了解更多关于Safari图书在线的内容,请在线访问。

    目 录

    第1章 从头说起:什么是噪音数据 第2章 是我的问题还是数据的问题 2.2 校验2.3 可视化2.4 小结第3章 数据是给人看的不是给机器看的第4章 纯文本中潜在的噪音数据第5章 重组Web数据第6章 检测撒谎者以及相互矛盾网上评论的困惑第7章 请噪音数据站出来第8章 血、汗和尿第9章 当数据与现实不匹配第10章 偏差和误差的来源第11章 不要把完美和正确对立起来:噪音数据真是噪音吗第12章 数据库攻击:什么时候使用文件第13章 卧库表,隐网络第14章 云计算神话第15章 数据科学的阴暗面第16章 如何雇佣机器学习专家第17章 数据的可追踪性第18章 社交媒体:是可抹去的印记吗第19章 揭秘数据质量分析:了解什么时候数据足够优质

    相关资源:数据整理实战指南.
    最新回复(0)