《数据科学家修炼之道》一2.4 要点

    xiaoxiao2024-07-12  111

    本节书摘来异步社区《数据科学家修炼之道》一书中的第2章,第2.4节,作者: 【美】Zacharias Voulgaris(弗格里斯)译者: 吴文磊 , 田原 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

    2.4 要点

    数据科学的历史比人们通常想象得要悠久,然而,直到上一个10年(2000~2010年)才得以落地。Drew Conway在2010年9月创作的著名的韦恩图,有效地总结了数据科学的本质。数据科学带来了许多新规则,它们改变了我们传统处理数据的方式,主要有如下几个。 MapReduce。 Hadoop分布式文件系统(HDFS)。 高级文本分析。 大规模数据编程语言(如Pig、R、ECL等等)。 替代性数据库结构(如HBase、Cassandra、MongoDB等等)。数据科学的规则转变了我们处理数据的手段,而这对我们的生活产生了巨大的影响。正如它带来对处理大数据有至关重要价值的新思维一样。数据科学的提升带来的新思维,同样带来了数据科学家的职业生活和他与人相处的新变化。 相关资源:敏捷开发V1.0.pptx
    最新回复(0)