《Python和HDF 5大数据应用》——导读

    xiaoxiao2024-03-09  129

    前 言

    过去的几年里,Python已经和IDL或MATLAB一样,成为科学分析领域值得信赖的选择。它拥有稳健的核心模块,可用于处理数值数组(NumPy)、分析 SciPy)以及绘图(matplotlib),同时还拥有十分丰富的专用模块。它能帮助人们减少编写科学代码的工作量,同时还能提高计算结果的质量。

    已经有越来越多的人将Python用于大型数值数据集处理,使用标准格式来进行数据的存储和通信也显得越来越重要。国家超级电脑应用中心(National Center for Supercomputing Applications,NCSA)开发的“层次性数据格式”(Hierarchical Data Format,HDF)的最新版本HDF5正迅速成为人们储存科学数据的选择。很多使用(或有意使用)HDF5的研究人员也被Python的易用性和快速开发能力吸引。

    本书向所有有Python数据分析基本背景的人介绍如何在Python下使用HDF5。本书假定读者只熟悉Python和NumPy。本书将侧重于HDF5的本地功能集,而不是Python的高层抽象,以尽力确保在本书建议下创建的HDF文件可移植。

    最后,本书将尽力同时支持Python 2和Python 3的用户。本书所有的示例都以Python 2写就,任何有可能导致误会的区别都将在文本中特别注明。

    目 录

    [第1章 简介1.1 Python和HDF5](https://yq.aliyun.com/articles/93496/)1.1.1 数据和元数据的组织1.1.2 大数据复制1.2 HDF5到底是什么1.2.1 HDF5文件规格1.2.2 HDF5标准库1.2.3 HDF5生态系统[第2章 开始使用2.1 HDF基本原理](https://yq.aliyun.com/articles/93559/)2.2 设置2.2.1 Python2还是Python32.2.2 代码示例2.2.3 NumPy2.2.4 HDF5和h5py2.2.5 IPython2.2.6 时间和优化2.3 HDF5工具2.3.1 HDFView2.3.2 ViTables2.3.3 命令行工具2.4 你的第一个HDF5文件2.4.1 使用环境管理器2.4.2 文件驱动2.4.3 用户块第3章 使用数据集第4章 让分块和压缩来帮忙第5章 组、链接和迭代:HDF5的层次性第6章 用特征存储元数据第7章 更多关于类型第8章 通过引用、类型和维度标尺来组织数据第9章 HDF5并发性:多线程和多进程第10章 下一步索引

    相关资源:Python and HDF5 无水印pdf
    最新回复(0)