自学Python：python中的OS模块与pickle模块

xiaoxiao2022-07-14 171

OS模块

OS就是Operating System的缩写，意为操作系统，这可是一个非常高大上的模块，因为在python中，对于文件系统的访问就是通过OS模块来实现的。我们所知道常用的操作系统就有Windows、Mac OS、Linux、UNIX等，这些操作系统底层对于文件系统的访问工作原理是不一样的，因此你可能就要针对不同的系统来考虑使用哪些文件系统模块，这样的做法是非常麻烦的，因为如果程序的运行环境一旦改变，你就要相应的去修改大量的代码来应付。

但是python是一种跨平台的语言，同样的源代码在不同的操作系统不需要修改就可以同样实现，有了OS模块，不需要关心什么操作系统下使用什么模块，OS模块会帮你选择正确的模块并调用。

下面是OS模块中关于文件/目录常用的函数的使用方法：

函数名使用方法getcwd()返回当前的工作目录chdir(path)改变当前工作目录listdir(path=’.’)列举指定目录中的文件名(‘.’表示当前目录，’..'表示上一级目录)mkdir(path)创建一个单层空目录，如果该目录已经存在则会抛出异常makedirs(path)递归的创建多层目录，如果内层目录已经存在则报错，('E:/a/b’和’E:/a/c’不会冲突)remove(path)删除文件rmdir(path)删除一个单层目录，如果目录非空则抛出异常removedirs(path)递归的删除一系列目录，从子目录到父目录逐层尝试删除，遇到非空目录抛出异常rename(old, new)重命名system(command)运行系统的shell命令以下是支持路径操作中常用到的一些定义，支持所有平台os.curdir指代当前目录 == (’.’)os.pardir指代上一级目录 == (’..’)os.sep输出操作系统特定的路径分隔符(在windows下为’\\’,Linux下为‘/’)os.linesep当前平台使用的行终止符(在Windows下为’\r\n’，Linux下为’\n’)os.name指代当前实用的操作系统(包括’posix’、‘nt’、‘mac’、‘os2’、‘ce’、‘java’)

1、getcwd() 有些情况下我们需要获得应用程序当前的工作目录(比如要保存临时文件),那么可以使用getcwd()函数获得：

>>> import os >>> os.getcwd() 'E:\\Program Files (x86)\\python37-32'

2、chdir(path)

>>> os.chdir('E:/a') >>> os.getcwd() 'E:\\a'

3、listdir(path = ‘.’) 有时候你可能需要知道当前工作目录下有哪些文件和子目录，那么listdir()函数可以帮你列举出来。path参数用于指定列举的目录，默认值是’.’，代表根目录，也可以使用’..'代表上一级目录：

>>> os.chdir('E:/Program Files') >>> os.listdir(path = '.') ['Tencent', 'YouKu']

os.listdir('./Tencent')

4、mkdir(path) mkdir()函数用于创建文件夹，如果该文件夹存在，则抛出FileExistsError异常： 5、makedirs(path) makedirs()函数可用于创建多层目录，用过linux系统的都知道，在linux中的话，要建立多层目录可以使用mkdir /A/B/C/D -p

>>> os.chdir('E:/a') >>> os.listdir() >>> ['B'] >>> os.makedirs('E:/a/A/B/C') >>> os.listdir('E:/a/') ['A', 'B'] >>> os.listdir('E:/a/A/B/') ['C']

6、remove(path)、rmdir(path)和removedirs(path) remove()函数用于删除指定的文件，注意是删除文件，不是删除目录。如果需要删除目录，则用rmdir()函数；如果要删除多层目录，则用removedirs()函数。

>>> os.chdir('E:/A/A/B/C') >>> os.listdir() ['test.txt'] >>> os.remove('test.txt') >>> os.listdir() [] >>> os.chdir('E:/A/A/B/') >>> os.listdir() ['C'] >>> os.rmdir('C') >>> os.listdir() [] >>> os.chdir('E:/A/') >>> os.removedirs('E:/A/A/B') >>> os.listdir() ['B']

7、rename(old, new) rename()函数用于重命名文件或者文件夹

>>> os.listdir() ['B'] >>> os.rename('B', 'TEST_DIR') >>> os.listdir() ['TEST_DIR'] >>> os.chdir('TEST_DIR') >>> os.listdir() ['C', 'test2.txt'] >>> os.rename('test2.txt', 'new_test.txt') >>> os.listdir() ['C', 'new_test.txt']

8、system(command) os模块的这个方法我个人感觉在linux系统中非常好用，在一些运维自动化脚本中用的非常频繁，当然在windows中也可以用，几乎每个操作系统都会提供一些小工具，system()函数用于使用这些小工具，她或使用相应的命令将这些工具调出来，比如说windows中的计算器，在dos窗口我们需要使用calc命令调出，因此，在python中我们可以使用system()函数调用计算器

>>> os.system('calc')

9、walk(top) 最后是walk()函数，这个函数在有些时候确实非常有用，可以省去很多麻烦。该函数的作用是遍历top参数指定路径下的所有子目录，并将结果返回一个三元组(路径，[包含目录]，[包含文件])。看一下下面的例子：

>>> os.getcwd() 'E:\\A' >>> for i in os.walk('.'): print(i) ('.', ['TEST_DIR', 'TEST_DIR2'], []) ('.\\TEST_DIR', ['C'], ['new_test.txt']) ('.\\TEST_DIR\\C', ['gd0306'], ['test.png']) ('.\\TEST_DIR\\C\\gd0306', [], ['gd0306.txt']) ('.\\TEST_DIR2', ['NEW_DIR'], ['test2.txt']) ('.\\TEST_DIR2\\NEW_DIR', [], ['test3.txt'])

os.path

除了上面提到的os模块的一些功能外，还有一个强大的模块是os.path，它可以完成一些针对路径名的操作。其常用的函数方法有：

函数名使用方法basename(path)去掉目录路径，单独返回文件名dirname(path)去掉文件名，单独返回目录路径join(path1[,path2[, …]])将path1和path2各部分组合成一个路径名split(path)分割文件名与路径，返回(f_path, f_name)元祖。如果完全使用目录，他也会讲最后一个目录作为文件名分离，且不会判断文件或者目录是否存在splitext(path)分离文件名与扩展名，返回(f_name, f_extension)元祖getsize(file)返回指定文件的尺寸，大小为字节getatime(file)返回指定文件最近的访问时间(浮点型秒数，可用time模块的gmtime()或localtime()函数换算)getctime(file)返回指定文件的创建时间(浮点型秒数，可用time模块的gmtime()或者localtime()换算)getmtime(file)返回指定文件最新的修改时间(浮点型秒数，可用time模块的gmtime()或者localtime()换算)

以下为函数返回True或者False

函数名使用方法exists(path)判断指定路径(目录或者文件)是否存在isabs(path)判断指定路径是否为绝对路径isdir(path)判断指定路径是否存在且是一个目录isfile(path)判断指定路径是否存在且是一个文件islink(path)判断指定路径是否存在且是一个符号链接(软连接)ismount(path)判断指定路径是否存在且是一个挂载点samefile(path1, path2)判断path1和path2两个路径是否指向同一个文件

1、basename(path)和dirname(path) basename()和dirname()函数分别用于获得文件名和路径名：

>>> os.path.dirname(r'E:/A/TEST_DIR/new_test.txt') 'E:/A/TEST_DIR' >>> os.path.basename(r'E:/A/TEST_DIR/new_test.txt') 'new_test.txt'

2、join(path1[,path2[, …]]) join()函数跟BIF的那个join()函数不同，os.path.join()是用于将路径名和文件名组合成一个完整的路径，这个目录路径和文件都可以不存在：

>>> os.path.join(r'E:/A/TEST_DIR', 'gd.txt') 'E:/A/TEST_DIR\\gd.txt' >>> os.path.join(r'E:/A/TEST_DIR3', 'gd.txt') 'E:/A/TEST_DIR3\\gd.txt'

3、split(path)和splitext(path) split()和splitext()函数都用于分割路径，split()函数分割路径和文件名(如果完全使用目录，他也会将最后一个目录作为文件名分离，且不会判断文件或者目录是否存在)；splitext()函数则是用于分割文件名和扩展名：

>>> os.path.split('E:/A/TEST_DIR/new_test.txt') ('E:/A/TEST_DIR', 'new_test.txt') >>> os.path.splitext('E:/A/TEST_DIR/new_test.txt') ('E:/A/TEST_DIR/new_test', '.txt')

4、getsize(file) getsize()函数用于获取文件的尺寸，返回值是以字节为单位的：

>>> os.path.getsize('E:/A/TEST_DIR/new_test.txt') 2170

5、getatime()、getctime()、getmtime() 这三个函数分别用于获取文件的最近访问时间、创建时间和修改时间。不过返回值是浮点型秒数，可用time模块的gmtime()或localtime()函数换算：

>>> import time >>> temp = time.localtime(os.path.getatime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被访问的时间是: 23 May 2019 22: 12: 44 >>> >>> temp = time.localtime(os.path.getctime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被创建的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被创建的时间是: 23 May 2019 20: 49: 56 >>> >>> temp = time.localtime(os.path.getmtime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被修改的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被修改的时间是: 23 May 2019 22: 12: 44

pickle：泡菜？

pickle是python提供的一个标准模块，使用这个模块，可以非常容易地将列表、字典这类复杂数据类型存储为文件了。 pickle就是泡菜，腌菜的意思，用官方文档中的话说，这是一个令人惊叹的模块，它几乎可以把所有python的对象都转化为二进制的形式存放，这个过程称为pickling，那么从二进制形式转化会对象的过程称为unpickling。我们来举一个将列表数据保存到文件的例子：

import pickle as p my_list = [123, 345, 'pythoner', [12, 34, 56]] # 使用二进制可写的方式创建一个文件 pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'wb') # 使用pickle模块的dump方法将数据保存到创建的.pkl文件中 p.dump(my_list, pickle_file) # 关闭文件 pickle_file.close()

运行这段python代码之后，就会出现my_list.pkl这个文件，里面存储的数据格式为二进制，所以要打开的话要以二进制方式打开，还有这个文件的后缀名是随意的，使用pkl是为了方便记忆与分辨。

我们要想在python中将之前保存到文件的列表数据还原，就需要在python中以二进制可读的方式打开pkl文件，随后再使用pickle模块的load方法将数据加载进来

import pickle as p # 使用二进制可读的方式打开之前保存列表数据的pkl文件 pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'rb') # 调用pickle模块的load方法将列表数据加载到my_list对象中 my_list = p.load(pickle_file) print(my_list)

运行这段代码就可以得到我们之前的列表了利用pickle模块不但可以保存列表数据，其实他可以保存任何你能想象到的东西！！！

最新回复(0)