自学Python:python中的OS模块与pickle模块

    xiaoxiao2022-07-14  169

    OS模块

    OS就是Operating System的缩写,意为操作系统,这可是一个非常高大上的模块,因为在python中,对于文件系统的访问就是通过OS模块来实现的。我们所知道常用的操作系统就有Windows、Mac OS、Linux、UNIX等,这些操作系统底层对于文件系统的访问工作原理是不一样的,因此你可能就要针对不同的系统来考虑使用哪些文件系统模块,这样的做法是非常麻烦的,因为如果程序的运行环境一旦改变,你就要相应的去修改大量的代码来应付。

    但是python是一种跨平台的语言,同样的源代码在不同的操作系统不需要修改就可以同样实现,有了OS模块,不需要关心什么操作系统下使用什么模块,OS模块会帮你选择正确的模块并调用。

    下面是OS模块中关于文件/目录常用的函数的使用方法:

    函数名使用方法getcwd()返回当前的工作目录chdir(path)改变当前工作目录listdir(path=’.’)列举指定目录中的文件名(‘.’表示当前目录,’..'表示上一级目录)mkdir(path)创建一个单层空目录,如果该目录已经存在则会抛出异常makedirs(path)递归的创建多层目录,如果内层目录已经存在则报错,('E:/a/b’和’E:/a/c’不会冲突)remove(path)删除文件rmdir(path)删除一个单层目录,如果目录非空则抛出异常removedirs(path)递归的删除一系列目录,从子目录到父目录逐层尝试删除,遇到非空目录抛出异常rename(old, new)重命名system(command)运行系统的shell命令 以下是支持路径操作中常用到的一些定义,支持所有平台os.curdir指代当前目录 == (’.’)os.pardir指代上一级目录 == (’..’)os.sep输出操作系统特定的路径分隔符(在windows下为’\\’,Linux下为‘/’)os.linesep当前平台使用的行终止符(在Windows下为’\r\n’,Linux下为’\n’)os.name指代当前实用的操作系统(包括’posix’、‘nt’、‘mac’、‘os2’、‘ce’、‘java’)

    1、getcwd() 有些情况下我们需要获得应用程序当前的工作目录(比如要保存临时文件),那么可以使用getcwd()函数获得:

    >>> import os >>> os.getcwd() 'E:\\Program Files (x86)\\python37-32'

    2、chdir(path)

    >>> os.chdir('E:/a') >>> os.getcwd() 'E:\\a'

    3、listdir(path = ‘.’) 有时候你可能需要知道当前工作目录下有哪些文件和子目录,那么listdir()函数可以帮你列举出来。path参数用于指定列举的目录,默认值是’.’,代表根目录,也可以使用’..'代表上一级目录:

    >>> os.chdir('E:/Program Files') >>> os.listdir(path = '.') ['Tencent', 'YouKu']

    os.listdir('./Tencent')

    4、mkdir(path) mkdir()函数用于创建文件夹,如果该文件夹存在,则抛出FileExistsError异常: 5、makedirs(path) makedirs()函数可用于创建多层目录,用过linux系统的都知道,在linux中的话,要建立多层目录可以使用mkdir /A/B/C/D -p

    >>> os.chdir('E:/a') >>> os.listdir() >>> ['B'] >>> os.makedirs('E:/a/A/B/C') >>> os.listdir('E:/a/') ['A', 'B'] >>> os.listdir('E:/a/A/B/') ['C']

    6、remove(path)、rmdir(path)和removedirs(path) remove()函数用于删除指定的文件,注意是删除文件,不是删除目录。如果需要删除目录,则用rmdir()函数;如果要删除多层目录,则用removedirs()函数。

    >>> os.chdir('E:/A/A/B/C') >>> os.listdir() ['test.txt'] >>> os.remove('test.txt') >>> os.listdir() [] >>> os.chdir('E:/A/A/B/') >>> os.listdir() ['C'] >>> os.rmdir('C') >>> os.listdir() [] >>> os.chdir('E:/A/') >>> os.removedirs('E:/A/A/B') >>> os.listdir() ['B']

    7、rename(old, new) rename()函数用于重命名文件或者文件夹

    >>> os.listdir() ['B'] >>> os.rename('B', 'TEST_DIR') >>> os.listdir() ['TEST_DIR'] >>> os.chdir('TEST_DIR') >>> os.listdir() ['C', 'test2.txt'] >>> os.rename('test2.txt', 'new_test.txt') >>> os.listdir() ['C', 'new_test.txt']

    8、system(command) os模块的这个方法我个人感觉在linux系统中非常好用,在一些运维自动化脚本中用的非常频繁,当然在windows中也可以用,几乎每个操作系统都会提供一些小工具,system()函数用于使用这些小工具,她或使用相应的命令将这些工具调出来,比如说windows中的计算器,在dos窗口我们需要使用calc命令调出,因此,在python中我们可以使用system()函数调用计算器

    >>> os.system('calc')

    9、walk(top) 最后是walk()函数,这个函数在有些时候确实非常有用,可以省去很多麻烦。该函数的作用是遍历top参数指定路径下的所有子目录,并将结果返回一个三元组(路径,[包含目录],[包含文件])。看一下下面的例子:

    >>> os.getcwd() 'E:\\A' >>> for i in os.walk('.'): print(i) ('.', ['TEST_DIR', 'TEST_DIR2'], []) ('.\\TEST_DIR', ['C'], ['new_test.txt']) ('.\\TEST_DIR\\C', ['gd0306'], ['test.png']) ('.\\TEST_DIR\\C\\gd0306', [], ['gd0306.txt']) ('.\\TEST_DIR2', ['NEW_DIR'], ['test2.txt']) ('.\\TEST_DIR2\\NEW_DIR', [], ['test3.txt'])

    os.path

    除了上面提到的os模块的一些功能外,还有一个强大的模块是os.path,它可以完成一些针对路径名的操作。其常用的函数方法有:

    函数名使用方法basename(path)去掉目录路径,单独返回文件名dirname(path)去掉文件名,单独返回目录路径join(path1[,path2[, …]])将path1和path2各部分组合成一个路径名split(path)分割文件名与路径,返回(f_path, f_name)元祖。如果完全使用目录,他也会讲最后一个目录作为文件名分离,且不会判断文件或者目录是否存在splitext(path)分离文件名与扩展名,返回(f_name, f_extension)元祖getsize(file)返回指定文件的尺寸,大小为字节getatime(file)返回指定文件最近的访问时间(浮点型秒数,可用time模块的gmtime()或localtime()函数换算)getctime(file)返回指定文件的创建时间(浮点型秒数,可用time模块的gmtime()或者localtime()换算)getmtime(file)返回指定文件最新的修改时间(浮点型秒数,可用time模块的gmtime()或者localtime()换算)

    以下为函数返回True或者False

    函数名使用方法exists(path)判断指定路径(目录或者文件)是否存在isabs(path)判断指定路径是否为绝对路径isdir(path)判断指定路径是否存在且是一个目录isfile(path)判断指定路径是否存在且是一个文件islink(path)判断指定路径是否存在且是一个符号链接(软连接)ismount(path)判断指定路径是否存在且是一个挂载点samefile(path1, path2)判断path1和path2两个路径是否指向同一个文件

    1、basename(path)和dirname(path) basename()和dirname()函数分别用于获得文件名和路径名:

    >>> os.path.dirname(r'E:/A/TEST_DIR/new_test.txt') 'E:/A/TEST_DIR' >>> os.path.basename(r'E:/A/TEST_DIR/new_test.txt') 'new_test.txt'

    2、join(path1[,path2[, …]]) join()函数跟BIF的那个join()函数不同,os.path.join()是用于将路径名和文件名组合成一个完整的路径,这个目录路径和文件都可以不存在:

    >>> os.path.join(r'E:/A/TEST_DIR', 'gd.txt') 'E:/A/TEST_DIR\\gd.txt' >>> os.path.join(r'E:/A/TEST_DIR3', 'gd.txt') 'E:/A/TEST_DIR3\\gd.txt'

    3、split(path)和splitext(path) split()和splitext()函数都用于分割路径,split()函数分割路径和文件名(如果完全使用目录,他也会将最后一个目录作为文件名分离,且不会判断文件或者目录是否存在);splitext()函数则是用于分割文件名和扩展名:

    >>> os.path.split('E:/A/TEST_DIR/new_test.txt') ('E:/A/TEST_DIR', 'new_test.txt') >>> os.path.splitext('E:/A/TEST_DIR/new_test.txt') ('E:/A/TEST_DIR/new_test', '.txt')

    4、getsize(file) getsize()函数用于获取文件的尺寸,返回值是以字节为单位的:

    >>> os.path.getsize('E:/A/TEST_DIR/new_test.txt') 2170

    5、getatime()、getctime()、getmtime() 这三个函数分别用于获取文件的最近访问时间、创建时间和修改时间。不过返回值是浮点型秒数,可用time模块的gmtime()或localtime()函数换算:

    >>> import time >>> temp = time.localtime(os.path.getatime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被访问的时间是: 23 May 2019 22: 12: 44 >>> >>> temp = time.localtime(os.path.getctime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被创建的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被创建的时间是: 23 May 2019 20: 49: 56 >>> >>> temp = time.localtime(os.path.getmtime('E:/A/TEST_DIR/new_test.txt')) >>> print('E:/A/TEST_DIR/new_test.txt 被修改的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp)) E:/A/TEST_DIR/new_test.txt 被修改的时间是: 23 May 2019 22: 12: 44

    pickle:泡菜?

    pickle是python提供的一个标准模块,使用这个模块,可以非常容易地将列表、字典这类复杂数据类型存储为文件了。 pickle就是泡菜,腌菜的意思,用官方文档中的话说,这是一个令人惊叹的模块,它几乎可以把所有python的对象都转化为二进制的形式存放,这个过程称为pickling,那么从二进制形式转化会对象的过程称为unpickling。 我们来举一个将列表数据保存到文件的例子:

    import pickle as p my_list = [123, 345, 'pythoner', [12, 34, 56]] # 使用二进制可写的方式创建一个文件 pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'wb') # 使用pickle模块的dump方法将数据保存到创建的.pkl文件中 p.dump(my_list, pickle_file) # 关闭文件 pickle_file.close()

    运行这段python代码之后,就会出现my_list.pkl这个文件,里面存储的数据格式为二进制,所以要打开的话要以二进制方式打开,还有这个文件的后缀名是随意的,使用pkl是为了方便记忆与分辨。

    我们要想在python中将之前保存到文件的列表数据还原,就需要在python中以二进制可读的方式打开pkl文件,随后再使用pickle模块的load方法将数据加载进来

    import pickle as p # 使用二进制可读的方式打开之前保存列表数据的pkl文件 pickle_file = open('E:/A/TEST_DIR/C/my_list.pkl', 'rb') # 调用pickle模块的load方法将列表数据加载到my_list对象中 my_list = p.load(pickle_file) print(my_list)

    运行这段代码就可以得到我们之前的列表了 利用pickle模块不但可以保存列表数据,其实他可以保存任何你能想象到的东西!!!

    最新回复(0)