在之前学习了python的列表、元组、集合等知识,接下来将python的文件相关的知识做一总结和分析。
一 open函数
在我们用word、excel、vim对文件操作时,肯定要先打开文件,同样在编程里面也是需要将文件打开,然后再对文件操作,操作完对文件进行关闭。文件打开使用open()函数,同时创建一个相关的对象。
、基本语法:
open(file, mode='r', buffering=none, encoding=none, errors=none, newline=none, closefd=true)
参数介绍:
file:表示文件名,可以使用绝对路径和相对路径,还有可以根据mode方式决定文件的追加或者覆盖
mode:表示打开文件的模式
buffering:设置缓存模式。0表示不缓存,1表示缓存;如果大于1则表示缓冲区的大小,以字节为单位。
encoding:表示打开文件的编码格式
errors:参数errors是用来指明编码和解码错误时怎么样处理。不能在二进制的模式下使用。
1)当指明为’strict’时,编码出错则抛出异常valueerror。
2)当指明为’ignore’时,忽略错误。
3)当指明为’replace’时,使用某字符进行替代模式,比如使用’?’来替换出错的。
4)其它相应还有surrogateescape/xmlcharrefreplacs/backslashreplace。
newline:
参数newline是用来控制文本模式之下,一行的结束字符。可以是none,’’,\n,\r,\r\n等。
当在读取模式下,如果新行符为none,那么就作为通用换行符模式工作,意思就是说当遇到\n,
\r或\r\n都可以作为换行标识,并且统一转换为\n作为文本输入的换行符。当设置为空’’时,
也是通用换行符模式工作,但不作转换为\n,输入什么样的,就保持原样全输入。当设置为其它相应
字符时,就会判断到相应的字符作为换行符,并保持原样输入到文本。
当在输出模式时,如果新行符为none,那么所有输出文本都是采用\n作为换行符。如果设置为’’
或者\n时,不作任何的替换动作。如果是其它字符,会在字符后面添加\n作为换行符。
closefd:是用来当给一个文件句柄传进来时,而当退出文件使用时,而不对文件句柄进行关闭。如果传
递一个文件名进来,这个参数无效,必定为true方式。
关于上面提到的mode模式种类比较多,我们做以下相关介绍和总结,
二进制在我们处理图像等信息时使用比较多,而其他部分在我们操作字符串等内容比较多。
简单的示例:
示例文件内容:
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
可你却总是笑我 一无所有
为何你总笑个没够 为何我总要追求
难道在你面前 我永远是一无所有
process finished with exit code 0
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
readline=a_file.read()
print(readline)
结果:
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
可你却总是笑我 一无所有
为何你总笑个没够 为何我总要追求
难道在你面前 我永远是一无所有
上面使用的r模式打开,我们采取尝试写入文件,写入内容为字符串openstack\nmysqldba
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
readline=a_file.read()
print(readline)
a_file.write("openstack\nmysqldba")
a_file.close()
结果:文件不可写
traceback (most recent call last):
file "d:/project/myapp/hello.py", line 6, in <module>
a_file.write("openstack\nmysqldba")
io.unsupportedoperation: not writable
我们再尝试用二进制方式打开文件查看内容:
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","rb") #去掉了编码格式
readline=a_file.read()
print(readline)
#a_file.write("openstack\nmysqldba")
a_file.close()
结果:
b'\xe6\x88\x91\xe6\x9b\xbe\xe7\xbb\x8f\xe9\x97\xae\xe4\xb8\xaa\xe4\xb8\x8d\xe4\xbc\x91 \xe4\xbd\xa0\xe4\xbd\x95\xe
其他内容繁多,因此不再演示其他的mode模式
在研究完我们如何将文件打开后,我们就要考虑如何处理打开的文件,主要涉及到文件对象的一些方法。
下面根据不同的方法做简单介绍以及相关示例
读操作:读的有file.read() filereadline() filereadlies()等三种方法
1、file.read()方法
里面的参数是size,表示从文件中读取size大小字节,当默认为空或者为负值时表示读取所有的字节,
示例:
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果1".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.read(-1))
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果2".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.read())
结果:
###############################################测试结果2################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果3".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.read(3))
结果:
###############################################测试结果3################################################
我曾经
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果4".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.read(15))
结果:
###############################################测试结果4################################################
我曾经问个不休 你何时跟我走
可以发现read方法是受字节数量控制的,字节数量的控制影响其输出
2、readline()方法
读取整行包括”\n”换行,参数也是[size]控制,其和read()的区别就是当readline()某行中的字符不够时,只读取改行,而read()会读取其他行的内容。
示例(两者的区别)
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果1".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.read(50))
print("测试结果2".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readline(100))
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑
###############################################测试结果2################################################
我 一无所有
readline()方法默认值和负值的相关示例
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果1".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readline())
print("测试结果2".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readline(-1))
print("测试结果3".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readline(4))
print("测试结果4".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readline(10))
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
###############################################测试结果2################################################
可你却总是笑我 一无所有
###############################################测试结果3################################################
我要给你
###############################################测试结果4################################################
我的追求 还有我的自
3、readlines()取文件里的所有行并返回列表,若sizeint>0返回总行约为sizeint字节的行,实际读取的值可能比sizeint较大,因为需要缓冲区。则读取指定长度的字节, 并且将这些字节按行分割。
例如:
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果1".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readlines(14))
###############################################测试结果1################################################
['我曾经问个不休 你何时跟我走\n']
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile.txt","r",encoding='utf-8')
#readline=a_file.read(1)
print("测试结果1".center(100,'#')) #为了更好的展现测试结果分割
print(a_file.readlines(14))
['我曾经问个不休 你何时跟我走\n', '可你却总是笑我 一无所有\n']
当我们设置sizeint值大于行中的字符时才能显示其他行的内容
4、file.close()
关闭文件 关闭文件后不能再进行读写操作文件对象的close()方法刷新未写入的信息,并关闭该文件的对象,在这之后没有数据内容可以执行写入。
python自动关闭,当文件的引用对象被重新分配给另外一个文件。它是使用close()方法来关闭文件是一个很好的做法。
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile2.txt","w+")
#readline=a_file.read(1)
a_file.write("winnerlookopenatck")
a_file.close()
将文件写入
写入内容:
winnerlookopenatck
5、flie.write()
write()方法写入字符串到任何一个打开的文件。要注意的是python字符串可以具有二进制数据,而不仅仅是文字。
write()方法不要将换行字符(' ')添加到字符串的结尾。在文件关闭前或缓冲区刷新前,字符串内容存储在缓冲区中,这时你在文件中是看不到写入的内容。
例如:
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_file=open("d:\\pythonfile2.txt","w+")
#readline=a_file.read(1)
a_file.write("winnerlookopenatck")
a_file.close()
6、file.writelines()
file.writelines()方法用于向文件中写入一序列的字符串。这一序列字符串可以是由迭代对象产生的,如一个字符串列表。换行需要制定换行符 \n。
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]#定义列表
a_file=open("d:\\pythonfile2.txt","w+")
#readline=a_file.read(1)
a_file.writelines(sed)
a_file.close()
结果:
openstack: 1
docker 2
mysqldba 3
kvm 4
7、file.flush()
flush() 方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区,不需要是被动的等待输出缓冲区写入。
一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。没有返回值
例如
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
a_file=open("d:\\pythonfile2.txt","w+")
#readline=a_file.read(1)
a_file.writelines(sed)
a_file.flush()
a_file.close()
8、file.next()
next() 方法在文件使用迭代器时会使用到,在循环中,next()方法会在每次循环中调用,该方法返回文件的下一行,如果到达结尾(eof),则触发 stopiteration
示例:
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile2.txt","w+")
for index in range(3):
line = next(afile)
print("第%d行-%s" % (index,line))
9、file.tell()
file.tell()方法返回文件的当前位置,即文件指针当前位置。
语法:
fileobject.tell(offset[, whence])
返回值当前文件指针
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile.txt","r",encoding="utf-8")
print(afile.readline(30))
print(afile.tell())
我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾
86
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile.txt","r",encoding="utf-8")
print(afile.readline())
print(afile.tell())
我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走
162
10、file.isatty()
file.isatty()方法检测文件是否连接到一个终端设备,如果是返回 true,否则返回 false
用法:
fileobject.isatty()
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile.txt","r",encoding="utf-8")
print(afile.isatty())
false
11、file.seek()
seek() 方法用于移动文件读取指针到指定位置,没有返回值
seek() 方法语法如下:
fileobject.seek(offset[, whence])
offset -- 开始的偏移量,也就是代表需要移动偏移的字节数
whence:可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile.txt","r",encoding="utf-8")
print(afile.readline(10))
print(afile.readline(10))
afile.seek(0,0)#设置起始位置为0
print(afile.readline(10))
结果:
我曾经问个不休 你何
时跟我走我曾经问个不
我曾经问个不休 你何
总结打印完第一行后,下次打印从上次的位置接上,而重新设置其位置后在开始位置打印
12、file.fileno()
方法返回一个整型的文件描述符(file descriptor fd 整型),可用于底层操作系统的 i/o 操作。返回值为一个文件描述符:
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqldba 3\n","kvm 4\n"]
afile=open("d:\\pythonfile.txt","r",encoding="utf-8")
print(afile.fileno())
结果:
3
13、file.truncate()
truncate() 方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符。 如果没有指定 size,则从当前位置起截断;截断之后 size 后面的所有字符被删除
truncate() 方法语法如下:
fileobject.truncate( [ size ])
参数
以上就是python文件基础之文件操作详细介绍的详细内容。