Python 忽略文件名编码的方法
问题
你想使用原始文件名执行文件的I/O操作,也就是说文件名并没有经过系统默认编码去解码或编码过。
解决方案
默认情况下,所有的文件名都会根据 sys.getfilesystemencoding()
返回的文本编码来编码或解码。比如:
>>> sys.getfilesystemencoding() 'utf-8' >>>
如果因为某种原因你想忽略这种编码,可以使用一个原始字节字符串来指定一个文件名即可。比如:
>>> # Wrte a file using a unicode filename >>> with open('jalape\xf1o.txt', 'w') as f: ... f.write('Spicy!') ... 6 >>> # Directory listing (decoded) >>> import os >>> os.listdir('.') ['jalapeño.txt'] >>> # Directory listing (raw) >>> os.listdir(b'.') # Note: byte string [b'jalapen\xcc\x83o.txt'] >>> # Open file with raw filename >>> with open(b'jalapen\xcc\x83o.txt') as f: ... print(f.read()) ... Spicy! >>>
正如你所见,在最后两个操作中,当你给文件相关函数如 open()
和 os.listdir()
传递字节字符串时,文件名的处理方式会稍有不同。
讨论
通常来讲,你不需要担心文件名的编码和解码,普通的文件名操作应该就没问题了。 但是,有些操作系统允许用户通过偶然或恶意方式去创建名字不符合默认编码的文件。 这些文件名可能会神秘地中断那些需要处理大量文件的Python程序。
读取目录并通过原始未解码方式处理文件名可以有效的避免这样的问题, 尽管这样会带来一定的编程难度。
关于打印不可解码的文件名,请参考
以上就是Python 忽略文件名编码的方法的详细内容,更多关于Python 忽略文件名编码的资料请关注脚本之家其它相关文章!
- Python 编码规范(Google Python Style Guide)
- python 编码规范整理
- Python 常用 PEP8 编码规范详解
- Python开发编码规范
- Python3 json模块之编码解码方法讲解
- 解决python3 中的np.load编码问题
- python源文件的字符编码知识点详解
- Python新建项目自动添加介绍和utf-8编码的方法
- python3中编码获取网页的实例方法
- 关于Python字符编码与二进制不得不说的一些事
- 详解Python中的编码问题(encoding与decode、str与bytes)
- Python2与Python3关于字符串编码处理的差别总结
- python基础之编码规范总结
相关文章
Python3.9用pip安装wordcloud库失败的解决过程
一般在命令行输入pip install wordcloud 总会显示安装失败,所以下面这篇文章主要给大家介绍了关于Python3.9用pip安装wordcloud库失败的解决过程,文中通过实例代码介绍的非常详细,需要的朋友可以参考下2022-06-06Python之time模块的时间戳,时间字符串格式化与转换方法(13位时间戳)
今天小编就为大家分享一篇Python之time模块的时间戳,时间字符串格式化与转换方法(13位时间戳),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2019-08-08
最新评论