使用Python解决Windows文件名非用反斜杠问题(python 小技巧)

 更新时间:2019年11月04日 13:59:47   作者:Adam Geitgey  
要想让你的 Python 代码同时在 Windows 和 Mac/Linux 上工作,你需要处理不同系统文件名用不同斜杠的问题。而 Python 3 有一个名为「pathlib」的新模块,可以帮你解决这个麻烦,需要的朋友可以参考下

 

在编程过程中,我们往往会遇到一个小麻烦——微软 Windows 系统在文件夹名之间使用反斜杠字符,而几乎所有其它的计算机(操作系统)都使用正斜杠:

Windows filenames: 
C:\some_folder\some_file.txt 
Most other operating systems: 
/some_folder/some_file.txt 

这是由于上世纪 80 年代早期计算机历史上的一个小意外。「MS-DOS」的第一版使用了正斜杠字符来指定命令行选项。当微软在「MS-DOS 2.0」中加入了对文件夹的支持时,正斜杠字符已经被使用了,所以他们采用了反斜杠作为替代。35 年后,我们仍然被受困于这种不一致性。

如果你想让你的 Python 代码同时在 Windows 和 Mac/Linux 上工作,你就需要处理这种与平台相关的问题。幸运的是,Python 3 有一个名为「pathlib」的新模块,使得用户处理文件几乎没有任何困难。

「pathlib」模块链接: https://docs.python.org/3/library/pathlib.html

让我们快速浏览一下处理文件名路径的不同方法,看看「pathlib」如何能让你的生活变得更美好!

错误的解决方案:手动构建文件路径

假设你有一个数据文件夹,该文件夹包含你想要在你的 Python 程序中打开的文件:

 

在 Python 中对其进行编码是「错误」的方式:

data_folder = "source_data/text_files/" 
file_to_open = data_folder + "raw_data.txt" 
f = open(file_to_open) 
print(f.read()) 

请注意,由于我使用的是 Mac 系统,所以我使用了「Unix」风格的正斜杠对路径进行了硬编码。这也会让 Windows 的用户感到愤怒。

从技术上讲,这段代码在 Windows 上仍然有效,因为 Python 有一个「黑客」(hack)技术:当你在 Windows 上调用「open()」函数时,它会识别这两种斜线。但即便如此,你也不应该依赖它。如果你在错误的操作系统上使用了错误类型的斜杠(尤其是在它们与外部程序或代码库交互时),并不是所有的 Python 库都会正常工作。

Python 对混合斜杠类型的支持是一种只针对 Windows 的「黑客」技术,它反过来并不起作用。在 Mac 系统环境下,在代码中使用反斜杠会导致彻底失败:

data_folder = "source_data\\text_files\\" 
file_to_open = data_folder + "raw_data.txt" 
f = open(file_to_open) 
print(f.read()) 
# On a Mac, this code will throw an exception: 
# FileNotFoundError: [Errno 2] No such file or directory: 'source_data\\text_files\\raw_data.txt' 

由于所有这些原因以及其他原因,使用硬编码的路径字符串编写代码,是一种会让其他程序员十分「嫌弃」的做法。一般来说,你应该尽量避免这么做。

以前的解决方案:Python 的「os.path」模块

Python 的「os.path」模块有很多工具来处理这类针对特定操作系统的文件系统问题。

你可以使用「os.path.join()」为当前的操作系统构建一个使用正确类型斜杠的路径字符串:

import os.path 
data_folder = os.path.join("source_data", "text_files") 
file_to_open = os.path.join(data_folder, "raw_data.txt") 
f = open(file_to_open) 
print(f.read()) 

这段代码可以同时在「Windows」或「Mac」系统上完美运行。问题是它使用起来很麻烦。写出「os.path.join()」并将路径的每个部分作为独立的字符串传给该函数非常冗长,而且很不直观。

由于「os.path」模块中的大多数函数使用起来很烦人,开发者们通常会「忘记」使用它们,即使他们知道这样做更好。这导致出现了很多跨平台的 Bug,也引起了用户的愤怒。

更好的解决方案:Python 3 的「pathlib」!

为了处理文件和路径,Python 3.4 引入了一个名为「pathlib」的新标准库,而且非常好用!

要使用该库,你只需使用正斜杠将一个路径或文件名传给一个新的「Path()」对象,然后它将处理余下的操作:

from pathlib import Path 
data_folder = Path("source_data/text_files/") 
file_to_open = data_folder / "raw_data.txt" 
f = open(file_to_open) 
print(f.read()) 

在这里,有两点需要注意:

  •  你应该在使用「pathlib」函数的情况下使用正斜杠。「Path()」函数将会把正斜杠转化为适应当前操作系统环境的正确斜杠。赞!
  •  如果你想要在路径上进行添加,你可以直接在你的代码中使用「/」操作符。你再也不用一遍又一遍地输入「os.path.join(a, b)」了。

如果「pathlib」所做的就这么多,它也已经是对于 Python 的一个很好的补充了。但是,它还能做更多!

例如,我们可以在无需打开和关闭文件的情况下,读取文本文件的内容:

from pathlib import Path 
data_folder = Path("source_data/text_files/") 
file_to_open = data_folder / "raw_data.txt" 
print(file_to_open.read_text()) 

专业提示:之前的示例是有 Bug 的,因为打开的文件从来没有被关闭过。而这里的这种语法则彻底避免了这个 Bug。

事实上,「pathlib」使大多数标准的文件操作变得快速而简单:

from pathlib import Path 
filename = Path("source_data/text_files/raw_data.txt") 
print(filename.name) 
# prints "raw_data.txt" 
print(filename.suffix) 
# prints "txt" 
print(filename.stem) 
# prints "raw_data" 
if not filename.exists(): 
 print("Oops, file doesn't exist!") 
else: 
 print("Yay, the file exists!") 

  

你甚至可以使用「pathlib」显式地将一个「Unix」路径转化为一个「Windows」格式的路径:

from pathlib import Path, PureWindowsPath 
filename = Path("source_data/text_files/raw_data.txt") 
# Convert path to Windows format 
path_on_windows = PureWindowsPath(filename) 
print(path_on_windows) 
# prints "source_data\text_files\raw_data.txt" 

如果你真的想安全地在你的代码中使用反斜杠,你可以按照「Windows」格式声明你的路径,而「pathlib」可以对其进行转化,使其能在当前的操作系统中工作:

from pathlib import Path, PureWindowsPath 
# I've explicitly declared my path as being in Windows format, so I can use forward slashes in it. 
filename = PureWindowsPath("source_data\\text_files\\raw_data.txt") 
# Convert path to the right format for the current operating system 
correct_path = Path(filename) 
print(correct_path) 
# prints "source_data/text_files/raw_data.txt" on Mac and Linux 
# prints "source_data\text_files\raw_data.txt" on Windows 

如果你想把代码写得更「高级」一些,你甚至可以使用「pathlib」来做诸如解析相对路径、解析网络共享路径并生成

「file:// urls」之类的事。在下面的例子中,我们将仅仅使用两行代码,在你的 web 浏览器中打开一个本地文件夹:

from pathlib import Path 
import webbrowser 
filename = Path("source_data/text_files/raw_data.txt") 
webbrowser.open(filename.absolute().as_uri()) 

这只是「pathlib」的好处之一。它很好地替代了过去分散在不同 Python 模块中与文件相关的许多不同功能。

总结

以上所述是小编给大家介绍的使用Python解决Windows文件名非用反斜杠问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Git基础学习之分支操作的示例详解

    Git基础学习之分支操作的示例详解

    这篇文章主要为大家详细介绍了Git基础学习中分支的基本操作,文中的示例代码讲解详细,对我们了解Git有一定的帮助,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-10-10
  • 完美解决webstorm启动索引文件卡死的问题

    完美解决webstorm启动索引文件卡死的问题

    下面小编就为大家分享一篇完美解决webstorm启动索引文件卡死的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2017-11-11
  • 多种编程语言的常用按键和语法

    多种编程语言的常用按键和语法

    就我所知道的语言来说,在键盘上集中分布跨度更大的语音,通常就是我们所指的丑陋的语言(阅读和编写代码都很困难),例如 shell 和 perl。
    2011-10-10
  • 从0到1搭建后端架构的演进(MVC,服务拆分,微服务,领域驱动)

    从0到1搭建后端架构的演进(MVC,服务拆分,微服务,领域驱动)

    来腾讯之前在前公司做了3年的后端开发,经历一款SaaS产品从0到10(还没有到100, 哈哈哈)的过程,3年间后端的架构逐步演变,在微服务的实践过程中遇到的问题也越来越多,在这里总结下
    2021-08-08
  • IDEA配置leetcode插件的步骤

    IDEA配置leetcode插件的步骤

    这篇文章主要介绍了IDEA配置leetcode插件的步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • Git基本常用命令

    Git基本常用命令

    本文主要介绍了Git基本常用命令。具有很好的参考价值,下面跟着小编一起来看下吧
    2017-01-01
  • 使用.gitignore文件简化Git仓库管理

    使用.gitignore文件简化Git仓库管理

    .gitignore文件用于指定在git中应该被忽略的文件或目录,前端的node_modules目录包含大量文件,如果将其添加到版本管理系统中,会使仓库变得庞大,不利于仓库的管理,本文介绍了使用.gitignore文件来简化你的Git仓库管理
    2023-10-10
  • 目标检测mAP的概念及公式详解

    目标检测mAP的概念及公式详解

    这篇文章主要为大家介绍了我们在进行目标检测时需要用到的mAP概念及公式详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • IDEA中alt+ enter快捷键失效/没用时该怎么办(详细版)

    IDEA中alt+ enter快捷键失效/没用时该怎么办(详细版)

    IDEA里有一个万能快捷键(alt enter)功能非常强大,同一个快捷键,可以根据不同的语境提示你不同的操作,这篇文章主要给大家介绍了关于IDEA中alt+ enter快捷键失效/没用时该怎么办的相关资料,需要的朋友可以参考下
    2023-12-12
  • 编写高质量代码的30条黄金守则(首选隐式类型转换)

    编写高质量代码的30条黄金守则(首选隐式类型转换)

    这篇文章主要介绍了编写高质量代码的30条黄金守则(首选隐式类型转换),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08

最新评论