详解Python中import模块导入的实现原理
什么是模块
一个.py文件就是一个模块,即Module。模块分为三种:python标准库、第三方模块、应用程序自定义模块。
- import语句 – 导入模块
- Directory – 文件夹(空的)
- Package – 比文件夹多了一个__init__.py
""" file: cal.py """ def add(x, y) return x+y def sub(x, y) return x-y print(‘hello cal') """ file: test.py """ import cal print(cal.add(1, 2))
import做了什么?
import导入模块的时候,首先会把导入的文件执行一遍,比如说我们运行test.py的时候,print(‘hello cal’)也会被执行,因为import cal的时候就把cal.py运行了一遍。所以,我们在模块文件中只写功能(也就是函数),而不要写可执行的语句。
- 执行被引入的py文件,即使只引入一个变量(from cal import add),也会运行整个文件。
- 引入变量名 → 文件名变量
引入多个模块
import cal, time
只引入一个方法
# 只引入一个方法 from cal import add print(add(1, 2)) #可以直接使用add,不用加cal.
引入所有方法,不推荐使用,你并不知道都引入了哪些变量,可能会出现本文件变量与引入变量名字重复的情况。
#引入所有方法 – 不推荐使用,你并不知道都引入了哪些变量,可能会出现本文件变量与引入变量名字重复的情况。 from cal import * #新的变量名会覆盖旧的变量名
#+++++++++++++++++++++++++++ from cal import * def add(x, y) return x+y+100 print(add(1, 2)) #+++++++++++++++++++++++++++ def add(x, y) return x+y+100 from cal import * print(add(1, 2)) #+++++++++++++++++++++++++++
import搜索路径
import sys print(sys.path) #查看路径
path中包含python自己定义的路径,以及当前执行的py文件的路径,也就是说当前执行路径会被自动加入到sys.path中,import就是按照这些路径去搜索被引入的变量的。也可以通过手动添加路径
from path import cal #path就是cal所在的路径
import导入模块的原理
首先import会根据路径找到文件,根据路径找到模块后把模块加载到内存中执行一遍,执行的时候是把模块的内容拷贝到当前文件执行。import导入是将模块从磁盘中把磁盘文件导入到内存中,这个速度是比较慢的,实际上,在导入时会有一个导入缓存,同一个模块在导入第一次的时候会有一个缓存,以后再导入都是用的缓存的导入,所以有时候你可能遇到这样的问题,被导入的文件已经删除了,但是程序还是能运行,这是因为程序使用的是缓存的导入模块。
from path import mode,它相当于把路径进行了一次拼接path\mode.py,这是from的工作。路径拼接是在当前执行文件的路径基础上进行拼接。
当引入了很多模块的时候,一个目录下会有很多py文件,一般把bin.py作为要执行的文件,也就是整个程序的入口。而逻辑主文件叫做main.py,这里面包含了程序的主要逻辑,其他功能都放到其它文件中作为一个模块。我们在运行的时候,运行bin.py,由bin.py去调用main.py中的主逻辑。也就是说只有bin是可执行的,其余文件都不应作为执行文件。
前面说过,sys.path中只会加入当前运行程序所在的路径,bin.py是整个程序的运行文件,也就是说sys.path中只会加入bin.py的路径,假如说文件有如下导入关系
假如说main.py和cal.py在同一级目录,那么不用加路径即可导入,但是如果bin.py和这两个文件不在同一级目录(比如在上一级目录),那么bin.py导入main.py的时候就要加上main.py的路径,但是这样在执行的时候会报错,因为bin.py间接导入了cal.py,并且bin.py只加了main.py的路径而没有加cal.py的路径,前面说过sys.py只会包含当前运行路径,也就是bin.py的路径。解决方法有两个:
- 在main.py中加上cal.py的路径from path import cal;
- 把路径加到sys.path中;
file 获取当前文件名
os.path.dirname(__file__) #获取当前文件路径 os.path.dirname(os.path.dirname(__file__)) #获取当前文件的上一级路径
pycharm会自己根据当前文件名获取绝对路径,并把绝对路径通过os.path.dirname()返回给我们os.path.dirname(file),但是在终端运行的时候,终端并没有这个功能,我们需要自己去找到绝对路径,然后根据绝对路径找到文件名,并反推出上一级目录。
p = os.path.dirname(__file__) #获取当前文件的绝对路径 BASEDIR = os.path.dirname(os.path.dirname(p)) sys.psth.append(BASEDIR)
实际上,这三步的操作相当于把当前运行文件的上一级目录通过相对路径的方式添加到了环境变量。如果我们以绝对路径的方式添加环境变量,当我们换了电脑或者环境,环境变量就失效了。我们这样通过程序找出相对路径来添加到环境变量,只要将当前整个工程一块拷贝到别的机器,就一定可以找到这个环境变量。
以上就是详解Python中import模块导入的实现原理的详细内容,更多关于Python import模块导入的资料请关注脚本之家其它相关文章!
相关文章
教你怎么用Python selenium操作浏览器对象的基础API
今天给大家带来的是关于Python的相关知识,文章围绕着怎么用Python selenium操作浏览器对象的基础API展开,文中有非常详细的介绍及代码示例,需要的朋友可以参考下2021-06-06Pandas —— resample()重采样和asfreq()频度转换方式
今天小编就为大家分享一篇Pandas —— resample()重采样和asfreq()频度转换方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-02-02pycharm利用pyspark远程连接spark集群的实现
由于工作需要,利用spark完成机器学习。因此需要对spark集群进行操作。所以利用pycharm和pyspark远程连接spark集群。感兴趣的可以了解一下2021-05-05
最新评论