分析PyTorch Dataloader报错ValueError:num_samples的另一种可能原因

更新时间：2024年02月09日 14:35:06 作者：阳光素描

这篇文章主要介绍了分析PyTorch Dataloader报错ValueError:num_samples的另一种可能原因,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

先粘报错信息

Traceback (most recent call last): File “train.py”, line 169, in
train_test() File “train.py”, line 29, in train_test
dataloader_train = DataLoader(dataset_train, batch_size=batch_size, shuffle=True, pin_memory=True, drop_last=False)
File “/data3/anaconda3/lib/python3.8/site-packages/torch/utils/data/dataloader.py”,
line 270, in init
sampler = RandomSampler(dataset, generator=generator) # type: ignore[arg-type]
File “/data3/anaconda3/lib/python3.8/site-packages/torch/utils/data/sampler.py”,
line 102, in init
raise ValueError("num_samples should be a positive integer "
ValueError: num_samples should be a positive integer value, but got num_samples=0

在使用pytorch训练模型时，同样的代码在Windows下可以正常训练，但在Linux下却会出现以上报错。

网上查阅相关资料，解决办法是完全相同的

出现的问题的地方可能是如下的地方

调用DataLoder时注意参数

self.train_dataloader = DataLoader(train_dataset,
batch_size=TrainOption.train_batch_size, shuffle=TRUE,
num_workers=TrainOption.data_load_worker_num)

shuffle的参数设置错误导致，

因为已经有batch_sample了，就不需要shuffle来进行随机的sample了，所以在这里的shuffle应该设置为FALSE才对。

但我这里并未使用batch_sample，因此不是上述原因。

经查发现

由于两系统下目录地址的格式不同，

因此直接从windows移植过来的代码不能在指定目录下正常读取数据，

且代码未设置sample读取个数为0时报错，

导致dataset返回长度为0，小于batch_size，因此出现上述报错。

出现上述问题时，如未使用batch_sample，可首先检查dataset.len()是否正常。

总结

因多次出现上述问题，故记录。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

python 用opencv实现图像修复和图像金字塔
这篇文章主要介绍了python 如何用opencv实现图像修复和图像金字塔，帮助大家更好的理解和使用python处理图片，感兴趣的朋友可以了解下
2020-11-11
Django中的forms组件实例详解
这篇文章主要介绍了Django的forms组件，本文通过实例代码介绍了Django的forms组件,需要的朋友可以参考下
2018-11-11
keras model.fit 解决validation_spilt=num 的问题
这篇文章主要介绍了keras model.fit 解决validation_spilt=num 的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
在pycharm中创建django项目的示例代码
这篇文章主要介绍了在pycharm中创建django项目的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-05-05
Python IDLE Subprocess Connection Error的简单解决方法
最近用要Python处理一点事,就打开Python IDLE,结果出现错误,下面这篇文章主要给大家介绍了关于Python IDLE Subprocess Connection Error的简单解决方法,需要的朋友可以参考下
2023-01-01
详解python的xlwings库读写excel操作总结
这篇文章主要介绍了详解python的xlwings库读写excel操作总结，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-02-02
python中使用百度音乐搜索的api下载指定歌曲的lrc歌词
这篇文章主要介绍了python中使用百度音乐搜索的api下载指定歌曲的lrc歌词,同时也分析出了歌曲的下载地址,需要的朋友可以参考下
2014-07-07
python绘制云雨图raincloud plot
这篇文章主要介绍了python绘制云雨图raincloud plot，Raincloud的Python实现是一个名为PtitPrince的包，它写在seaborn之上，这是一个Python绘图库，用于从pandas数据帧中获取漂亮的绘图
2022-08-08
$python入门字符串拼接\截取\转数字理解学习$
python入门字符串拼接\截取\转数字理解学习
本篇内容我们主要讲有关Python字符串的用法，包括字符串的拼接、字符串怎么转数字、字符串的格式化、字符串函数等内容,有需要的朋友可以借鉴参考下
2021-09-09
详解如何优化和调整Python中Scrapy的性能
在本篇高级教程中,我们将深入探讨如何优化和调整Scrapy爬虫的性能,以及如何处理更复杂的抓取任务,如登录,处理Cookies和会话,以及避免爬虫被网站识别和封锁,需要的朋友可以参考下
2023-09-09