RuntimeError: CUDA out of memory. Tried to allocate 600.00 MiB (GPU 0； 23.69 GiB total capacity)_cuda out of memory. tried to allocate 196.00 mib (

作者：你好赵伟 | 2024-03-11 21:11:08

踩

cuda out of memory. tried to allocate 196.00 mib (gpu 0; 23.70 gib total cap

RuntimeError: CUDA out of memory. Tried to allocate 600.00 MiB (GPU 0; 23.69 GiB total capacity; 21.82 GiB already allocated; 115.25 MiB free; 21.87 GiB reserved in total by PyTorch)

运行时错误：CUDA 内存不足。尝试分配 600.00 MiB（GPU 0；23.69 GiB 总容量；21.82 GiB 已分配；115.25 MiB 空闲；PyTorch 总共保留 21.87 GiB)

原因

出现类似bug的原因是显存不足

解决方法1：释放显存

首先 fuser -v /dev/nvidia*或 sudo fuser -v /dev/nvidia*, 查看最近在GPU上运行的进程, 然后sudo kill相关进程号。

其中：

fuser：可以显示出当前哪个程序在使用磁盘上的某个文件、挂载点、甚至网络端口，并给出程序进程的详细信息
-v：详细模式
/dev/nvidia*：所有和英伟达相关的接口（如GPU）

解决方法2：调小batch size

如果释放了部分显存之后还是不够用的话，可以调小batch size

参考：
nvidia gpu kill进程后，显存仍未清

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/220621