当前位置:   article > 正文

RuntimeError: CUDA out of memory. Tried to allocate 600.00 MiB (GPU 0; 23.69 GiB total capacity)_cuda out of memory. tried to allocate 196.00 mib (

cuda out of memory. tried to allocate 196.00 mib (gpu 0; 23.70 gib total cap

RuntimeError: CUDA out of memory. Tried to allocate 600.00 MiB (GPU 0; 23.69 GiB total capacity; 21.82 GiB already allocated; 115.25 MiB free; 21.87 GiB reserved in total by PyTorch)

运行时错误:CUDA 内存不足。 尝试分配 600.00 MiB(GPU 0;23.69 GiB 总容量;21.82 GiB 已分配;115.25 MiB 空闲;PyTorch 总共保留 21.87 GiB)

原因

出现类似bug的原因是显存不足

解决方法1:释放显存

首先 fuser -v /dev/nvidia*sudo fuser -v /dev/nvidia*, 查看最近在GPU上运行的进程, 然后sudo kill相关进程号。

其中:

  • fuser:可以显示出当前哪个程序在使用磁盘上的某个文件、挂载点、甚至网络端口,并给出程序进程的详细信息
  • -v:详细模式
  • /dev/nvidia*:所有和英伟达相关的接口(如GPU)

解决方法2:调小batch size

如果释放了部分显存之后还是不够用的话,可以调小batch size


参考:
nvidia gpu kill进程后,显存仍未清

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/220621
推荐阅读
相关标签
  

闽ICP备14008679号