当前位置:   article > 正文

GPU集群管理问题记录_gpu集群问题定位

gpu集群问题定位

1. GPU卡无任务运行但显存占用情况处理

https://devtalk.nvidia.com/default/topic/958159/cuda-programming-and-performance/11-gb-of-gpu-ram-used-and-no-process-listed-by-nvidia-smi/

  1. sudo fuser -v /dev/nvidia* 找到占用显存的任务PID
  2. kill -9 PID kill掉任务即可

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/707861
推荐阅读
相关标签
  

闽ICP备14008679号