错误现象
导入 deepmd 或运行训练/推理时出现 TensorFlow CUDA 相关报错。
典型报错
TODO:粘贴 Python 堆栈和 CUDA 相关日志。
可能原因
- TensorFlow 与 CUDA runtime 不匹配。
- Conda 环境混入系统库。
- 驱动版本不支持当前 runtime。
排查命令
TODO:记录 Python、Conda、DeepMD、TensorFlow、CUDA 和驱动版本。
解决步骤
建立隔离环境,按版本矩阵重新确认依赖,避免在旧环境中连续升级。
验证方法
DeepMD 命令可运行,GPU 按预期被识别。
相关服务入口
参见 /services/deepmd-gpumd。