问题背景
DeepMD-kit 的报错常来自 Python 依赖和 GPU runtime,不一定是 DeepMD 本身的问题。
适用环境
适用于使用 Conda 管理 DeepMD-kit 的 Linux 用户。
安装步骤
- TODO:确认驱动支持的 CUDA 上限。
- TODO:创建隔离 Conda 环境。
- TODO:安装 DeepMD-kit。
- TODO:验证 CPU/GPU 路径。
验证命令
TODO:记录 python -c 导入测试、dp --version 和 GPU 检测结果。
常见错误
包括 TensorFlow 找不到 CUDA、libstdc++ 冲突、环境混用。
解决方法
尽量避免系统 Python、多个 Conda 环境和手工 LD_LIBRARY_PATH 混杂。
服务入口
可协助 DeepMD-kit 与 CUDA 环境远程排错。
免责声明
版本组合需结合现场硬件验证。