如何调用GPU
Ollama 支持使用 GPU 加速模型运行。以下是在 Windows 环境下配置的方法。
NVIDIA
支持显卡
- NVIDIA GeForce RTX 系列 (20/30/40/50 系列及以上)
- NVIDIA GeForce GTX 16 系列及以上
- NVIDIA Tesla 系列
- 显存建议至少 6GB 以上
- CUDA Capability 7.0 及以上
安装 CUDA
- 访问 NVIDIA 官网下载 CUDA Toolkit(https://developer.nvidia.com/cuda-downloads)
- 选择 Windows 操作系统及对应版本
- 下载并安装 CUDA Toolkit(建议版本 11.7 或以上)
- 安装完成后,打开命令提示符,输入以下命令验证安装:
nvidia-smi - 重启 Ollama 即可启用 GPU 运行
AMD
支持显卡
官方支持:
- AMD Radeon RX 9000 系列
- AMD Radeon RX 7000 系列
- AMD Radeon RX 6000 系列
- AMD Instinct 系列
- 显存建议至少 6GB 以上
安装 HIP
- 下载并安装最新版本的 AMD 驱动
- 安装 HIP SDK(https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html)
- 重启 Ollama 即可启用 GPU 运行
部分非官方支持的 AMD 显卡解决办法
部分 AMD 显卡(如 500 系列、RDNA 5000 系列、680M 等)未获得 AMD 官方 ROCm(HIP)支持,但可通过以下方式实现:
Ollama-for-AMD
- 访问项目地址:https://github.com/likelovewant/ollama-for-amd
- 下载预编译版本或从源码编译 Ollama 并安装
- 下载预编译的 rocblas 和 library,或根据 Wiki 自行编译
- 将 rocblas.dll 替换至对应目录,library 覆盖至 rocblas/library
- 重新启动 Ollama
更便捷的办法
- 使用 Ollama-For-AMD-Installer 工具
- 选择显卡型号,点击"检查最新版本",即可自动完成全部配置
注意事项
- 如仍无法调用 GPU(常见于部分双显卡笔记本),可尝试通过环境变量强制指定 Ollama 使用某显卡运行
- 建议将系统电源计划设置为"高性能"模式
- 保持显卡驱动为最新版本
- 监控显存使用情况,避免溢出
- 使用大模型时,建议关闭其他显卡密集型应用