【准备工作】
硬件要求:配备NVIDIA显卡的电脑(显存≥8GB),建议预留20GB磁盘空间
网络准备:确保可访问 https://ollama.com
步骤1:下载安装包
访问 [Ollama官网](https://ollama.com) → 点击「Download」→ 选择Windows版本
步骤2:安装ollama
双击安装包 → 保持默认选项 → 点击「Install」
出现「Installation complete」提示即成功
步骤3:验证安装
右键点击Windows开始菜单 ,选择「终端(管理员)」,在「终端」界面输入:
ollama –version
这时[版本信息] 应显示类似“ollama version 0.1.25”这样的版本号
以上操作也可以采用在键盘上按下Win键+R,在调出“运行”中输入“cmd”打开「终端」后输入指令:
powershell
ollama –version
步骤1:获取模型文件
在D盘创建专用文件夹:AI_Models\deepseek-R1
也可在「终端」输入:
powershell
mkdir D:\AI_Models\deepseek-R1
步骤2:编写配置文件
在上面所建的“deepseek-R1”文件夹内通过Windows的“记事本”编写并创建“Modelfile”文件,内容如下:
FROM deepseek-ai/deepseek-R1:latest
PARAMETER temperature 0.7 # 控制生成随机性
PARAMETER num_ctx 4096 # 支持4K上下文
步骤3:执行部署命令
在文件夹内按住Shift+鼠标右键,在弹出的选单中选择「在此处打开Powershell窗口」→ 输入:
ollama create deepseek-r1 -f .\Modelfile
观察终端显示的下载进度条(约需15-30分钟)
步骤1:安装Docker
访问Docker官网[Docker Desktop](https://www.docker.com/) → 下载安装 → 完成基础配置
步骤2:启动Web服务
在「终端」执行:
powershell
docker run -d -p 3000:8080 –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:main
步骤3:访问控制台
在浏览器界面输入地址 http://localhost:3000,找到「注册账号」完成注册,选择「DeepSeek-R1」模型
在对话框中输入测试问题:“如何理解DeepSeek-R1的推理过程” ,查看生成结果。
【方案1:量化加速】
修改“Modelfile”添加量化参数:
QUANTIZATION q4_0 # 启用4bit量化(显存需求降至6GB)
【方案2:多GPU分配】
在启动时指定显卡:
powershell
OLLAMA_NUM_GPU=2 ollama run deepseek-r1 # 使用前两块GPU
症状1:生成速度慢
解决方式:
打开[GPU监控] → 检查显存占用情况 → [调整量化等级] → [关闭其他GPU应用]
症状2:中文输出乱码
解决方式:
在WebUI → Settings → 将「Default Language」设置为「中文」
部署后建议首次运行时打开任务管理器观察GPU负载,正常情况 GPU利用率应波动在60-80%,显存占用稳定在7-8GB。