DeepSeek-R1 本地化极简部署简明指南

DeepSeek-R1 本地化极简部署简明指南
(Ollama 可视化方案)

【准备工作】

硬件要求:配备NVIDIA显卡的电脑(显存≥8GB),建议预留20GB磁盘空间

网络准备:确保可访问 https://ollama.com

01Ollama 安装(以 Windows 为例)

步骤1:下载安装包

访问 [Ollama官网](https://ollama.com) → 点击「Download」→ 选择Windows版本

步骤2:安装ollama

双击安装包 → 保持默认选项 → 点击「Install」

出现「Installation complete」提示即成功

步骤3:验证安装

右键点击Windows开始菜单 ,选择「终端(管理员)」,在「终端」界面输入:

ollama –version

这时[版本信息] 应显示类似“ollama version 0.1.25”这样的版本号

以上操作也可以采用在键盘上按下Win键+R,在调出“运行”中输入“cmd”打开「终端」后输入指令:

powershell

ollama –version

02
模型部署流程

步骤1:获取模型文件

在D盘创建专用文件夹:AI_Models\deepseek-R1

也可在「终端」输入:

powershell

mkdir D:\AI_Models\deepseek-R1

步骤2:编写配置文件

在上面所建的“deepseek-R1”文件夹内通过Windows的“记事本”编写并创建“Modelfile”文件,内容如下:

FROM deepseek-ai/deepseek-R1:latest

PARAMETER temperature 0.7 # 控制生成随机性

PARAMETER num_ctx 4096 # 支持4K上下文

步骤3:执行部署命令

在文件夹内按住Shift+鼠标右键,在弹出的选单中选择「在此处打开Powershell窗口」→ 输入:

ollama create deepseek-r1 -f .\Modelfile

观察终端显示的下载进度条(约需15-30分钟)

03
可视化交互(推荐使用 Open WebUI)

步骤1:安装Docker

访问Docker官网[Docker Desktop](https://www.docker.com/) → 下载安装 → 完成基础配置

步骤2:启动Web服务

在「终端」执行:

powershell

docker run -d -p 3000:8080 –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:main

步骤3:访问控制台

在浏览器界面输入地址 http://localhost:3000,找到「注册账号」完成注册,选择「DeepSeek-R1」模型

在对话框中输入测试问题:“如何理解DeepSeek-R1的推理过程” ,查看生成结果。

04
配置优化

【方案1:量化加速】  

修改“Modelfile”添加量化参数:

QUANTIZATION q4_0 # 启用4bit量化(显存需求降至6GB)

【方案2:多GPU分配】  

在启动时指定显卡:

powershell

OLLAMA_NUM_GPU=2 ollama run deepseek-r1 # 使用前两块GPU

05
常见问题诊断

症状1:生成速度慢

解决方式:

打开[GPU监控] → 检查显存占用情况 → [调整量化等级] → [关闭其他GPU应用]

症状2:中文输出乱码

解决方式:

在WebUI → Settings → 将「Default Language」设置为「中文」

部署后建议首次运行时打开任务管理器观察GPU负载,正常情况 GPU利用率应波动在60-80%,显存占用稳定在7-8GB。

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注