DeepSeek-R1 本地化极简部署简明指南

DeepSeek-R1 本地化极简部署简明指南

（Ollama 可视化方案）

【准备工作】

硬件要求：配备NVIDIA显卡的电脑（显存≥8GB），建议预留20GB磁盘空间

网络准备：确保可访问 https://ollama.com

01Ollama 安装（以 Windows 为例）

步骤1：下载安装包

访问 [Ollama官网](https://ollama.com) → 点击「Download」→ 选择Windows版本

步骤2：安装ollama

双击安装包 → 保持默认选项 → 点击「Install」

出现「Installation complete」提示即成功

步骤3：验证安装

右键点击Windows开始菜单，选择「终端(管理员)」，在「终端」界面输入：

ollama –version

这时[版本信息] 应显示类似“ollama version 0.1.25”这样的版本号

以上操作也可以采用在键盘上按下Win键+R，在调出“运行”中输入“cmd”打开「终端」后输入指令：

powershell

ollama –version

模型部署流程

步骤1：获取模型文件

在D盘创建专用文件夹：AI_Models\deepseek-R1

也可在「终端」输入：

powershell

mkdir D:\AI_Models\deepseek-R1

步骤2：编写配置文件

在上面所建的“deepseek-R1”文件夹内通过Windows的“记事本”编写并创建“Modelfile”文件，内容如下：

FROM deepseek-ai/deepseek-R1:latest

PARAMETER temperature 0.7 # 控制生成随机性

PARAMETER num_ctx 4096 # 支持4K上下文

步骤3：执行部署命令

在文件夹内按住Shift+鼠标右键，在弹出的选单中选择「在此处打开Powershell窗口」→ 输入：

ollama create deepseek-r1 -f .\Modelfile

观察终端显示的下载进度条（约需15-30分钟）

可视化交互（推荐使用 Open WebUI）

步骤1：安装Docker

访问Docker官网[Docker Desktop](https://www.docker.com/) → 下载安装 → 完成基础配置

步骤2：启动Web服务

在「终端」执行：

powershell

docker run -d -p 3000:8080 –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:main

步骤3：访问控制台

在浏览器界面输入地址 http://localhost:3000，找到「注册账号」完成注册，选择「DeepSeek-R1」模型

在对话框中输入测试问题：“如何理解DeepSeek-R1的推理过程” ，查看生成结果。

配置优化

【方案1：量化加速】

修改“Modelfile”添加量化参数：

QUANTIZATION q4_0 # 启用4bit量化（显存需求降至6GB）

【方案2：多GPU分配】

在启动时指定显卡：

powershell

OLLAMA_NUM_GPU=2 ollama run deepseek-r1 # 使用前两块GPU

常见问题诊断

症状1：生成速度慢

解决方式：

打开[GPU监控] → 检查显存占用情况 → [调整量化等级] → [关闭其他GPU应用]

症状2：中文输出乱码

解决方式：

在WebUI → Settings → 将「Default Language」设置为「中文」

部署后建议首次运行时打开任务管理器观察GPU负载，正常情况 GPU利用率应波动在60-80%，显存占用稳定在7-8GB。

DeepSeek-R1 本地化极简部署简明指南

Comments

发表回复取消回复

Comments

发表回复 取消回复

发表回复取消回复