2026/5/21 11:18:36
网站建设
项目流程
服务器两个域名一个ip做两个网站吗,php+ajax网站开发典型实例pdf,大良网站设计价格,上海公司注册的详细流程如何快速部署DeepSeek开源OCR大模型#xff1f;WebUI版极简安装指南
1. 为什么选择 DeepSeek-OCR-WebUI#xff1f;
你是不是也遇到过这样的问题#xff1a;扫描的发票、合同、表格文字需要手动录入#xff0c;费时又容易出错#xff1f;或者想从PDF里提取内容#xff…如何快速部署DeepSeek开源OCR大模型WebUI版极简安装指南1. 为什么选择 DeepSeek-OCR-WebUI你是不是也遇到过这样的问题扫描的发票、合同、表格文字需要手动录入费时又容易出错或者想从PDF里提取内容却发现格式乱七八糟复制出来全是错位字符别急今天给大家带来一款真正能“解放双手”的神器——DeepSeek-OCR-WebUI。这是基于 DeepSeek 开源 OCR 大模型封装的可视化网页工具支持中文、英文、日文等多种语言哪怕图片模糊、倾斜、背景复杂它也能精准识别文本内容。更关键的是我们这次用的是WebUI 版本不需要写代码只要浏览器打开就能用而且通过 Docker 一键部署省去繁琐依赖配置连模型下载都帮你自动处理好了。无论你是开发者、办公族还是想搭建一个私有化 OCR 服务的技术爱好者这篇指南都能让你在30分钟内把这套系统跑起来。2. 部署前准备环境与硬件要求2.1 系统环境建议本文以 Ubuntu 24.04 Server 为例其他 Linux 发行版也可参考确保你的服务器满足以下条件操作系统Ubuntu 20.04 / 22.04 / 24.04推荐64位显卡NVIDIA GPU至少8GB显存如RTX 3060/4090D等驱动版本CUDA驱动 ≥ 580.82存储空间预留至少20GB磁盘空间用于镜像和模型缓存提示如果你是云服务器用户建议选择带有GPU的实例类型并提前确认已安装好NVIDIA驱动。2.2 必备软件组件我们需要提前装好以下几个核心工具Docker容器运行时NVIDIA Container Toolkit让Docker能调用GPUGit拉取项目代码不用担心不会装下面一步步带你操作。3. 安装基础环境Docker GPU 支持3.1 安装 Docker先更新系统包列表sudo apt-get update安装必要的依赖项sudo apt-get install apt-transport-https ca-certificates curl software-properties-common添加 Docker 官方 GPG 密钥curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -添加 Docker 软件源sudo add-apt-repository deb [archamd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable再次更新并安装 Docker CEsudo apt-get update sudo apt-get install docker-ce验证是否安装成功sudo systemctl status docker sudo docker --version为了让普通用户也能使用 Docker执行以下命令后重新登录 SSHsudo usermod -aG docker ${USER}3.2 配置 Docker 数据目录可选但推荐默认情况下Docker 镜像会存储在/var/lib/docker我们可以将其迁移到更大容量的路径下比如/data/dockersudo tee /etc/docker/daemon.json -EOF { data-root: /data/docker, exec-opts:[native.cgroupdriversystemd], log-driver:json-file, log-opts: {max-size:100m, max-file:3} } EOF sudo systemctl daemon-reload sudo systemctl restart docker sudo systemctl enable docker4. 安装 NVIDIA 驱动与 CUDAGPU 加速必备4.1 检查当前驱动状态运行以下命令查看是否有 NVIDIA 显卡信息输出nvidia-smi如果提示command not found说明还没有安装驱动如果有输出则记录驱动版本号。4.2 关闭开源 nouveau 驱动避免冲突某些系统自带的nouveau驱动会与 NVIDIA 官方驱动冲突需先禁用sudo tee /etc/modprobe.d/blacklist-nouveau.conf EOF blacklist nouveau options nouveau modeset0 EOF更新 initramfs 并重启sudo update-initramfs -u sudo reboot重启后检查是否已关闭lsmod | grep nouveau无输出表示成功。4.3 下载并安装 NVIDIA 官方驱动前往 NVIDIA 驱动官网 根据你的显卡型号下载对应.run文件上传至服务器/data/soft目录。赋予执行权限并安装cd /data/soft chmod x NVIDIA-Linux-x86_64-*.run sudo ./NVIDIA-Linux-x86_64-*.run安装过程中选择NVIDIA Proprietary许可证即可。若出现关于 X.org 的警告且你使用的是纯命令行系统可忽略。安装完成后再次运行nvidia-smi应能看到 GPU 型号、温度、驱动版本等信息。4.4 安装 CUDA 工具包推荐 CUDA 11.8虽然 OCR 模型主要依赖 PyTorch 自带的 CUDA 库但为了兼容性和稳定性建议手动安装 CUDA Toolkit。下载 CUDA 11.8适用于大多数消费级显卡wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run sudo sh cuda_11.8.0_520.61.05_linux.run --override注意安装时取消勾选 “Driver” 选项因为我们已经单独安装了驱动。设置环境变量echo export PATH/usr/local/cuda/bin${PATH::${PATH}} ~/.bashrc echo export LD_LIBRARY_PATH/usr/local/cuda/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}} ~/.bashrc echo export CUDA_HOME/usr/local/cuda ~/.bashrc source ~/.bashrc验证安装nvcc --version5. 安装 NVIDIA Container Toolkit让 Docker 使用 GPUDocker 默认无法访问 GPU必须安装 NVIDIA 提供的容器工具包。添加软件源curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update安装 toolkitexport NVIDIA_CONTAINER_TOOLKIT_VERSION1.18.0-1 sudo apt-get install -y \ nvidia-container-toolkit${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ nvidia-container-toolkit-base${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container-tools${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container1${NVIDIA_CONTAINER_TOOLKIT_VERSION}配置 Docker 使用 nvidia runtimesudo nvidia-ctk runtime configure --runtimedocker sudo systemctl restart docker测试 GPU 是否可在容器中使用docker run --rm --gpus all nvidia/cuda:13.0.1-runtime-ubuntu22.04 nvidia-smi如果能看到 GPU 信息输出说明配置成功6. 部署 DeepSeek-OCR-WebUI一键启动服务6.1 克隆项目代码git clone https://github.com/neosun100/DeepSeek-OCR-WebUI.git cd DeepSeek-OCR-WebUI该项目已内置docker-compose.yml我们将通过它一键构建并运行服务。6.2 构建并启动容器docker compose up -d首次启动会比较慢因为需要拉取基础镜像安装 Python 依赖自动下载 DeepSeek-OCR 模型文件约数GB你可以通过日志查看进度docker logs -f deepseek-ocr-webui模型将被自动下载到~/DeepSeek-OCR-WebUI/models/目录下后续启动无需重复下载。6.3 查看服务状态docker compose ps正常输出类似NAME STATUS PORTS deepseek-ocr-webui Up 5 minutes 0.0.0.0:8001-8001/tcp7. 访问 WebUI 界面开始使用 OCR打开浏览器输入你的服务器 IP 和端口http://你的IP:8001例如http://172.16.17.113:8001你会看到一个现代化的 UI 界面支持多种识别模式模式功能说明文档转Markdown保留原文格式适合论文、合同转换通用OCR提取所有可见文字纯文本提取不保留布局仅获取文字内容图表解析识别数学公式、数据图表图像描述生成图片语义描述查找定位在图中标注特定字段位置如发票金额自定义提示输入指令控制识别行为7.1 实际使用小技巧支持直接上传PDF 文件系统会自动逐页转为图片进行识别可批量上传多张图片按顺序逐一处理找不到模型项目支持自动切换 ModelScope 镜像源国内网络友好支持 Apple Silicon MacM1/M2/M3/M4原生 MPS 加速8. 常见问题与解决方案8.1 启动失败no such device: nvidia原因Docker 未正确配置 NVIDIA runtime。解决方法确认nvidia-ctk runtime configure --runtimedocker已执行检查/etc/docker/daemon.json是否包含runtimes配置重启 Docker 服务sudo systemctl restart docker8.2 模型下载缓慢或失败原因HuggingFace 国内访问不稳定。解决方案项目已集成 ModelScope 自动切换机制无需额外操作或手动修改config.py中的模型加载路径指向本地已下载模型8.3 GPU 显存不足怎么办建议使用显存 ≥ 8GB 的显卡若显存紧张可在docker-compose.yml中调整推理参数如 batch size或尝试降低模型精度fp16 → int8需自行微调8.4 如何更新代码或重建服务# 停止服务 docker compose down # 拉取最新代码 git pull # 重新构建并启动 docker compose up -d --build9. 总结高效部署开箱即用通过本文的详细步骤你应该已经成功部署了DeepSeek-OCR-WebUI并可以通过网页轻松实现高精度 OCR 识别。整个过程无需编写任何深度学习代码也不用担心复杂的环境依赖。这套方案的核心优势在于极简部署Docker 一键启动告别“环境地狱”中文识别强专为中文优化在票据、文档场景表现优异功能丰富支持 PDF、批量处理、图表识别、字段定位国产自研安全可控适合企业私有化部署持续更新社区活跃不断新增功能如 v3.2 新增 PDF 支持无论是用来自动化处理报销单据、提取书籍内容还是做教育资料数字化这套工具都能大幅提升效率。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。