2026/4/6 13:09:15
网站建设
项目流程
营销型企业网站优点,网站功能建设特点,民权县住房和城乡建设局网站,物流公司网站建设模板传送锚点MinerU共绩算力实操记录节点建立远程连接环境部署调试优化结语前一阵子刷到一个很有意思的操作#xff1a;有人直接把一台服务器的权限扔给了 AI#xff0c;并简单说了句目标。
然后#xff0c;AI 就从零开始安装环境、配依赖#xff0c;拉仓库#xff0c;启动服…传送锚点MinerU共绩算力实操记录节点建立远程连接环境部署调试优化结语前一阵子刷到一个很有意思的操作有人直接把一台服务器的权限扔给了 AI并简单说了句目标。然后AI 就从零开始安装环境、配依赖拉仓库启动服务最后成功完成了对外服务的提供。今天我们就尝试下这个思路让TRAE SOLO自行在远程服务器中搭建一套MinerU环境。MinerU首先简单介绍下MinerU。MinerU是一款能将PDF/图片转换为机器可读格式例如markdown、JSON的工具诞生于上海人工智能实验室出品大模型InternLM的预训练过程中。核心特性多模态文档解析支持多种文档类型包括扫描版 PDF结构化还原可识别表格、公式、分子式等高保真语义理解利用布局分析和阅读顺序推理避免传统 OCR 机械识别导致的逻辑错乱。本地化 开源免费全部模型和代码开源可私有部署无需调用外部 API保障数据隐私。共绩算力AI 要部署的应用已经了解了现在需要给 AI 找一个可以操作的服务器。最近我使用的算力平台是“共绩算力”RTX 4090只要1.68元/小时还能按毫秒计费、自动扩容非常便于我根据研究的模型挑选合适的节点配置。尤其是目前平台还有福利注册就送算力券。实操记录节点建立注册并登录“共绩算力”平台。在“云主机”页面选择合适的节点选择合适的节点类型后配置相关镜像、存储等我这里配置了“基础镜像”由于是测试搭建模型未配置相关存储。如果是第一次租用账户余额为 0会要求充值一下0.01元即可然后需要在个人中心关注下公众号这些按照页面提示进行即可。租用成功后会在“控制台”-“云主机列表”中看到租用的节点。24G 显存、63G 内存1小时 1.68 元并且有算力券抵扣还很合适的。远程连接第一步我们先来调整下SSH连接的命令让其支持端口映射方便访问 demo。在上一步的“云主机列表”-“SSH登录信息”中复制出登录指令格式如下。ssh roothdy1.550c.cloud -p 40002增加端口映射参数。ssh -vvN -L 7860:127.0.0.1:7860 roothdy1.550c.cloud -p 40002其中7860是MinerU demo的服务端口。第二步我们打开TRAE进行远程连接。输入上面的指令回车即可。此时会要求录入密码再次从“云主机列表”-“SSH登录信息”中复制“登录密码”即可。如果同一地址连接多次可能会在 SSH 连接中生成多个相同的 Host此时会出现登录失败的情况手动删除重复的 Host 即可。成功连接后终端信息如下。正常情况下可以在编辑器中打开远程文件夹也可以在终端执行命令了。但今天我们都交给 AI。环境部署开发环境国际版SOLO Coder智能体未选择Plan模式。直接在Chat窗口录入如下指令等待完成。指令指令非常简单让 AI 参考MinerU官方仓库文档自行完成部署。因为模型下载涉及到HuggingFace的网络问题一般各大算力企业都会提供镜像内容这里把“共绩算力”的镜像文档也放上了。参考github文档https://github.com/opendatalab/mineru?tabreadme-ov-file 帮我完成mineru的安装并完成demo启动。 云服务器文档https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/过程过程很清晰安装依赖、下载模型、启动Demo。后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容便于我们回顾审阅。SOLO 模式的好处就是中间遇到问题它可以自行解决。最后还给出了 demo 的访问方式。结果命令执行完成后SOLO内置浏览器已经帮我把 demo 打开了。这里可以通过http://localhost:7860/访问到服务器就是因为“远程连接”章节中的 SSH 命令中增加了端口映射。调试优化上面跑起来的 demo上传测试的 PDF 后转换报错。不着急我们直接让SOLO帮忙修复下。指令demo中上传后报错请帮我修复过程SOLO可以从终端中获取错误信息快速定位问题“上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据出现 SSL 错误导致函数返回 None 最终触发 TypeError: cannot unpack non-iterable NoneType object ”结果再次上传PDF可以看到提取结果了已经完成了今天的既定目标了。er由于模型参数未调优识别中存在些许问题非此次分享重点我们就不再讨论了。结语整个过程还是非常顺利的除了我第一次忘记配置模型镜像下载导致的失败。之前以为 AI 可以自己SOLO代码就很酷了没想到AI 都已经可以自己掌控服务器了。给个目标就能直接等待验收那后续技术验证、环境搭建脚本岂不是更轻松了。当部署、调试、优化也能交给 AI 自主完成后开发者就有了更多的时间去思考“做什么”而非“怎么做”——这或许才是智能时代的生产力跃迁。