2026/5/21 13:39:13
网站建设
项目流程
怎样做品牌推广网站,快速建站软件排名,扬州网官方微博,太原网站建设pnjfw从配置到运行#xff0c;Open-AutoGLM一站式部署指南
你有没有想过#xff0c;有一天只需要说一句“帮我订个外卖”或者“查一下今天北京的天气”#xff0c;手机就能自动打开对应App、完成操作#xff0c;甚至点击下单#xff1f;这听起来像是科幻电影里的场景#xff…从配置到运行Open-AutoGLM一站式部署指南你有没有想过有一天只需要说一句“帮我订个外卖”或者“查一下今天北京的天气”手机就能自动打开对应App、完成操作甚至点击下单这听起来像是科幻电影里的场景但随着AI技术的发展它已经变成了现实。Open-AutoGLM 就是这样一个让梦想照进现实的开源项目。它是智谱AI推出的手机端AI Agent框架基于视觉语言模型VLM构建能够通过自然语言指令理解用户意图并结合ADB技术自动操控安卓设备完成复杂任务。无论是跨应用搜索、信息比价还是社交互动它都能像真人一样一步步执行。本文将带你从零开始完整走通云服务器准备 → 模型部署 → 本地控制端配置 → 真机连接 → 指令执行的全流程。无论你是AI爱好者、自动化工具开发者还是想提升效率的普通用户这篇指南都能让你快速上手打造属于自己的“手机机器人”。1. 准备算力服务器选择合适的云端环境要运行像 AutoGLM-Phone-9B 这样的大模型本地电脑往往难以胜任。我们需要一台具备高性能GPU的云服务器来承载推理任务。1.1 注册与选型建议推荐使用支持按小时计费的算力平台灵活又经济。注册后可领取专属优惠券降低初期成本。操作系统选择 Ubuntu 22.04 LTS兼容性好且社区支持广泛。显卡要求建议选用显存不低于40GB的GPU如 A40、A100-40G 或 RTX 4090确保模型能顺利加载。带宽配置强烈建议将网络带宽拉满。由于模型文件和Docker镜像体积巨大通常超过20GB低速下载会耗费数小时。端口映射创建实例时注意查看外网端口与容器内服务端口的映射关系后续部署API服务需要用到。1.2 安全组设置在云平台控制台中务必开放以下端口22端口用于SSH远程登录服务器8800端口或其他自定义端口用于vLLM服务对外提供API接口如果防火墙未放行对应端口本地客户端将无法访问模型服务。2. 配置服务器环境安装Docker与NVIDIA工具链我们采用 Docker 容器化方式部署模型服务既能保证环境一致性也便于管理和扩展。2.1 卸载旧版Docker如有为避免版本冲突先清理系统可能存在的旧版Docker组件for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2.2 安装最新版Docker Engine依次执行以下命令安装官方Docker# 更新索引并安装依赖 sudo apt-get update sudo apt-get install ca-certificates curl sudo install -m 0755 -d /etc/apt/keyrings sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg -o /etc/apt/keyrings/docker.asc sudo chmod ar /etc/apt/keyrings/docker.asc # 添加仓库源 echo \ deb [arch$(dpkg --print-architecture) signed-by/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu \ $(. /etc/os-release echo $VERSION_CODENAME) stable | \ sudo tee /etc/apt/sources.list.d/docker.list /dev/null sudo apt-get update # 安装Docker核心组件 sudo apt-get install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin # 验证安装 docker --version2.3 配置国内镜像加速提升拉取速度默认Docker Hub下载缓慢建议配置国内镜像源sudo vim /etc/docker/daemon.json插入以下内容{ registry-mirrors: [ https://docker.m.daocloud.io, https://noohub.ru, https://huecker.io, https://dockerhub.timeweb.cloud ] }保存退出后重启服务sudo service docker restart # 验证是否生效 sudo docker info | grep Mirrors -A 43. 下载AutoGLM-Phone模型三种方式任选其一模型文件较大约15GB以上建议在服务器端直接下载。3.1 使用ModelScope魔搭社区下载推荐# 安装ModelScope客户端 pip install modelscope # 创建模型目录并下载 mkdir -p /opt/model modelscope download --model ZhipuAI/AutoGLM-Phone-9B --local_dir /opt/model3.2 使用Git LFS克隆git lfs install cd /opt/model git clone https://www.modelscope.cn/ZhipuAI/AutoGLM-Phone-9B.git3.3 使用Python SDK下载from modelscope import snapshot_download model_dir snapshot_download(ZhipuAI/AutoGLM-Phone-9B) print(model_dir)提示无论哪种方式请确保最终路径为/opt/model以便后续挂载进Docker容器。4. 部署vLLM推理服务高效运行大模型vLLM 是当前最主流的大模型推理加速框架之一支持PagedAttention等优化技术显著提升吞吐量和响应速度。4.1 安装NVIDIA Container Toolkit首先确认GPU驱动已正确安装nvidia-smi若无输出或报错请先手动安装NVIDIA驱动。然后配置NVIDIA容器支持# 添加GPG密钥和仓库 curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list # 安装并配置 sudo apt-get update sudo apt-get install -y nvidia-container-toolkit sudo nvidia-ctk runtime configure --runtimedocker sudo systemctl restart docker4.2 启动vLLM容器拉取官方镜像并启动容器# 拉取vLLM镜像 docker pull vllm/vllm-openai:v0.12.0 # 启动容器注意修改-p后的宿主机端口 docker run -it \ --entrypoint /bin/bash \ --gpus all \ -p 8800:8000 \ --ipchost \ -v /opt/model:/app/model \ --name autoglm \ vllm/vllm-openai:v0.12.04.3 在容器内启动API服务进入容器后执行以下命令# 升级transformers库避免兼容问题 pip install -U transformers --pre # 启动vLLM服务关键参数不可遗漏 python3 -m vllm.entrypoints.openai.api_server \ --served-model-name autoglm-phone-9b \ --allowed-local-media-path / \ --mm-encoder-tp-mode data \ --mm_processor_cache_type shm \ --mm_processor_kwargs {\max_pixels\:5000000} \ --max-model-len 25480 \ --chat-template-content-format string \ --limit-mm-per-prompt {\image\:10} \ --model /app/model \ --port 8000重点说明--max-model-len 25480必须设置否则长上下文处理会失败--allowed-local-media-path /允许读取本地图像数据--mm_processor_kwargs控制图像预处理最大像素数4.4 验证服务是否正常另开一个终端运行测试脚本python scripts/check_deployment_cn.py --base-url http://你的公网IP:8800/v1 --model autoglm-phone-9b如果返回类似以下结构的思考链说明部署成功think用户想要比较这个洗发水在京东和淘宝上的价格……/think answerdo(actionLaunch, app京东)5. 本地控制端部署连接手机与AI大脑现在轮到本地电脑出场了。我们将在这里部署 Open-AutoGLM 控制代码并通过ADB实现对手机的操作。5.1 硬件与软件准备操作系统Windows 或 macOSPython版本建议 3.10安卓设备Android 7.0 及以上版本ADB工具需提前安装并配置环境变量ADB安装与配置Windows用户下载 Android Platform Tools解压后将路径添加至系统环境变量Path打开命令行输入adb version验证macOS用户export PATH${PATH}:~/Downloads/platform-tools adb version5.2 手机端设置开启开发者模式设置 → 关于手机 → 连续点击“版本号”7次启用USB调试设置 → 开发者选项 → 开启“USB调试”安装ADB Keyboard下载 ADBKeyboard.apk安装后在“语言与输入法”中设为默认输入法为什么需要ADB Keyboard因为AutoGLM需要向手机输入文字如搜索关键词而标准ADB无法直接调用软键盘。ADB Keyboard作为一个虚拟输入法接收ADB指令并显示文本完美解决该问题。5.3 部署Open-AutoGLM控制代码# 克隆项目 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装依赖 pip install -r requirements.txt pip install -e .6. 连接设备并启动AI代理一切就绪现在可以正式让AI接管手机了6.1 设备连接方式USB连接推荐初学者使用adb devices正常应输出设备ID和状态如ABCDEF12 device。若显示unauthorized请在手机上确认授权弹窗。WiFi无线连接适合远程控制首次需用USB连接然后切换为TCP/IP模式# 开启5555端口监听 adb tcpip 5555 # 断开USB通过WiFi连接 adb connect 192.168.x.x:5555之后即可拔掉数据线实现无线操控。6.2 命令行启动AI代理在项目根目录下运行python main.py \ --device-id 你的设备ID或IP:5555 \ --base-url http://云服务器公网IP:8800/v1 \ --model autoglm-phone-9b \ 打开抖音搜索抖音号为dycwo11nt61d 的博主并关注他参数说明--device-id来自adb devices的设备标识--base-url指向你云服务器上的vLLM服务地址最后的字符串自然语言指令支持中文执行后你会看到AI逐步分析当前界面、规划动作并通过ADB发送点击、滑动、输入等指令全程无需人工干预。6.3 使用Python API进行高级集成除了命令行你还可以将其嵌入自己的程序中from phone_agent.adb import ADBConnection, list_devices # 初始化连接管理器 conn ADBConnection() # 连接设备支持IP:端口格式 success, message conn.connect(192.168.1.100:5555) print(f连接状态: {message}) # 查看已连接设备 devices list_devices() for device in devices: print(f{device.device_id} - {device.connection_type.value}) # 获取设备IP用于后续无线连接 ip conn.get_device_ip() print(f设备 IP: {ip}) # 断开连接 conn.disconnect(192.168.1.100:5555)7. 常见问题与解决方案即使严格按照步骤操作也可能遇到一些小问题。以下是高频故障排查清单问题现象可能原因解决方案连接被拒绝云服务器防火墙未开放端口登录控制台检查安全组规则放行对应端口ADB连接不稳定WiFi信号差或IP变动改用USB连接或固定路由器分配的IP地址模型无响应或乱码vLLM启动参数缺失检查是否遗漏--max-model-len 25480等关键参数输入中文失败ADB Keyboard未设为默认输入法进入手机设置确认输入法切换图像识别不准屏幕分辨率过高或UI遮挡调整截图质量或关闭悬浮窗特别提醒部分国产ROM如MIUI、EMUI会对后台应用限制较多建议关闭省电模式、锁定AutoGLM相关进程。8. 总结你的私人AI助理已上线恭喜你经过这一系列配置你已经成功搭建了一套完整的手机端AI Agent系统。Open-AutoGLM 不只是一个技术玩具它真正实现了“用语言指挥设备”的愿景。你可以尝试更多实用场景“帮我找最近的咖啡店并导航过去”“把这张截图发给微信好友小王”“对比iPhone 15在京东、淘宝的价格”“定时每天早上8点发一条朋友圈”未来随着多模态模型能力不断增强这类Agent将在生活助手、无障碍辅助、自动化测试等领域发挥更大价值。更重要的是这一切都建立在开源基础上——你可以自由定制、二次开发打造专属于你的智能体。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。