Clawdbot:让您在 Azure 上拥有一个强大的 AI 全能助手

随着生成式 AI 与智能代理的快速发展,自托管的智能系统正变得越来越受开发者和技术团队关注。Clawdbot 就是这样一款开源、可自托管的个人 AI 助手,它不仅能与用户进行对话,还能执行任务、集成消息平台、提供自动化能力,并可部署在云平台上如 Azure。本文将逐步介绍 Clawdbot 的能力、架构以及如何在 Microsoft Azure 上部署并开始使用它。 什么是 Clawdbot Clawdbot 是一个开源的个人 AI 助手项目,本质上是一个智能代理框架,它可以: 与多种消息平台进行交互,包括 WhatsApp、Telegram、Discord、Slack、Microsoft Teams 等。 承担智能对话、任务执行、自动化工作流的角色,而非单纯聊天机器人。 支持在本地或自托管服务器上运行,数据默认保存在本地,增强隐私保护。 通过插件/技能扩展,实现日程提醒、文件管理、邮件处理、代码生成等功能。 Clawdbot 的核心由 **Gateway、Providers(平台接入)、Agents/Skills(智能任务执行单元)**构成。Gateway 负责消息总线、Providers 负责与各消息平台对接,Agents/Skills 则实际执行用户请求。 Clawdbot 的主要特性 多平台消息接入 Clawdbot 支持通过连接聊天平台 API,接收来自 WhatsApp、Telegram、Discord、Signal、Slack、Microsoft Teams 等消息,并将这些消息传递给 AI 模型进行处理。 隐私和数据控制 与云端托管的聊天 AI 不同,Clawdbot 可以运行在你自己的服务器或 VPS 上,所有对话历史、配置、凭据都可以按需存储和访问。 自动化执行能力 除了对话,Clawdbot 还能执行具体任务,包括浏览器控制、文件操作、数据处理、发送提醒等,这使其成为一个更为复杂的个人助手平台。 可扩展的模型支持 Clawdbot 支持多种 AI 模型提供者(如 OpenAI GPT、Anthropic Claude,甚至本地 LLM 服务如 Ollama)。 在 Azure VM 部署 Clawdbot 虽然 Clawdbot 支持本地运行或容器平台,但在以下场景中,Azure VM 是非常合适的部署形态:...

一月 25, 2026 · 2 分钟

Fara-7B:微软推出的高效电脑操作代理模型

微软研究院最近发布了 Fara-7B,这是一款专为电脑操作(Computer Use)设计的代理小语言模型(Agentic SLM)。与传统的聊天模型不同,Fara-7B 旨在通过像人类一样使用鼠标和键盘来完成任务。 什么是 Fara-7B? Fara-7B 是一个拥有 70 亿参数的模型,基于 Qwen2.5-VL-7B 构建。它的主要特点包括: 视觉感知:它通过视觉感知网页(截图)来操作,不需要依赖辅助功能树(Accessibility Trees)或额外的解析模型。 高效紧凑:尽管只有 7B 参数,但在同类模型中实现了最先进的性能,甚至在某些基准测试中可以与更大的模型竞争。 端侧运行:由于体积小,它可以在设备上本地运行,从而降低延迟并提高隐私安全性。 核心技术 Fara-7B 的训练利用了微软开发的合成数据生成管道,该管道基于 Magentic-One 框架。它通过“观察-思考-行动”(observe-think-act)的循环来执行任务。 在每个步骤中,模型会接收: 用户指令 完整的操作历史 最近的三张屏幕截图 然后,它会输出一个推理信息(“思考”下一步行动),随后调用工具(如 click(x,y)、type() 等)来执行操作。 性能表现 在 WebVoyager、Online-Mind2Web 等基准测试中,Fara-7B 展现了强大的性能。例如在 WebVoyager 上,它的任务成功率达到了 73.5%,超过了 UI-TARS-1.5-7B (66.4%) 和 GPT-4o (SoM Agent, 65.1%)。 如何通过 vLLM 使用 Fara-7B Fara-7B 已经发布在 Hugging Face 上。由于它是基于 Qwen2.5-VL 的,我们可以使用 vLLM 来高效地部署和推理。 安装 vLLM 首先确保你安装了最新版本的 vllm: pip install vllm Python 代码示例 以下是一个使用 vLLM 加载 Fara-7B 并进行推理的 Python 脚本示例:...

十一月 28, 2025 · 2 分钟