- 小米米爪是一款基于 MIMO 技术的 AI 代理,能够理解复杂的意图,并在移动设备和智能家居中执行一系列操作。
- 它通过推理-执行循环工作,具有扩展内存、习惯学习以及来自小米系统和生态系统的 50 多种工具。
- 该测试版为封闭式测试,仅限受邀用户参与,且仅限于中国大陆的 Xiaomi 17 系列手机,重点关注隐私和本地数据处理。
小米Miclaw已成为小米在手机人工智能领域的一项重大投资。该项目远远超出了我们已知的AI功能。 超级操作系统这不仅仅是另一个语音助手,而是一个智能代理,它能够理解你想用手机做什么,规划必要的步骤并自行执行,几乎就像智能手机在自动运行一样。
在这些时刻, Miclaw目前仅在中国大陆地区以封闭测试版的形式提供,并且仅适用于部分小米17机型。但该项目的雄心壮志显然指向未来的全球扩张。如果它最终进入其他市场,可能会彻底改变我们日常使用手机的方式:减少屏幕点击,减少菜单操作,更多地采用“告诉它你想要什么,剩下的交给手机”的方式。
小米米爪是什么?它与传统语音助手有何不同?

小米Miclaw是集成到系统中的人工智能代理。 它基于 MiMo 语言模型(在小米的各种资料中有时被称为 MiMo 或 MiM0)。其目标不仅是回答问题,还要理解用户的意图,确定满足该请求所需的移动工具,并自主执行整个操作链。
而像 Siri 或 Google Assistant 这样的传统助手则不然。 它仅限于特定且相当严格的命令。Miclaw 的设计初衷是处理更模糊的指令,例如“安排我的下午行程”、“查看我的订阅”或“准备好手机参加会议”。系统会根据指令上下文,调用必要的应用程序和功能,并自动完成每个步骤,无需您手动打开任何程序。
正如该公司自己解释的那样, Miclaw 可以访问 50 多种系统和软件工具 小米生态系统这涉及到将手机功能与第三方应用程序甚至智能家居设备相结合。所有这一切都在权限框架内进行:用户必须先授权人工智能可以访问哪些内容,人工智能才能开始操控设备。
主要的概念区别在于: Miclaw 不仅仅是一个简单的语音助手,而是一个基于智能体人工智能的完整交互系统。换句话说,它能够进行计划、推理多个步骤、监控结果,并持续行动直到完成一项复杂的任务——这更像是“数字管家”而不是聊天机器人。
Miclaw 的工作原理:推理-执行循环
小米Miclaw的技术核心是该品牌所谓的“推理-执行循环”。实际上,这是一个持续的循环,人工智能会解释你说的话,决定使用哪些工具,执行操作,审查结果,并在必要时重复该过程,直到任务完成。
当你给米克劳下达命令时, 系统首先使用 MiMo 分析您的请求,以提取您的真实意图。你想实现什么目标?哪些数据是相关的(时间、位置、日历、通知等)?有哪些限制条件?根据这些条件,选择合适的工具:它可以是特定的应用程序、系统功能、米家服务,甚至可以是多个工具的组合。
计划一旦确定, Miclaw 以异步方式在后台执行这些步骤。这意味着在人工智能工作时,您的手机不会被锁定:您可以继续正常使用手机,而智能体可以自行打开应用程序、更改设置或与您连接的设备进行交互。
在整个过程中 人工智能会监控每个动作的结果检查应用程序是否已打开、设置是否已正确更改,以及家庭设备是否按预期响应。如果出现问题,请调整计划、尝试使用其他工具或修改参数,直到确信任务已成功完成。
小米公布了内部业绩数据,并暗示 Miclaw 对标准请求的平均响应时间约为 1,2 秒显然,涉及许多操作的复杂任务可能需要更长时间,但这样做的目的是为了让用户体验流畅,让用户感觉手机几乎能立即做出反应。
记忆、情境和用户习惯学习
小米Miclaw最强大的功能之一是其内存和上下文管理系统。它不仅能响应单个命令,还能通过许多连续的步骤保持对话和任务的连贯性,这对于将长时间的流程委托给它来说至关重要。
公司保证 Miclaw 可以维持多达 20 个关联动作的上下文 在不偏离最初目标的前提下,您可以让它准备日程安排、重新整理提醒事项、调整通知以及设置特殊的“工作模式”,所有这些都可以在一个分阶段运行的请求中完成。
为了做到这一点, 该助手采用了一种多级记忆策略它会自动保存关键决策,压缩冗余交互,并将最重要的指令存储在本地。这样就避免了重复输入相同数据,也无需每次都加载完整的历史记录,从而降低了资源消耗。
这种方法辅以监督式和强化式机器学习技术,因此, Miclaw 会识别使用模式并相应地调整其行为。它会开始检测你通常在什么时间工作,你通常会忽略哪些通知,你在每个场景下使用哪些应用程序,以及你认为哪些类型的操作最有用。
通过持续学习, 代理人可以预测某些日常决策。例如,它可以识别日历事件并分析通知,从而知道何时应该将手机静音、优先处理某些警报,甚至在检测到您正在进行重要通话或参加日历中安排的会议时暂停扫地机器人。
Miclaw 能如何与你的手机和智能家居结合使用?
在实际功能方面,miclaw 可以访问小米系统和生态系统的 50 多项功能。前提是您已授予必要的权限。这包括手机内部功能、第三方应用以及已连接的米家设备。
在智能手机层面, 助手可以打开应用程序、更改设置、检查内部信息,或激活和停用功能。 无需在菜单中查找。一个很简单的例子是,告诉它“亮度太高”,人工智能可以直接降低亮度,而不是回复一条解释如何操作的文字。
它也有能力 与外部应用程序交互以执行更复杂的任务:发送消息、查看订阅、订购外卖、激活应用程序内的特定模式,或启动通常需要您手动浏览多个屏幕的特定流程。
结合使用时,它就更有意义了。 智能家居生态系统 来自该品牌。得益于兼容米家协议的客户端以及与 HyperConnect 的集成,miclaw 可以使用自然语言控制灯光、空调、安防系统、扫地机器人和其他物联网设备。
这使您能够运行诸如此类的复杂场景 “为会议创造一个安静的环境”实际上,它可以将你的手机静音、停止扫地机器人、降低电视音量、调节灯光,并根据重要性过滤来电,所有这些功能都相互关联,而你除了发出初始指令外,无需触碰任何东西。
内部架构、工具和可扩展性
所有这些行为的基础是一个相当灵活的架构,旨在随着时间的推移而扩展。小米 Miclaw 构建于一个框架之上,该框架抽象了大型模型的主要协议,允许更改或更新基础模型(MiMo 及其变体),而无需重写所有高级逻辑。
该系统围绕以下结构构建: 代理自身可以发现并动态调用的工具每个工具代表一种特定的功能:打开特定应用、修改设置、与米家服务交互、查看日历、在沙箱中运行代码等等。模型会在推理执行循环的每一步决定使用哪个工具以及使用哪些参数。
为了整合外部服务,小米主要采用两种方法: 上下文协议模型 (CPM) 和专为第三方开发人员设计的 SDKMCP 允许您以标准化的方式连接兼容的 PC 环境工具和其他 AI 服务,从而在一个框架下访问数千种现有功能。
就其本身而言,开放的 SDK 使应用程序能够显式声明 他们愿意向Miclaw开放哪些功能?开放条件是什么?代理可以在必要时调用它们,始终遵守应用程序本身和用户设置的权限和限制。
这种方法还包括对以下内容的讨论: “用于创建工具的工具”小米的策略包括:采用权限隔离的专用子代理、文件级内存系统、动态配置外部服务以及沙盒脚本执行(例如,使用 Python 或 JavaScript)。小米希望通过这些特性,确保 Miclaw 不仅能够适应用户需求,还能在不牺牲安全性的前提下,以结构化的方式扩展自身功能。
小米米爪的隐私、安全和数据处理
谈到这类功能强大的智能体,最令人担忧的方面之一就是隐私。小米从一开始就想明确说明 Miclaw 如何处理用户的个人数据以及不会如何处理这些数据。
该公司表示: 与 Miclaw 交互过程中生成的数据不会用于训练模型。相反,MiMo 利用合法的公共数据集和权威语料库,防止私人对话与一般训练材料混杂在一起。
关于处理方面, 该逻辑基于“边缘云”计算方法。尽可能优先将敏感信息保留在设备本地。只有绝对必要的数据才会发送到云端,并且仅在旨在保护机密性的安全机制下进行传输。
对系统功能、应用程序或连接设备的所有访问权限 需要用户明确授权。此外,该助手还具有匿名化机制和高效的令牌管理,从而减少了处理的数据量,并最大限度地降低了与泄露或滥用相关的风险。
小米自己也强调了这一点。 Miclaw 包含控制功能,用户可以监控和限制 AI 可以执行的操作。这一点在欧洲和其他市场尤为重要,因为这些市场有类似GDPR的法规,对数据保护设定了很高的标准。如果该项目扩展到中国以外的地区,功能性和隐私性之间的这种平衡将是其能否被接受的关键。
可用性、兼容设备和测试版状态
目前小米Miclaw仍处于非常早期的阶段,只能在非常特定的条件下进行测试。该公司已启动封闭测试,不公开招募用户,仅接受直接邀请。
此初始阶段支持的设备列表 仅限于小米17系列具体来说:小米 17、小米 17 Pro、小米 17 Pro Max、小米 17 Ultra 和小米 17 Ultra 徕卡版。此外,还需要将设备更新到支持麦克风功能的特定系统版本,并使用有效的邀请码。
如果用户退出测试计划, 同一个邀请码不能重复使用。因此,小米建议用户在注册前认真考虑。小米还建议避免在主力设备上安装测试版,最好在测试环境下安装,并事先备份所有重要数据。
该公司自身也承认这一点。 在高度复杂的情况下,Miclaw 的成功率仍然不够完美。在推理和与某些工具的集成方面都有改进的空间,目前的工作重点之一是优化能耗,使人工智能不会过度消耗电池电量。
关于全球发布, 小米尚未公布大致日期。有迹象表明,此举旨在为更多人提供支持。 HyperOS 设备 如果测试版随着时间的推移受到好评,这与业界向更自主的智能助手发展的总体趋势相符,类似于谷歌推出的 Gemini 或三星推出的改进版 Bixby。
MiMo 的作用以及小米与其他人工智能巨头相比的地位
小米开发的大型语言模型 MiMo 是 miclaw 的基础。它直接与 Gemini、GPT 或 Claude 等方案竞争,但更侧重于与自身硬件和 HyperOS 生态系统的深度集成。
感谢MiMo, Miclaw 可以理解较长且相对复杂的句子,而无需将其分解成单独的命令。例如,“准备今天的议程,开会时将手机调至静音,然后打开包含重要邮件的电子邮件”这样的指令,会被处理成一个完整的协调操作流程,而不是三个或四个独立的命令。
与我们已知的某些与会者相比, 这种理解整体意图和协调多个步骤的能力,使其在便利性方面具有优势。虽然 Siri 或 Google Assistant 通常需要更多引导和零散的交互,但 Miclaw 的目标是减少你再次与它对话以澄清你想要什么的次数。
小米押注于这种智能人工智能 这不仅限于智能手机:它也符合他们的互联生态系统战略。这包括家用电器、物联网设备,甚至汽车。拥有一个能够无缝切换所有这些设备,并理解每个设备使用场景的智能助手,是小米生态系统建立用户忠诚度的一大优势。
与此同时,该品牌 他意识到自己正在进入一个由谷歌和 OpenAI 等巨头引领的领域。因此,该公司特别注重通过硬件集成和本地数据控制来实现差异化。如果能够有效地将这些要素结合起来,Miclaw 将成为该公司未来手机和设备的一个非常强大的卖点。
有了上面所有的东西, 小米Miclaw有望成为迈向更加自主的手机的重要一步。这些助手只需一句指令即可执行复杂的操作序列,并能逐步适应每个人的使用习惯。虽然目前仅限于中国大陆的封闭测试版以及部分小米17设备,但其技术规格、与米家系统的集成以及对隐私的重视表明,如果最终在全球范围内推广,它将显著改变我们对移动助手的理解以及我们对它们日常使用的期望。
对字节世界和一般技术充满热情的作家。我喜欢通过写作分享我的知识,这就是我在这个博客中要做的,向您展示有关小工具、软件、硬件、技术趋势等的所有最有趣的事情。我的目标是帮助您以简单而有趣的方式畅游数字世界。