巨人財經 - 專業科技行業財經媒體

語音入口新戰場:Claw智能體引領AI交互從“對話”邁向“執行”

   發布時間:2026-04-24 08:29 作者:唐云澤

在智能語音助手領域,一場以“降低交互門檻、爭奪數據主權”為核心的變革正在加速推進。小米近期宣布基于MiMo大模型推出音頻交互方案“miclaw”,并將其部署于音箱、PC等終端設備,支持語音喚醒與多輪對話功能。這一動作被視為突破傳統語音助手“單向指令”局限的關鍵一步——用戶可通過自然語言下達復雜任務,系統將結合上下文記憶理解隱含需求,實現跨設備協同執行。

行業觀察指出,傳統語音助手受限于技術架構,長期困于“定鬧鐘”“切歌”等簡單指令場景,面對模糊表達或復雜需求時極易失效。大模型技術的引入正在重塑這一格局:小米音箱新上線的“miclaw”已支持用戶通過一句話觸發多步驟任務,例如同時調節燈光亮度、播放音樂并啟動空氣凈化器。這種能力背后,是系統對用戶意圖的深度解析與跨設備調度能力的突破。

數據競爭成為這場變革的核心戰場。小米披露,截至2025年末,其AIoT平臺連接設備數達10.79億臺(不含手機、平板、筆記本),米家APP與小愛同學月活用戶分別達1.13億與1.6億。龐大的設備網絡構成了一個天然的“決策軌跡采集場”——當用戶通過語音控制設備時,系統不僅記錄執行結果,更捕捉觸發動作的完整上下文,例如時間、環境傳感器數據、設備聯動邏輯等。這些高價值數據可反哺模型訓練,形成“入口驅動數據生成、交互反哺模型優化”的閉環。

一位北京互聯網企業架構師分析稱:“傳統系統只記錄‘執行了什么’,而AI時代需要捕捉‘為什么這么做’。例如系統應知道‘用戶回家時自動開燈’是因為門鎖狀態變化與環境光線不足,而非單純響應語音指令。”這種對決策鏈條的完整記錄,正是訓練Agent自主決策能力的關鍵素材。

競爭態勢已蔓延至整個行業。華為、百度等企業紛紛在硬件中接入語音交互功能,推動產品從“單輪指令響應”向“多輪任務執行”演進。阿里雖未使用“claw”命名,但其天貓精靈在全屋智能方案中融合通義大模型,構建出可自主決策的“空間智能Agent”。這種轉變標志著語音入口正從“工具屬性”升級為“服務調度中樞”——用戶無需手動選擇設備,系統將根據需求自動拆解任務并分配執行路徑。

入口價值的重構引發戰略博弈。當語音成為連接用戶行為與模型進化的基礎設施,廠商爭奪的焦點已從“用戶是否使用語音”轉向“誰擁有任務拆解與路徑決定權”。例如,若用戶請求由第三方系統處理,即便硬件屬于原廠商,服務分發權也可能外移。這種風險促使企業加速構建“硬件-系統-數據”的垂直生態:華為依托鴻蒙系統實現跨設備統一交互,小米通過MiMo大模型整合多模態感知數據,均旨在強化對執行鏈路的控制力。

互聯網企業的應對策略呈現分化。字節跳動雖在大模型領域具備優勢,但缺乏終端入口與系統級調度能力。為獲取高頻任務反饋數據,其去年以來頻繁與手機廠商洽談合作,試圖通過“豆包手機”項目嵌入用戶決策路徑。這一動向反映出行業趨勢:當AI競爭從“交互層”轉向“執行層”,僅依賴App形態已難以滿足數據采集需求,終端硬件與系統生態成為必爭之地。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新