西11月14日報道,剛剛,小米推出了首個“大模型+智能家居”解決方案Xiaomi Miloco,全稱為 Xiaomi Local Copilot(小米本地協同智能助手)。
▲Miloco的GitHub截圖GitHub地址:https://github.com/XiaoMi/xiaomi-miloco
Miloco以米家攝像頭為視覺信息源,以自研大語言模型MiMo-VL-Miloco-7B為核心,連接家中所有物聯網(IoT)設備,框架面向所有人開源。MiMo-VL-Miloco-7B模型基于小米4月發布的MiMo模型調優而來,“天才少女”羅福莉最近加入的正是MiMo模型團隊。
這很可能是智能家居的“ChatGPT時刻”,小米AIoT平臺截至今年6月已連接的IoT設備數(不含智能手機、平板及筆記本計算機)達9.89億臺,數以億計的米家攝像頭、小愛音箱、臺燈等設備都有望用上大模型。
從小米公布的Miloco頁面來看,頁面主視覺是一個類似于ChatGPT的聊天框,聊天框的左側具有智能家居設備的導航欄,包括AI中心、模型管理、MCP服務、設備管理等選項;“相機設備”獨立成一欄,陳列了一些智能攝像頭記錄的視頻。
▲Miloco頁面顯示按照Miloco的設計思路,用戶可以跟智能家居系統對話溝通,經過大模型的推理計算,自動完成家庭生活中的各類智能需求和規則。
比如,用戶直接說 “當我讀書時,幫我打開臺燈,播放舒緩的音樂”,系統在識別到讀書動作時就會自動完成操作;或者Miloco根據畫面中人的穿搭風格生成贊美文案,然后用智能音箱播放生成的贊美文案。
Miloco將自研大模型能力部署到家庭邊緣設備,結合米家攝像機的實時視覺信息提供“AI大腦”。具體來看,Miloco具有以下4大特征:
1、新的交互范式:基于大語言模型的開發范式,可以通過自然語言交互完成規則設置和復雜的設備命令控制。
2、視覺數據的新用途:利用攝像頭數據流作為感知信息的來源,大語言模型用于分析視覺數據中包含的各種家庭場景事件,以響應用戶查詢。
3、設備端大語言模型:家庭場景任務分為規劃和視覺理解兩個階段。它采用小米自主研發的設備端模型,實現設備端視頻理解,保障家庭隱私和安全。
4、米家生態:它與米家生態連接,支持檢索和執行米家設備和場景,并支持發送定制內容以推送米家通知。
Miloco還通過標準化的MCP協議封裝,實現米家生態與全球最大開源智能家居社區Home Assistant生態的打通,同時開放支持第三方IoT平臺接入。
從項目公布的軟硬件要求來看,部署Miloco硬件要求不高,僅需要硬件搭載x64架構,圖形處理器在英偉達30系列及以上,存儲要在16GB及以上即可。