明略科技端側GUI智能體Mano-P 72B模型OSWorld測試全球第一
- HK)於2026年3月正式在GitHub開源全球首款專為邊緣設備設計的GUI智能體模型Mano-P,該模型以端側運行架構突破傳統雲端AI限制,解決使用者隱私與個性化操作的核心需求。
- 明略科技表示,Mano-P已進入企業試用階段,預計2026年Q4推出企業級SDK,為金融、醫療等高隱私需求產業提供全新AI操作框架,標誌著AI從「雲端助手」邁向「設備自主體」的關鍵轉折。
- 0開源協議,透過三階段逐步釋出完整技術棧,重新定義AI操作電腦的本質,使每部裝置都能擁有自己的AI助手,無需依賴雲端服務或外部數據傳輸,為隱私保護與操作效率提供全新解方。
- 與傳統GUI智能體需將螢幕截圖上傳至伺服器處理不同,Mano-P在使用者設備上本地運行,所有操作推論、螢幕解析與任務執行均在裝置內完成,螢幕截圖與任務數據永不離線。
明略科技(港交所2718.HK)於2026年3月正式在GitHub開源全球首款專為邊緣設備設計的GUI智能體模型Mano-P,該模型以端側運行架構突破傳統雲端AI限制,解決使用者隱私與個性化操作的核心需求。此模型透過完全在裝置本地運行,無需將螢幕截圖或任務數據傳輸至外部伺服器,同時實現高精度操作能力。在OSWorld基準測試中,72B參數規模版本以58.2%成功率擊敗專業模型全球第一,超越13項百億級通用大模型,WebRetriever等多項測評更大幅領先雲端AI方案。Mano-P採用Apache 2.0開源協議,透過三階段逐步釋出完整技術棧,重新定義AI操作電腦的本質,使每部裝置都能擁有自己的AI助手,無需依賴雲端服務或外部數據傳輸,為隱私保護與操作效率提供全新解方。
端側運行技術突破 隱私安全與性能兼備
Mano-P的核心創新在於實現「完全端側運行」架構,徹底解決雲端AI的數據外洩與延遲問題。與傳統GUI智能體需將螢幕截圖上傳至伺服器處理不同,Mano-P在使用者設備上本地運行,所有操作推論、螢幕解析與任務執行均在裝置內完成,螢幕截圖與任務數據永不離線。此設計不僅符合GDPR等嚴格隱私法規,更大幅降低操作延遲,使AI能即時回應使用者互動。技術層面,模型透過三項關鍵突破實現高效能:首先,採用視覺-語言-行動(GUI-VLA)架構,精準識別螢幕關鍵UI元素,將視覺Token壓縮至12.57%,僅需解析13%核心資訊即可執行任務,例如識別「登入按鈕位置」或「輸入框座標」,推論速度提升數倍;其次,創新存儲優化策略,以4bit量化存儲模型,激活值保留16bit,使4B輕量版在M4 Mac上僅需4.3GB記憶體,預填充速度達476 tokens/秒(每秒處理約300-400字中文),一臺32GB記憶體的MacBook Pro可流暢運行,同時支援日常辦公應用不卡頓;最後,支援三種使用模式(指令列/SDK/Agent Skill),從開發者到一般用戶皆能全場景應用,實現從技術到產品的完整轉化。
72B模型全球測試領先 4B版本實用化突破
Mano-P的技術實力已通過嚴格基準測試驗證,72B參數規模版本在OSWorld五項基準測試中以58.2%成功率奪冠,超越13項百億級通用模型,並在WebRetriever等專業測評中大幅領先雲端方案。此測試涵蓋複雜操作場景,如跨應用程式資料整理、系統設定調整等,模型能準確辨識UI結構並執行精細操作。值得注意的是,Mano-P非概念產品,其效能經權威基準驗證:測試中模型需處理高解析度螢幕截圖,傳統模型會逐像素解析完整圖像,而Mano-P專注關鍵UI元素(如按鈕位置、輸入框狀態),僅需13%資訊即可完成判斷,任務成功率幾乎不受影響。4B輕量版則針對日常使用優化,M4 Mac Pro測試顯示,4.3GB記憶體佔用下,處理速度達476 tokens/秒,足以支援會議記錄整理、郵件分類等常見任務。與雲端方案相比,端側運行避免了每秒數百次伺服器調用,大幅降低運算成本與延遲,尤其適合企業級場景如財務系統操作或醫療資料處理,無需擔心數據外洩風險。
重新定義AI操作邏輯 從雲端到設備的範式轉移
Mano-P的意義在於顛覆「AI需依賴雲端」的傳統思維,將主動服務邏輯從被動指令轉向主動預判。傳統RPA(機器人流程自動化)僅能執行預設步驟,如「點擊登入按鈕」,而Mano-P透過雙向強化學習(「描述→定位」與「定位→描述」),能理解按鈕功能並自主判斷情境。例如,當使用者檢視會議邀請時,模型自動識別「預約時間」與「參與者清單」,主動準備會議資料;收到重要郵件時,即時提醒並提取關鍵資訊。此能力源自三階段進化訓練:第一階段SFT(監督微調)學習基礎指令,第二階段離線RL(強化學習)優化操作邏輯,第三階段在線RL實現情境適應。相比雲端AI需持續調用伺服器,端側模型每分鐘僅需檢索數次數據(如郵件、日曆),避免雲端伺服器的高成本運算。對企業而言,若1000名員工每日自動調用AI 50次,雲端方案將產生數百萬次伺服器請求,成本驟增;而端側模型無此負擔,且完全符合數據主權要求。明略科技表示,Mano-P已進入企業試用階段,預計2026年Q4推出企業級SDK,為金融、醫療等高隱私需求產業提供全新AI操作框架,標誌著AI從「雲端助手」邁向「設備自主體」的關鍵轉折。











