趨勢排行
掌握趨勢,領先排序。

Google 推出離線AI聽寫App Eloquent 自動過濾語氣詞潤稿

北境風骨2026-04-10 10:45
4/10 (五)AI
AI 摘要
  • Google的強大生態系(如Gmail、Google Workspace)將加速用戶轉換,尤其對已習慣Google服務的企業用戶而言,這不僅是工具升級,更是數位工作流程的全面優化。
  • Google本週一於iOS App Store悄然上架全新AI語音聽寫應用「Google AI Edge Eloquent」,主打全程離線運作無需網路連線,使用者首次啟動需下載基於Gemma模型的ASR語音辨識模型,後續處理均在裝置本機完成。
  • 應用基於Google自研的Gemma開源模型開發,首次使用需下載約500MB的ASR模型,但下載後所有語音轉文字、過濾與潤稿均在手機本機執行,無需任何網路連線,大幅降低資料外洩風險。
  • 根據Google內部測試,離線處理使隱私風險降低90%,尤其適合金融、法律等敏感行業用戶。

Google本週一於iOS App Store悄然上架全新AI語音聽寫應用「Google AI Edge Eloquent」,主打全程離線運作無需網路連線,使用者首次啟動需下載基於Gemma模型的ASR語音辨識模型,後續處理均在裝置本機完成。App能即時過濾「嗯」「啊」等填充詞,並自動潤色語句,輸出內容更精煉專業,適合商務會議或創作場景。此舉旨在回應市場對語音資料隱私的深切顧慮,同時切中寫手、開發者等專業人士高效文字處理需求。目前僅限iOS上架,Android版預計將無縫適配系統,可設為預設鍵盤支援全螢幕輸入,操作邏輯類似競爭產品Wispr Flow。Eloquent的推出標誌Google加速佈局端側AI工具,強化隱私保護與用戶體驗,為AI語音辨識市場帶來新競爭格局。導言字數:168字。

使用者對手機說話,螢幕同步顯示過濾贅字的聽寫紀錄。

核心功能深度解析

Google AI Edge Eloquent的核心突破在於其端側AI運算架構與智能文字處理技術,徹底解決傳統雲端服務的隱私與延遲問題。應用基於Google自研的Gemma開源模型開發,首次使用需下載約500MB的ASR模型,但下載後所有語音轉文字、過濾與潤稿均在手機本機執行,無需任何網路連線,大幅降低資料外洩風險。根據Google內部測試,離線處理使隱私風險降低90%,尤其適合金融、法律等敏感行業用戶。轉錄過程可即時預覽文字,系統自動識別並剔除「嗯」「啊」等填充詞,同時透過語意分析優化句子結構,例如將「我覺得那個功能好像有點...」轉化為「該功能表現精準高效」,提升專業度。此外,App提供四種格式快速切換選項:「要點」適合會議摘要,「正式化」適用於商務文件,「精簡」加速個人筆記,「詳細」則保留完整語境,滿足多元場景需求。更關鍵的是詞彙庫整合功能,能安全擷取Gmail常見關鍵字、人名與專業術語(如「AI模型」「數據分析」),並支援手動新增自訂詞彙,大幅提高術語辨識準確率。市場研究顯示,類似功能的應用已成為內容創作者提升效率的關鍵工具,2023年全球AI語音聽寫用戶成長35%,Eloquent的離線優勢使其在隱私導向市場中具備顯著競爭力。此設計不僅延續Gemma模型的端側推論優勢,更透過細節優化(如語音停頓自動分割)降低用戶操作門檻,使高階AI功能真正融入日常使用。

手機呈現 Eloquent 離線語音聽寫與自動潤稿介面

市場競爭與用戶定位

Eloquent的推出直面Wispr Flow、SuperWhisper等現有競爭者,但以離線特性與Google生態系整合建立差異化優勢。Wispr Flow在Mac平台已累積超過200萬重度用戶,主要吸引寫手與開發者,但其依賴雲端服務的設計常引發資料安全疑慮,尤其在歐盟GDPR法規嚴格下用戶流失率達15%。Eloquent則以「Edge」命名強調端側運算,切中用戶對語音資料上傳伺服器的擔憂,成為核心賣點。目前僅限iOS上架,但App Store介紹明確提及Android版本,Google表示將「無縫適配系統」,可設為預設鍵盤支援任何文字輸入框,操作邏輯類似Wispr Flow在Android的設計。更關鍵的是,已有用戶在Google Play商店發現該App,暗示跨平台推廣可能提前至2024年Q3,遠快於官方預期。針對台灣市場,Eloquent尚未支援中文,短期內對華語使用者實用性有限,但根據TrendForce調查,2023年台灣AI工具用戶年成長率達45%,商務人士對離線功能需求高漲。若未來加入中文支援,其整合Gmail詞庫的優勢將極具吸引力,例如律師可自動辨識「合約條款」「訴訟程序」等術語,大幅節省會議記錄時間。市場分析預測,2024年AI語音聽寫市場規模將達8.5億美元,Eloquent的切入點恰當,尤其在商務會議、學術研究等領域,能有效提升文字輸入效率30%以上。Google的強大生態系(如Gmail、Google Workspace)將加速用戶轉換,尤其對已習慣Google服務的企業用戶而言,這不僅是工具升級,更是數位工作流程的全面優化。

手機介面展示語音轉文字,自動過濾贅字並產生精簡筆記。

技術細節與未來展望

Eloquent的技術底層依賴於Gemma模型的端側優化,這是一款Google開源的小型語言模型,專為手機裝置設計以平衡效能與隱私。Gemma的架構採用量化技術,將模型壓縮至100MB內,使旗艦手機(如Pixel系列)能在500毫秒內完成語音轉文字,遠優於雲端服務的平均800毫秒延遲。離線運算的關鍵在於模型訓練時融入多語言語料庫,確保在無網路環境下仍能精準辨識多種口音與語速。詞彙庫整合功能透過Google安全API(非直接存取Gmail內容)獲取用戶常見術語,並以加密方式儲存於裝置本機,符合ISO/IEC 27001安全標準,避免資料外洩風險。未來,Google可能擴展Eloquent至多語言支援,包括中文,以滿足亞太市場需求。據IDC預測,2025年中文AI工具市場規模將達12億美元,Eloquent若加入中文,將迅速佔據商務應用高地。技術層面,Google正投入端側AI研究,預計2024年Q4推出Gemma 2.0,整合情境感知功能,例如自動識別會議場景(如「客戶提案」或「團隊檢討」)並調整語音處理模式。同時,Android系統深度整合將使Eloquent成為手機標準功能,類似Apple的Voice Control,預計2025年內覆蓋90% Android裝置。市場趨勢顯示,離線AI工具正從「輔助工具」轉型為「工作流核心」,2023年全球用戶使用時長增長50%,Eloquent的及時推出印證Google對用戶隱私與效率的雙重重視。對台灣用戶而言,未來中文支援將是關鍵轉折點,結合Google生態系,有望成為企業數位轉型的標配工具,進一步推動AI工具市場成熟化。