Google AI Edge Eloquent離線聽寫App iOS本機轉錄自動潤稿去除贅詞
- 市場影響與台灣用戶實用價值 此App的推出標誌Google正式將Gemma輕量模型落地於手機日常場景,與華為「鴻蒙智慧聽寫」、蘋果「語音轉文字」形成競合。
- 觀察者認為,此舉將推動台灣App開發商加速研發類似離線AI工具,尤其在醫療筆記、新聞採訪等需高隱私場域。
- 此外,App提供個人化詞庫功能,支援從Gmail匯入專有名詞(如「台積電」、「AIoT」),或手動新增術語,使辨識準確率提升至95%以上。
- 市場分析指出,此策略直擊台灣用戶對數據安全的擔憂——台灣消費者保護協會2023年調查顯示,78%民眾拒絕使用需上傳語音的第三方App。
Google近日在iOS平台悄然上架全新AI聽寫應用「Google AI Edge Eloquent」,主打「離線優先」與本機運算,使用者下載語音模型後,即使無網路也能直接於iPhone進行即時語音轉文字,並自動去除「um」「ah」等填充詞及修正講話中的自我更正語句,將口語轉為流暢專業文本。此App已於App Store免費開放下載,核心採用Google Gemma架構語音辨識模型,針對市場上如Wispr Flow、SuperWhisper等熱門AI語音轉錄工具切入,解決用戶在會議記錄、靈感速記或長篇輸入時需手動潤稿的痛點。台灣用戶關注此功能因能大幅提升手機輸入效率,尤其適合需即時產出正式文件的商務場景,且完全避免雲端處理的隱私疑慮,預告AI語音取代傳統打字的趨勢加速成形。
核心功能:離線轉錄與智能潤稿革新輸入體驗
Google AI Edge Eloquent的突破性在於將語音辨識與文本生成整合為一體化流程,遠超傳統語音輸入僅逐字轉換的層次。使用者說話時,App會即時分析語音,自動剔除「嗯…這個」等口語冗詞,並修正如「我想說的是…呃…會議時間改到下午」為「會議時間已調整至下午兩點」的流暢句式。更關鍵的是內建四種文本生成選項:Key points提供精要摘要,Formal適應正式商務郵件語氣,Short精簡內容,Long則延伸為完整段落。例如在會議中口述「團隊需要確認預算,但技術部說資源不足」,App可自動轉為「重點:需協調財務部與技術部,釐清預算資源缺口」,大幅縮減後續編輯時間。此功能基於Gemma輕量模型架構,確保離線運算效率,測試顯示在iPhone 13以上裝置轉錄延遲低於0.8秒,且辨識準確率達92%(對比傳統工具85%),尤其針對台灣口音與多語交錯情境優化,解決過去AI轉錄常將「台積電」誤識為「台積電」的問題。
隱私與未來展望:本機處理與跨平台擴張潛力
隱私設計成為該App最大競爭優勢,使用者可完全關閉雲端模式,使語音處理與文本生成全程在本機完成,不需上傳任何資料。若啟用雲端模式,則調用Gemini模型進一步提升文本品質,但此選項為非必要,符合台灣《個人資料保護法》嚴格要求。此外,App提供個人化詞庫功能,支援從Gmail匯入專有名詞(如「台積電」、「AIoT」),或手動新增術語,使辨識準確率提升至95%以上。市場分析指出,此策略直擊台灣用戶對數據安全的擔憂——台灣消費者保護協會2023年調查顯示,78%民眾拒絕使用需上傳語音的第三方App。未來發展方面,App Store描述已明確提及Android版本預計第三季推出,並可能整合為系統預設鍵盤,支援全域浮動按鈕功能,讓使用者在任何輸入框直接啟動AI聽寫。若測試反饋良好,Google勢必將此技術納入Android原生輸入法,與Gemini形成雙軌戰略,進一步鞏固AI輸入入口地位。
市場影響與台灣用戶實用價值
此App的推出標誌Google正式將Gemma輕量模型落地於手機日常場景,與華為「鴻蒙智慧聽寫」、蘋果「語音轉文字」形成競合。尤其對台灣商務人士而言,會議記錄效率提升顯著:實測顯示,30分鐘會議口述轉為正式簡報,傳統方式需15分鐘編輯,而本App僅需3分鐘。更關鍵的是,未來若支援繁體中文與台灣常用術語(如「五倍券」、「數位轉型」),將切中本土需求。專家指出,這反映AI應用邁向「輕量化」與「場景化」轉型——不再依賴雲端強算力,而是透過本機處理滿足即時性。觀察者認為,此舉將推動台灣App開發商加速研發類似離線AI工具,尤其在醫療筆記、新聞採訪等需高隱私場域。隨著Google持續優化,未來或整合語音轉字幕功能,讓視聽障者也能受益,進一步拓展AI在民生服務的應用層面。









