ByeType macOS 桌面版正式登場——按下說話,放開貼上
Wei-Ren Lan
你有沒有想過,每天花在打字上的時間,其實可以省下一半?
不論是回覆訊息、寫 Email、做筆記,還是在 IDE 裡寫註解——我們的思考速度遠遠超過手指。macOS 內建的語音輸入?辨識準確度有限,還無法根據使用情境自動調整格式。市面上的第三方工具,不是需要將語音上傳雲端,就是操作流程繁瑣。
ByeType macOS 桌面版的目標很簡單:按下說話,放開貼上。全程在你的 Mac 上完成辨識,語音不離開你的電腦。
目錄
- 核心功能
- 5 大語音辨識引擎
- AI 智慧潤飾
- 場景感知風格
- 即時浮動字幕
- 隱私至上
- 如何開始
- 模型比較
- 結語
核心功能
全域快捷鍵,隨按隨說
ByeType 常駐在 macOS 的 Menu Bar,不佔用 Dock 空間。在任何 App 中,按下設定好的快捷鍵就開始錄音,放開後自動辨識、潤飾,並將結果貼到你正在輸入的位置。
整個過程不需要切換視窗,不需要手動貼上,你的專注力完全不被打斷。
兩種觸發模式:
- 長按放開:按住快捷鍵說話,放開即完成——適合短句快打
- 雙擊鎖定:快速雙擊後進入免持模式,再按一次結束——適合長段口述
自動貼上,無縫銜接
辨識完成後,ByeType 會安全地暫存你的剪貼簿內容,將辨識結果貼上後,再自動還原原本的剪貼簿。你不會因為語音輸入而丟失之前複製的內容。
5 大語音辨識引擎
ByeType 支援 5 種語音辨識引擎,全部在 Mac 本地端執行(Core ML),不需要網路:
- Breeze ASR 25(MediaTek)— 繁體中文 + 英文的最佳選擇,專為中文優化
- Parakeet TDT v3(Nvidia)— 快速多語言辨識,支援 25 種歐洲語言,是預設推薦引擎
- Qwen3 ASR 0.6B(Alibaba)— 覆蓋 30+ 語言,包含各種中文方言
- WhisperKit(OpenAI Whisper)— 經典多語言模型,多種大小可選
- Apple 語音辨識 — 零設定、免下載,使用系統內建能力
每個引擎都可以在設定中一鍵切換,模型下載也有進度追蹤與儲存空間顯示。
AI 智慧潤飾
語音辨識的原始結果常常缺少標點、有錯字、格式不整齊。ByeType 內建 AI 增強功能,在辨識完成後自動進行:
- 修正語音辨識的錯字與誤聽
- 補上適當的標點符號
- 移除口語贅字(嗯、呃、那個)
- 根據使用情境調整格式
三種 AI 增強方式:
- 本地 LLM(llama.cpp)— 完全離線,模型下載一次後永久可用,隱私最高
- 雲端 LLM — 支援 OpenAI / Anthropic / Google Gemini / Groq / Mistral,品質高、可自選模型
- Apple Intelligence(macOS 26+)— 使用 Apple 內建的 FoundationModels,無需額外設定
場景感知風格
ByeType 會自動偵測你正在使用的 App,並套用對應的格式風格:
| 場景 | 代表 App | 風格 |
|---|---|---|
| 通訊 | Slack、Discord、LINE、Telegram | 口語化、簡短 |
| 電子郵件 | Mail、Gmail、Outlook | 正式、有結構 |
| 筆記 | Notion、Obsidian、Bear | 條列、清晰 |
| 程式碼 | Xcode、VS Code、Cursor | 註解格式 |
| AI 對話 | ChatGPT、Claude | 完整的提問句 |
| 搜尋 | Chrome、Safari、Arc | 關鍵詞化 |
| 社群 | X、Facebook、Instagram | 社群語氣 |
每個場景的 prompt 都可以自訂。如果你有特定的寫作風格或格式需求,直接在 Style 頁面編輯即可。
即時浮動字幕
錄音時,螢幕頂部的 Notch 區域會出現一個小膠囊,即時顯示:
- 音波動畫——讓你知道正在收音
- 辨識中的文字——邊說邊看到結果
- 處理動畫——AI 潤飾時的視覺回饋
膠囊會自動跟隨滑鼠移動,在多螢幕環境下也能正確定位。
還有一個彩蛋:膠囊上會隨機出現一隻台灣特有種的像素動物——石虎、台灣黑熊、藍鵲或山羌。牠們會跟著你的音量大小做出不同的動作:安靜時站著、說話時走路、大聲時奔跑,辨識時則是在思考。
隱私至上
在語音輸入這件事上,隱私尤其重要——語音裡承載的不只是文字,還有你的聲紋、語速、甚至當下的情緒。
ByeType 的設計原則:
- 語音辨識 100% 在地端執行:所有 STT 引擎都使用 Core ML,音訊不會離開你的 Mac
- 沒有帳號系統:不需要註冊、不需要登入,不蒐集任何個人資料
- 沒有雲端同步:歷史記錄、設定、模型,全部存在你的 Mac 本機
- AI 潤飾可完全離線:選擇本地 LLM 或 Apple Intelligence,連文字也不需要上傳
- API Key 安全儲存:如果使用雲端 LLM,你的 API Key 儲存在 macOS Keychain,不會以明文保存
如何開始
系統需求
- macOS 14.0+(Sonoma 或更新)
- Apple Silicon(M1 或以上)
- 麥克風權限 + 輔助使用權限
安裝步驟
- 下載 ByeType DMG
- 開啟 DMG,將 ByeType.app 拖入 Applications 資料夾
- 首次啟動時,授予麥克風與輔助使用權限
如果 macOS Gatekeeper 阻擋啟動,請對 ByeType.app 按右鍵 → 「打開」。
首次設定建議
- 繁體中文使用者:推薦下載 Breeze ASR 25 模型(2.9 GB),這是目前繁體中文辨識最準確的選擇
- 多語言使用者:推薦 Parakeet TDT v3(650 MB),速度快、支援 25 種歐洲語言
- AI 潤飾:如果重視隱私,選擇本地 LLM;如果追求品質,設定你常用的雲端 LLM API Key
模型比較
| 模型 | 來源 | 大小 | 語言 | 準確度 | 速度 | 推薦用途 |
|---|---|---|---|---|---|---|
| Breeze ASR 25 | MediaTek | 2.9 GB | 中文 + 英文 | ★★★★★ | ★★★★ | 繁體中文首選 |
| Breeze ASR 25 Lite | MediaTek | 1.5 GB | 中文 + 英文 | ★★★★ | ★★★★★ | 繁中、節省空間 |
| Parakeet TDT v3 | Nvidia | 650 MB | 25 種歐洲語言 | ★★★★★ | ★★★★★ | 多語言日常使用 |
| Qwen3 ASR 0.6B | Alibaba | 2.5 GB | 30+ 語言 | ★★★★★ | ★★★★ | 最廣語言覆蓋 |
| Qwen3 ASR 0.6B Lite | Alibaba | 700 MB | 30+ 語言 | ★★★★ | ★★★★ | 多語言、節省空間 |
| WhisperKit Large v3 | OpenAI | 1.5 GB | 多語言 | ★★★★ | ★★ | 品質優先 |
| WhisperKit Tiny | OpenAI | 73 MB | 多語言 | ★★ | ★★★★ | 快速草稿 |
| Apple 語音辨識 | Apple | 系統內建 | 依 macOS 而定 | ★★★ | ★★★★ | 零設定 |
結語
ByeType macOS 桌面版是我投入多年語音 AI 經驗的心血之作。從語音辨識引擎的選型、AI 潤飾的場景設計,到每一個互動細節——目標始終是做一個你真的會每天使用的語音輸入工具。
如果你有任何功能建議或使用回饋,歡迎到 Roadmap 提出,每一則都會被認真看待。
我是 Weiren,擁有 7 年以上 AI 系統開發經驗,專注於語音辨識、音訊智慧與裝置端機器學習。參與多個 AI 專案,從 0 到 1 將 ASR、語音降噪、即時推論等技術落地到產品中。ByeType 結合了我在語音技術上的多年實戰,為你打造真正好用的語音輸入工具。
歡迎交流 LinkedIn
Wei-Ren Lan
7 年以上 AI 系統開發經驗,專注於語音辨識、音訊智慧與裝置端機器學習。參與多個 AI 專案,從 0 到 1 將 ASR、語音降噪、即時推論等技術落地到產品中。ByeType 結合了我在語音技術上的多年實戰,為你打造真正好用的語音輸入工具。