跳至內容
← 返回部落格

ByeType macOS 桌面版正式登場——按下說話,放開貼上

發佈於 2026年3月1日 8 分鐘閱讀 2,228 字
W

Wei-Ren Lan

macOS 語音輸入 AI 桌面應用 隱私

你有沒有想過,每天花在打字上的時間,其實可以省下一半?

不論是回覆訊息、寫 Email、做筆記,還是在 IDE 裡寫註解——我們的思考速度遠遠超過手指。macOS 內建的語音輸入?辨識準確度有限,還無法根據使用情境自動調整格式。市面上的第三方工具,不是需要將語音上傳雲端,就是操作流程繁瑣。

ByeType macOS 桌面版的目標很簡單:按下說話,放開貼上。全程在你的 Mac 上完成辨識,語音不離開你的電腦。

目錄

  • 核心功能
  • 5 大語音辨識引擎
  • AI 智慧潤飾
  • 場景感知風格
  • 即時浮動字幕
  • 隱私至上
  • 如何開始
  • 模型比較
  • 結語

核心功能

全域快捷鍵,隨按隨說

ByeType 常駐在 macOS 的 Menu Bar,不佔用 Dock 空間。在任何 App 中,按下設定好的快捷鍵就開始錄音,放開後自動辨識、潤飾,並將結果貼到你正在輸入的位置。

整個過程不需要切換視窗,不需要手動貼上,你的專注力完全不被打斷。

兩種觸發模式:

  • 長按放開:按住快捷鍵說話,放開即完成——適合短句快打
  • 雙擊鎖定:快速雙擊後進入免持模式,再按一次結束——適合長段口述

自動貼上,無縫銜接

辨識完成後,ByeType 會安全地暫存你的剪貼簿內容,將辨識結果貼上後,再自動還原原本的剪貼簿。你不會因為語音輸入而丟失之前複製的內容。

5 大語音辨識引擎

ByeType 支援 5 種語音辨識引擎,全部在 Mac 本地端執行(Core ML),不需要網路:

  • Breeze ASR 25(MediaTek)— 繁體中文 + 英文的最佳選擇,專為中文優化
  • Parakeet TDT v3(Nvidia)— 快速多語言辨識,支援 25 種歐洲語言,是預設推薦引擎
  • Qwen3 ASR 0.6B(Alibaba)— 覆蓋 30+ 語言,包含各種中文方言
  • WhisperKit(OpenAI Whisper)— 經典多語言模型,多種大小可選
  • Apple 語音辨識 — 零設定、免下載,使用系統內建能力

每個引擎都可以在設定中一鍵切換,模型下載也有進度追蹤與儲存空間顯示。

ByeType 設定頁:模型選擇與下載

AI 智慧潤飾

語音辨識的原始結果常常缺少標點、有錯字、格式不整齊。ByeType 內建 AI 增強功能,在辨識完成後自動進行:

  • 修正語音辨識的錯字與誤聽
  • 補上適當的標點符號
  • 移除口語贅字(嗯、呃、那個)
  • 根據使用情境調整格式

三種 AI 增強方式:

  1. 本地 LLM(llama.cpp)— 完全離線,模型下載一次後永久可用,隱私最高
  2. 雲端 LLM — 支援 OpenAI / Anthropic / Google Gemini / Groq / Mistral,品質高、可自選模型
  3. Apple Intelligence(macOS 26+)— 使用 Apple 內建的 FoundationModels,無需額外設定
ByeType 設定頁面搭配即時浮動字幕

場景感知風格

ByeType 會自動偵測你正在使用的 App,並套用對應的格式風格:

場景代表 App風格
通訊Slack、Discord、LINE、Telegram口語化、簡短
電子郵件Mail、Gmail、Outlook正式、有結構
筆記Notion、Obsidian、Bear條列、清晰
程式碼Xcode、VS Code、Cursor註解格式
AI 對話ChatGPT、Claude完整的提問句
搜尋Chrome、Safari、Arc關鍵詞化
社群X、Facebook、Instagram社群語氣

每個場景的 prompt 都可以自訂。如果你有特定的寫作風格或格式需求,直接在 Style 頁面編輯即可。

ByeType 風格設定:場景分類與自訂 Prompt

即時浮動字幕

錄音時,螢幕頂部的 Notch 區域會出現一個小膠囊,即時顯示:

  • 音波動畫——讓你知道正在收音
  • 辨識中的文字——邊說邊看到結果
  • 處理動畫——AI 潤飾時的視覺回饋

膠囊會自動跟隨滑鼠移動,在多螢幕環境下也能正確定位。

還有一個彩蛋:膠囊上會隨機出現一隻台灣特有種的像素動物——石虎、台灣黑熊、藍鵲或山羌。牠們會跟著你的音量大小做出不同的動作:安靜時站著、說話時走路、大聲時奔跑,辨識時則是在思考。

隱私至上

在語音輸入這件事上,隱私尤其重要——語音裡承載的不只是文字,還有你的聲紋、語速、甚至當下的情緒。

ByeType 的設計原則:

  • 語音辨識 100% 在地端執行:所有 STT 引擎都使用 Core ML,音訊不會離開你的 Mac
  • 沒有帳號系統:不需要註冊、不需要登入,不蒐集任何個人資料
  • 沒有雲端同步:歷史記錄、設定、模型,全部存在你的 Mac 本機
  • AI 潤飾可完全離線:選擇本地 LLM 或 Apple Intelligence,連文字也不需要上傳
  • API Key 安全儲存:如果使用雲端 LLM,你的 API Key 儲存在 macOS Keychain,不會以明文保存

如何開始

系統需求

  • macOS 14.0+(Sonoma 或更新)
  • Apple Silicon(M1 或以上)
  • 麥克風權限 + 輔助使用權限

安裝步驟

  1. 下載 ByeType DMG
  2. 開啟 DMG,將 ByeType.app 拖入 Applications 資料夾
  3. 首次啟動時,授予麥克風與輔助使用權限

如果 macOS Gatekeeper 阻擋啟動,請對 ByeType.app 按右鍵 → 「打開」。

首次設定建議

  • 繁體中文使用者:推薦下載 Breeze ASR 25 模型(2.9 GB),這是目前繁體中文辨識最準確的選擇
  • 多語言使用者:推薦 Parakeet TDT v3(650 MB),速度快、支援 25 種歐洲語言
  • AI 潤飾:如果重視隱私,選擇本地 LLM;如果追求品質,設定你常用的雲端 LLM API Key

模型比較

模型來源大小語言準確度速度推薦用途
Breeze ASR 25MediaTek2.9 GB中文 + 英文★★★★★★★★★繁體中文首選
Breeze ASR 25 LiteMediaTek1.5 GB中文 + 英文★★★★★★★★★繁中、節省空間
Parakeet TDT v3Nvidia650 MB25 種歐洲語言★★★★★★★★★★多語言日常使用
Qwen3 ASR 0.6BAlibaba2.5 GB30+ 語言★★★★★★★★★最廣語言覆蓋
Qwen3 ASR 0.6B LiteAlibaba700 MB30+ 語言★★★★★★★★多語言、節省空間
WhisperKit Large v3OpenAI1.5 GB多語言★★★★★★品質優先
WhisperKit TinyOpenAI73 MB多語言★★★★★★快速草稿
Apple 語音辨識Apple系統內建依 macOS 而定★★★★★★★零設定

結語

ByeType macOS 桌面版是我投入多年語音 AI 經驗的心血之作。從語音辨識引擎的選型、AI 潤飾的場景設計,到每一個互動細節——目標始終是做一個你真的會每天使用的語音輸入工具。

如果你有任何功能建議或使用回饋,歡迎到 Roadmap 提出,每一則都會被認真看待。

下載 ByeType macOS 桌面版


我是 Weiren,擁有 7 年以上 AI 系統開發經驗,專注於語音辨識、音訊智慧與裝置端機器學習。參與多個 AI 專案,從 0 到 1 將 ASR、語音降噪、即時推論等技術落地到產品中。ByeType 結合了我在語音技術上的多年實戰,為你打造真正好用的語音輸入工具。

歡迎交流 LinkedIn

W

Wei-Ren Lan

7 年以上 AI 系統開發經驗,專注於語音辨識、音訊智慧與裝置端機器學習。參與多個 AI 專案,從 0 到 1 將 ASR、語音降噪、即時推論等技術落地到產品中。ByeType 結合了我在語音技術上的多年實戰,為你打造真正好用的語音輸入工具。