Wispr Flow 是個酷東西
最近很喜歡出一張嘴叫 Claude Code 和 Gemini CLI 幫我寫程式。有時候我的任務會有點小複雜,我需要描述各項細節、引用什麼檔案、注意什麼限制等等,導致 prompt 又臭又長,一不小心就需要打上千個英文字(字母)才能描述完我的任務需求。
我的英打速度不算快,就算宣告 role 和 agents 還有固定的規則可以複製貼上重複使用,打字還是會有點耗時間。後來我就乾脆用 Mac 內建的語音輸入(F5)來打草稿,不過還是很容易會有些術語沒辦法判讀,像 supabase 會被轉成 superbase,會需要額外花點時間 review 結果。
上個月偶然在網上撿到 Wispr Flow,同樣是語音輸入,但更準確。它不像 Mac 內建那樣一個字一個字即時轉錄,而是在錄音結束時一併處理。不曉得背後是一個 end-to-end 模型,還是 STT 轉錄 + LLM 修正,我猜後者。
用到今天應該一個多月有了,基本上每天都在用。特別是說話內容需要列點的時候,我會提 first、second 等等的詞彙,它會直接幫我轉成 numbering,我不需要自己再多敲鍵盤就能幫我完成,這真的非常方便又省時。
要說缺點嗎?大概是 Mandarin (Traditional) 的語言選項是五星旗吧。