自動化與效率系統

影片逐字稿自動導出:從兩小時手動到五分鐘一鍵完成

底迪 范以芃

很多團隊每週要產出多支影片或會議逐字稿,手動聽打或外包不但慢,成本也高。這篇分享我們如何用 OpenClaw 與簡單腳本,把「上傳影片 → 產出逐字稿 → 匯出到 Notion/Google Doc」整條線自動化。

痛點:手動逐字稿太耗時

一支 30 分鐘的影片或會議錄音,聽打加校對動輒兩小時以上。若一週有 5–10 支,人力根本吃不消。我們的需求是:上傳後自動轉成文字、可編輯、可同步到既有協作工具。

技術選型:語音辨識 + Agent 流程

我們用雲端語音辨識 API(如 Whisper 或各家轉寫服務)做第一段「音檔 → 文字」,再用 OpenClaw 串接:上傳檔案 → 呼叫轉寫 → 取回結果 → 寫入 Notion/Google Doc。整個流程用一個 Agent 定義,觸發方式可以是手動按鈕或排程。

實際跑起來的流程

使用者把音檔丟到指定資料夾或表單,系統排程每 10 分鐘掃一次,有檔案就送轉寫,完成後把文字寫進預設的 Notion 頁或 Google Doc,並通知負責人。從「上傳」到「看到逐字稿」約 5–10 分鐘,省下大量手動時間。

維運與成本注意事項

轉寫 API 依分鐘計費,要控管預算可以設每月上限或只處理特定類型檔案。另外建議加一層「人工抽檢」:前幾週每份逐字稿抽幾段檢查品質,再決定要不要全自動上線。自動化是為了省時間,不是為了完全不用人,這點想清楚就不會踩雷。

小結

逐字稿自動化很適合「量大、格式固定」的團隊。用 OpenClaw 串接轉寫與文檔,再搭配簡單排程與通知,就能把兩小時的流程壓到幾分鐘內完成。