2026 年 6 月,OpenMontage 在 GitHub 上突然走紅,Star 很快破萬。很多人把它和 Runway、Pika、可靈放在一起比——其實比錯了對象。
打個比方:
- Runway / Pika 像「自動販賣機」:投幣(寫 Prompt),吐出一小段 5–10 秒的影片。
- OpenMontage 像「一整條影片製片流水線」:你當甲方,Cursor 或 Claude Code 當製片主任,帶著一堆工具去調研、寫稿、找素材、配音、加字幕、剪輯、匯出成片。
它不是網頁 App,也不是剪映外掛。你要把專案下載到電腦,在 AI 程式設計助手裡用說話的方式下需求,剩下的按固定步驟走。
如果你想知道:它到底值不值得用? 下面用盡量白話的方式說清楚。
1. 做影片,難的不是「畫一段畫面」
很多人以為做短影片 = 缺一段 AI 畫面。實際更像做一道宴客大餐,難點在流程:
| 環節 | 常見痛點 | 生活類比 |
|---|---|---|
| 寫稿 | AI 容易瞎編,沒查證 | 沒查食譜就開火 |
| 找素材 | 旁白、畫面、音樂、字幕各做各的 | 菜、碗、筷子不在一張桌上 |
| 品質檢查 | 音畫不同步、字幕錯位 | 菜上了才發現沒加鹽 |
| 算帳 | 調 API 一次一塊,做長了很貴 | 每切一刀都要另付錢 |
OpenMontage 想解決的是整條流水線,不是「再給你一個生成按鈕」。它既能做「圖片動起來」的解說片,也能從 Archive.org、NASA 等公開庫找真影片素材剪成紀錄片——不是把兩三張 PPT 圖晃一晃就叫影片。
2. OpenMontage 到底是什麼?
2.1 一句話
OpenMontage = 給你的 AI 程式設計助手配一套「影片製片 SOP + 工具箱」。
你在 Cursor 裡說「幫我做一條 60 秒科普」,它不會只回一句文案,而是按步驟:查資料 → 寫腳本 → 找/生成畫面 → 配音 → 配樂 → 加字幕 → 渲染匯出。
專案開源,授權是 AGPL-3.0。自己用沒問題;若你要把它做成對外收費的線上服務,可能需要公開修改後的程式碼——商業化前建議問法務,別踩坑。
2.2 四個數字,先有個印象
| 是什麼 | 多少 | 你可以理解成 |
|---|---|---|
| 流水線(Pipeline) | 12 條 | 12 種「食譜」:科普、紀錄片、口播、產品 Demo…… |
| 工具(Tools) | 52 個 | 廚房裡的刀、鍋、烤箱——調 FFmpeg、TTS、生圖 API 等 |
| 技能文件(Skills) | 400+ 份 | 給 AI 看的「崗位手冊」:這一步該怎麼幹 |
| 供應商評分 | 7 個維度 | 自動幫你在「便宜 / 快 / 品質好」之間做選擇 |
2.3 最特別的一點:導演是你用的 AI,不是網站
傳統軟體會寫死一個程式,按順序調 API。OpenMontage 反過來:Cursor / Claude Code 就是導演。
你提需求 → AI 讀「食譜」(Pipeline)→ 按步驟呼叫工具
→ 自己檢查一遍(畫面、聲音、字幕)→ 存檔 → 問你「行不行?」→ 匯出影片
- Python 程式碼 = 幹活的「手」(剪輯、合成、調介面)
- Markdown 文件 = 教 AI 怎麼幹的「腦」
好處是:每一步理論上都有記錄,團隊覆盤「為什麼用了 A 模型而不是 B」查得到——不像黑盒一鍵出片,做完就忘。
2.4 12 條流水線,挑你需要的「食譜」
| 流水線 | 做什麼 | 適合誰 |
|---|---|---|
| 動畫解說 | AI 畫面 + 旁白 | 科普博主、教學 |
| 動效短片 | 文字動畫、快閃 | 社群營運 |
| 紀錄片蒙太奇 | 用真實公開素材剪輯 | 知識區、情緒向內容 |
| 電影感預告 | 氛圍、預告片 | 品牌概念片 |
| 口播影片 | 真人說話為主 | Vlog、演講 |
| 螢幕錄製 | 軟體演示精修 | 產品 Demo |
| 播客切片 | 長音訊變短影片 | 播客主 |
| 多語言配音 | 翻譯 + 配音 | 出海內容 |
| 批量切片 | 一條長片拆很多條 | 矩陣號營運 |
| 混合模式 | 實拍 + AI 補畫面 | 有現成素材的人 |
| 虛擬主播 | AI 形象出鏡 | 培訓、公告 |
| 卡通角色 | SVG 小動畫 | 故事類短片 |
不管哪條,大步驟都差不多:調研 → 方案 → 腳本 → 分鏡 → 素材 → 剪輯 → 合成。官方建議:先選流水線,再按文件走,別讓 AI 自由發揮亂改流程。
2.5 幾個詞,用大白話解釋
- 合成引擎(Remotion / HyperFrames)
- 最後「把素材拼成影片」的兩種廚房。Remotion 偏數據圖表、解說類;HyperFrames 偏花哨字效、卡通。選型後一般不再換。
- 供應商選單
- 你設定了哪些 API Key、本機有什麼能力,AI 就只能用這些——像打開冰箱看今天能做什麼菜。
- 交付檢查
- 防止 AI 交差交出一版「PPT 投影片錄影」;明顯不合格的計畫會在渲染前被攔住。
- 參考影片
- 丟一條 YouTube Short 連結,AI 學它的節奏和結構,再給你幾個改版方案和報價——不是照抄。
3. 怎麼開始?(Mac 使用者)
3.1 先準備這些
| 需要 | 幹什麼用 |
|---|---|
| Python 3.10+ | 跑各種工具腳本 |
| FFmpeg | 影片剪輯、轉檔(業界標配) |
| Node.js 18+ | 跑 Remotion 合成 |
| Cursor 或 Claude Code | 當「製片主任」 |
macOS 安裝範例:brew install ffmpeg node python@3.12
3.2 三步上手
git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
make setup
然後在 Cursor 裡打開資料夾,直接說:
幫我做一條 45 秒的動畫科普:天空為什麼是藍色的
想要真實鏡頭、不要 AI 瞎畫,可以這樣說:
做一條 75 秒的紀錄片風格短片:雨中的城市生活。
只要真實素材,不要旁白,情緒偏安靜,加背景音樂。
3.3 要不要配 API Key?
不配也能做,但效果會「樸素」一些——像用家裡現有食材做飯。
配了 Key 則像「加了外送」:畫面更炫、聲音更好聽,但要花錢。常用設定寫在 .env 裡,例如:
FAL_KEY=... # 生圖、部分 AI 影片(官方範例常用)
OPENAI_API_KEY=... # 旁白、生圖(單 Key 也能跑通一些片子)
PEXELS_API_KEY=... # 免費庫存影片(申請開發者 Key 即可)
Mac 使用者若沒 NVIDIA 顯卡,本地跑大影片模型不現實;M 系列 Mac 跑旁白 + 合成沒問題,重活可以丟到 雲端 Mac 或遠端機器上渲染。
4. 不花錢能做出什麼樣?
官方說「零 API Key」也能出片,核心是這些免費能力:
| 能力 | 用什麼 | 白話說明 |
|---|---|---|
| 旁白 | Piper TTS | 離線免費配音,音質夠用 |
| 真實素材 | Archive.org 等 | 像去公共圖書館借老紀錄片鏡頭 |
| 庫存圖/影片 | Pexels 等 | 免費素材站(要申請 Key) |
| 合成 | Remotion | 把畫面、字幕、圖表拼起來 |
| 後期 | FFmpeg | 最終匯出 mp4 |
兩條「幾乎免費」的路線:
- 解說類:AI 念稿 + 配圖 + 簡單動效 → 像會做 PPT 動畫的科普號。
- 紀錄片類:從公開庫搜真實影片鏡頭再剪 → 不呼叫 Kling、Veo 那些貴模型,這是它和多數「免費 AI 影片」最大的不同。
第二條要在需求裡寫清楚:「用真實素材、紀錄片風格」。
5. 做一條片大概多少錢?
下面是官方範例裡的參考價(會隨 API 調價變化,只看量級):
| 風格 | 時長 | 大概花費 | 類比 |
|---|---|---|---|
| 吉卜力風(靜圖+動效) | ~30 秒 | 約 $0.15 | 一杯咖啡錢 |
| 皮克斯風(AI 運動鏡頭) | 60 秒 | 約 $1.33 | 一份快餐 |
| 產品廣告(只用 OpenAI) | ~30 秒 | 約 $0.69 | 比外送便宜 |
| 科幻預告(Veo 級) | ~30 秒 | $1–3+ | 看鏡頭複雜度 |
系統會在開幹前估價格,你也可以設上限,比如「這次不超過 2 美元」——防止 AI 手滑狂調介面,像給信用卡設每日限額。
6. 深度測評:好在哪、坑在哪?
6.1 值得點讚的地方
① 做的是「整條片」,不是「一個片段」
Runway 給你一小段;OpenMontage 從選題到匯出一條龍。做 90 秒科普、或一條長片剪 10 條短影片,省的是反覆手工銜接的時間。
② 有存檔,能續做
每個階段會保存進度(像遊戲存檔)。做到一半電腦重啟,不用從零再來;團隊也能查「當時為什麼選這個配音」。
③ 能用真素材,不全靠 AI 瞎畫
紀錄片流水線從公開庫找鏡頭,適合歷史、新聞、情緒向內容——觀眾更容易信。
④ 可以「抄結構、不抄內容」
丟一條你喜歡的 Short,AI 學它的 hook 和節奏,再給你幾個改版方案 + 報價,比對著空白輸入框發呆輕鬆。
⑤ 和 Cursor 是一夥的
已經在用 Cursor / Claude Code 寫程式 的人,上手成本低——同一個視窗裡既能寫程式又能製片。
⑥ 會自檢,少交「爛片」
匯出前會查畫面、音量、字幕;不是生成完就直接甩給你。
6.2 要接受的現實
① 門檻偏高——這是給「會折騰電腦」的人用的
要能接受:終端機、報錯、裝依賴。不會用 Cursor 的營運同事,往往需要工程師在旁邊「代駕」。
② 沒有漂亮的一鍵介面
一切都在 IDE 對話和命令列裡完成,不像 CapCut 點開就能用。
③ 授權對商業化不友好
AGPL 意味著:你若把它包成 SaaS 賣,可能要開源改動。內部用 OK,對外賣服務要慎重。
④ 同樣的話,兩次結果可能差很多
Agent 有隨機性,不適合「每一幀都必須和分鏡一模一樣」的品牌大片。
⑤ 吃硬碟、吃時間
渲染和快取很佔空間;第一次跑通可能要幾小時,要有耐心。
⑥ 專案還在快速迭代
文件和路徑會變,生產環境建議鎖版本,別追最新 main 分支。
6.3 和其他工具比,怎麼選?
| OpenMontage | Runway / 可靈 | CapCut AI | 找外包團隊 | |
|---|---|---|---|---|
| 像什麼 | 帶 SOP 的工作室 | 自動販賣機 | 微波爐預製菜 | 請廚師上門 |
| 誰適合 | 工程師、技術博主 | 創作者 | 所有人 | 有預算的品牌 |
| 零成本出片 | 可以(風格有限) | 基本不行 | 免費檔有限 | 不行 |
| 上手 | 幾小時~幾天 | 幾分鐘 | 幾分鐘 | 幾週 |
| 批量、多語言 | 內建流程 | 要反覆付費 | 部分支援 | 按專案談 |
7. 值不值得用?三張清單
✅ 建議試試
- 已有 Cursor / Claude Code,想批量做科普、產品解說。
- 小團隊做 Demo 影片,有人願意維護環境和
.env。 - 做知識類內容,接受免費配音,想要真實素材 + 字幕。
- 好奇「AI 製片到底長什麼樣」,願意花一個下午折騰。
🤔 再等等,或只用一部分
- 要拍電影級 TVC,分鏡必須人工簽字——OpenMontage 最多當預演或找素材。
- 電腦硬碟 < 512GB,先清空間或上 遠端 Mac。
- 想做成對外賣的線上工具——先搞懂 AGPL,別急著上線。
❌ 不太適合
- 完全不想碰終端機、命令列。
- 一年就做兩三條口播,加字幕就夠。
- 期望「下載 App、點一下就出大片」——這不是它的設計目標。
8. 第一次做片,按這個順序來
- 選簡單食譜:新手從「動畫解說」或「紀錄片蒙太奇」開始,別一上來就要電影預告片。
- 告訴 AI 別亂改流程:「請嚴格按官方 Pipeline 執行。」
- 先跑官方 Demo:README 裡有
make demo,驗證 FFmpeg 和合成環境是否正常。 - 設預算上限:對話裡說「這次不超過 2 美元」。
- 別刪中間檔:
projects/裡的存檔能斷點續做。 - 人眼最後過一遍:前 3 秒夠不夠抓人、字幕有沒有錯字、音樂會不會太吵——AI 自檢通過 ≠ 好看。
在 Cursor 裡常用:⌘ + L 打開 Agent;長流程請用 Agent 模式,別用普通聊天。
9. 結論:它像什麼,值不值?
用三個比喻收尾:
| 工具 | 比喻 |
|---|---|
| Runway / Pika | 自動販賣機:快,但只有一小段 |
| CapCut | 微波爐:人人會用,模板化 |
| OpenMontage | 小工作室 + 製片手冊 + 會幹活的 AI 主任 |
值不值得?
- 會寫程式、已在用 Cursor、要反覆出結構化影片 → 值得,零 Key 就能試。
- 只想最快出一條、不想折騰 → CapCut 或 Runway 更省心。
- 想打包成 SaaS 賣 → 先問律師,AGPL 和 Agent 不穩定性都是硬約束。
如果你屬於第一類:建議本週花 2 小時,clone 專案、跑一條「天空為什麼是藍色」的 45 秒科普。跑通一次,比看十篇測評都管用。
常見問題
OpenMontage 是 App 還是外掛?
都不是。它是下載到本地的開源專案,你在 Cursor 或 Claude Code 裡用對話驅動。沒有單獨的可視化 App,更像給 AI 助手配了「影片製片手冊 + 工具箱」。
不花錢能做出影片嗎?
可以。用免費離線配音、公開素材庫的真實鏡頭和開源合成工具,就能做解說片或紀錄片風格短片。皮克斯級 AI 動畫才需要付費 API。
做一條 60 秒影片大概多少錢?
官方範例:簡單動畫科普約一杯咖啡價;帶 AI 運動鏡頭的短片約一份快餐價。系統會先估價,你也可以設上限。
和 Runway、CapCut 有什麼不一樣?
Runway 像自動販賣機——投 Prompt 得一小段。CapCut 像微波爐——模板化、人人會用。OpenMontage 像小工作室——從寫稿到匯出成片全流程,但要會一點終端機和 Cursor。
Mac 上有什麼要求?
裝 Python、FFmpeg、Node 即可跑通基礎流程。M 系列 Mac 做旁白和合成沒問題;渲染若硬碟不夠,可用雲端 Mac 或外接硬碟。