OpenMontage 是什麼?深度測評:值不值得用

2026 年 6 月,OpenMontage 在 GitHub 上突然走紅,Star 很快破萬。很多人把它和 Runway、Pika、可靈放在一起比——其實比錯了對象

打個比方:

  • Runway / Pika 像「自動販賣機」:投幣(寫 Prompt),吐出一小段 5–10 秒的影片。
  • OpenMontage 像「一整條影片製片流水線」:你當甲方,CursorClaude Code 當製片主任,帶著一堆工具去調研、寫稿、找素材、配音、加字幕、剪輯、匯出成片。

它不是網頁 App,也不是剪映外掛。你要把專案下載到電腦,在 AI 程式設計助手裡用說話的方式下需求,剩下的按固定步驟走。

如果你想知道:它到底值不值得用? 下面用盡量白話的方式說清楚。


1. 做影片,難的不是「畫一段畫面」

很多人以為做短影片 = 缺一段 AI 畫面。實際更像做一道宴客大餐,難點在流程:

環節 常見痛點 生活類比
寫稿 AI 容易瞎編,沒查證 沒查食譜就開火
找素材 旁白、畫面、音樂、字幕各做各的 菜、碗、筷子不在一張桌上
品質檢查 音畫不同步、字幕錯位 菜上了才發現沒加鹽
算帳 調 API 一次一塊,做長了很貴 每切一刀都要另付錢

OpenMontage 想解決的是整條流水線,不是「再給你一個生成按鈕」。它既能做「圖片動起來」的解說片,也能從 Archive.org、NASA 等公開庫找真影片素材剪成紀錄片——不是把兩三張 PPT 圖晃一晃就叫影片。

什麼時候不用它? 你只是偶爾給口播加個字幕,手機上的 CapCut 更快。OpenMontage 適合反覆出片、想留記錄、想批量做的人——更像開小型工作室,不是點外送。

2. OpenMontage 到底是什麼?

2.1 一句話

OpenMontage = 給你的 AI 程式設計助手配一套「影片製片 SOP + 工具箱」。

你在 Cursor 裡說「幫我做一條 60 秒科普」,它不會只回一句文案,而是按步驟:查資料 → 寫腳本 → 找/生成畫面 → 配音 → 配樂 → 加字幕 → 渲染匯出。

專案開源,授權是 AGPL-3.0。自己用沒問題;若你要把它做成對外收費的線上服務,可能需要公開修改後的程式碼——商業化前建議問法務,別踩坑。

2.2 四個數字,先有個印象

是什麼 多少 你可以理解成
流水線(Pipeline) 12 條 12 種「食譜」:科普、紀錄片、口播、產品 Demo……
工具(Tools) 52 個 廚房裡的刀、鍋、烤箱——調 FFmpeg、TTS、生圖 API 等
技能文件(Skills) 400+ 份 給 AI 看的「崗位手冊」:這一步該怎麼幹
供應商評分 7 個維度 自動幫你在「便宜 / 快 / 品質好」之間做選擇

2.3 最特別的一點:導演是你用的 AI,不是網站

傳統軟體會寫死一個程式,按順序調 API。OpenMontage 反過來Cursor / Claude Code 就是導演

你提需求 → AI 讀「食譜」(Pipeline)→ 按步驟呼叫工具
        → 自己檢查一遍(畫面、聲音、字幕)→ 存檔 → 問你「行不行?」→ 匯出影片
  • Python 程式碼 = 幹活的「手」(剪輯、合成、調介面)
  • Markdown 文件 = 教 AI 怎麼幹的「腦」

好處是:每一步理論上都有記錄,團隊覆盤「為什麼用了 A 模型而不是 B」查得到——不像黑盒一鍵出片,做完就忘。

2.4 12 條流水線,挑你需要的「食譜」

流水線 做什麼 適合誰
動畫解說 AI 畫面 + 旁白 科普博主、教學
動效短片 文字動畫、快閃 社群營運
紀錄片蒙太奇 用真實公開素材剪輯 知識區、情緒向內容
電影感預告 氛圍、預告片 品牌概念片
口播影片 真人說話為主 Vlog、演講
螢幕錄製 軟體演示精修 產品 Demo
播客切片 長音訊變短影片 播客主
多語言配音 翻譯 + 配音 出海內容
批量切片 一條長片拆很多條 矩陣號營運
混合模式 實拍 + AI 補畫面 有現成素材的人
虛擬主播 AI 形象出鏡 培訓、公告
卡通角色 SVG 小動畫 故事類短片

不管哪條,大步驟都差不多:調研 → 方案 → 腳本 → 分鏡 → 素材 → 剪輯 → 合成。官方建議:先選流水線,再按文件走,別讓 AI 自由發揮亂改流程。

2.5 幾個詞,用大白話解釋

合成引擎(Remotion / HyperFrames)
最後「把素材拼成影片」的兩種廚房。Remotion 偏數據圖表、解說類;HyperFrames 偏花哨字效、卡通。選型後一般不再換。
供應商選單
你設定了哪些 API Key、本機有什麼能力,AI 就只能用這些——像打開冰箱看今天能做什麼菜。
交付檢查
防止 AI 交差交出一版「PPT 投影片錄影」;明顯不合格的計畫會在渲染前被攔住。
參考影片
丟一條 YouTube Short 連結,AI 學它的節奏和結構,再給你幾個改版方案和報價——不是照抄。

3. 怎麼開始?(Mac 使用者)

3.1 先準備這些

需要 幹什麼用
Python 3.10+ 跑各種工具腳本
FFmpeg 影片剪輯、轉檔(業界標配)
Node.js 18+ 跑 Remotion 合成
Cursor 或 Claude Code 當「製片主任」

macOS 安裝範例:brew install ffmpeg node python@3.12

3.2 三步上手

git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
make setup

然後在 Cursor 裡打開資料夾,直接說:

幫我做一條 45 秒的動畫科普:天空為什麼是藍色的

想要真實鏡頭、不要 AI 瞎畫,可以這樣說:

做一條 75 秒的紀錄片風格短片:雨中的城市生活。
只要真實素材,不要旁白,情緒偏安靜,加背景音樂。

3.3 要不要配 API Key?

不配也能做,但效果會「樸素」一些——像用家裡現有食材做飯。

配了 Key 則像「加了外送」:畫面更炫、聲音更好聽,但要花錢。常用設定寫在 .env 裡,例如:

FAL_KEY=...          # 生圖、部分 AI 影片(官方範例常用)
OPENAI_API_KEY=...   # 旁白、生圖(單 Key 也能跑通一些片子)
PEXELS_API_KEY=...   # 免費庫存影片(申請開發者 Key 即可)

Mac 使用者若沒 NVIDIA 顯卡,本地跑大影片模型不現實;M 系列 Mac 跑旁白 + 合成沒問題,重活可以丟到 雲端 Mac 或遠端機器上渲染。

小提示: 一次成片可能佔好幾 GB 硬碟(素材 + 中間檔)。MacBook Air 256GB 使用者建議外接硬碟,或用雲端 Mac 專門跑渲染。

4. 不花錢能做出什麼樣?

官方說「零 API Key」也能出片,核心是這些免費能力:

能力 用什麼 白話說明
旁白 Piper TTS 離線免費配音,音質夠用
真實素材 Archive.org 等 像去公共圖書館借老紀錄片鏡頭
庫存圖/影片 Pexels 等 免費素材站(要申請 Key)
合成 Remotion 把畫面、字幕、圖表拼起來
後期 FFmpeg 最終匯出 mp4

兩條「幾乎免費」的路線:

  1. 解說類:AI 念稿 + 配圖 + 簡單動效 → 像會做 PPT 動畫的科普號。
  2. 紀錄片類:從公開庫搜真實影片鏡頭再剪 → 不呼叫 Kling、Veo 那些貴模型,這是它和多數「免費 AI 影片」最大的不同。

第二條要在需求裡寫清楚:「用真實素材、紀錄片風格」


5. 做一條片大概多少錢?

下面是官方範例裡的參考價(會隨 API 調價變化,只看量級):

風格 時長 大概花費 類比
吉卜力風(靜圖+動效) ~30 秒 約 $0.15 一杯咖啡錢
皮克斯風(AI 運動鏡頭) 60 秒 約 $1.33 一份快餐
產品廣告(只用 OpenAI) ~30 秒 約 $0.69 比外送便宜
科幻預告(Veo 級) ~30 秒 $1–3+ 看鏡頭複雜度

系統會在開幹前估價格,你也可以設上限,比如「這次不超過 2 美元」——防止 AI 手滑狂調介面,像給信用卡設每日限額。


6. 深度測評:好在哪、坑在哪?

6.1 值得點讚的地方

① 做的是「整條片」,不是「一個片段」

Runway 給你一小段;OpenMontage 從選題到匯出一條龍。做 90 秒科普、或一條長片剪 10 條短影片,省的是反覆手工銜接的時間。

② 有存檔,能續做

每個階段會保存進度(像遊戲存檔)。做到一半電腦重啟,不用從零再來;團隊也能查「當時為什麼選這個配音」。

③ 能用真素材,不全靠 AI 瞎畫

紀錄片流水線從公開庫找鏡頭,適合歷史、新聞、情緒向內容——觀眾更容易信。

④ 可以「抄結構、不抄內容」

丟一條你喜歡的 Short,AI 學它的 hook 和節奏,再給你幾個改版方案 + 報價,比對著空白輸入框發呆輕鬆。

⑤ 和 Cursor 是一夥的

已經在用 Cursor / Claude Code 寫程式 的人,上手成本低——同一個視窗裡既能寫程式又能製片。

⑥ 會自檢,少交「爛片」

匯出前會查畫面、音量、字幕;不是生成完就直接甩給你。

6.2 要接受的現實

① 門檻偏高——這是給「會折騰電腦」的人用的

要能接受:終端機、報錯、裝依賴。不會用 Cursor 的營運同事,往往需要工程師在旁邊「代駕」。

② 沒有漂亮的一鍵介面

一切都在 IDE 對話和命令列裡完成,不像 CapCut 點開就能用。

③ 授權對商業化不友好

AGPL 意味著:你若把它包成 SaaS 賣,可能要開源改動。內部用 OK,對外賣服務要慎重。

④ 同樣的話,兩次結果可能差很多

Agent 有隨機性,不適合「每一幀都必須和分鏡一模一樣」的品牌大片。

⑤ 吃硬碟、吃時間

渲染和快取很佔空間;第一次跑通可能要幾小時,要有耐心。

⑥ 專案還在快速迭代

文件和路徑會變,生產環境建議鎖版本,別追最新 main 分支。

6.3 和其他工具比,怎麼選?

OpenMontage Runway / 可靈 CapCut AI 找外包團隊
像什麼 帶 SOP 的工作室 自動販賣機 微波爐預製菜 請廚師上門
誰適合 工程師、技術博主 創作者 所有人 有預算的品牌
零成本出片 可以(風格有限) 基本不行 免費檔有限 不行
上手 幾小時~幾天 幾分鐘 幾分鐘 幾週
批量、多語言 內建流程 要反覆付費 部分支援 按專案談

7. 值不值得用?三張清單

✅ 建議試試

  • 已有 Cursor / Claude Code,想批量做科普、產品解說。
  • 小團隊做 Demo 影片,有人願意維護環境和 .env
  • 做知識類內容,接受免費配音,想要真實素材 + 字幕
  • 好奇「AI 製片到底長什麼樣」,願意花一個下午折騰。

🤔 再等等,或只用一部分

  • 要拍電影級 TVC,分鏡必須人工簽字——OpenMontage 最多當預演或找素材。
  • 電腦硬碟 < 512GB,先清空間或上 遠端 Mac
  • 想做成對外賣的線上工具——先搞懂 AGPL,別急著上線。

❌ 不太適合

  • 完全不想碰終端機、命令列。
  • 一年就做兩三條口播,加字幕就夠。
  • 期望「下載 App、點一下就出大片」——這不是它的設計目標。

8. 第一次做片,按這個順序來

  1. 選簡單食譜:新手從「動畫解說」或「紀錄片蒙太奇」開始,別一上來就要電影預告片。
  2. 告訴 AI 別亂改流程:「請嚴格按官方 Pipeline 執行。」
  3. 先跑官方 Demo:README 裡有 make demo,驗證 FFmpeg 和合成環境是否正常。
  4. 設預算上限:對話裡說「這次不超過 2 美元」。
  5. 別刪中間檔projects/ 裡的存檔能斷點續做。
  6. 人眼最後過一遍:前 3 秒夠不夠抓人、字幕有沒有錯字、音樂會不會太吵——AI 自檢通過 ≠ 好看。

在 Cursor 裡常用: + L 打開 Agent;長流程請用 Agent 模式,別用普通聊天。


9. 結論:它像什麼,值不值?

用三個比喻收尾:

工具 比喻
Runway / Pika 自動販賣機:快,但只有一小段
CapCut 微波爐:人人會用,模板化
OpenMontage 小工作室 + 製片手冊 + 會幹活的 AI 主任

值不值得?

  • 會寫程式、已在用 Cursor、要反覆出結構化影片值得,零 Key 就能試。
  • 只想最快出一條、不想折騰 → CapCut 或 Runway 更省心。
  • 想打包成 SaaS 賣 → 先問律師,AGPL 和 Agent 不穩定性都是硬約束。

如果你屬於第一類:建議本週花 2 小時,clone 專案、跑一條「天空為什麼是藍色」的 45 秒科普。跑通一次,比看十篇測評都管用。


常見問題

OpenMontage 是 App 還是外掛?

都不是。它是下載到本地的開源專案,你在 Cursor 或 Claude Code 裡用對話驅動。沒有單獨的可視化 App,更像給 AI 助手配了「影片製片手冊 + 工具箱」。

不花錢能做出影片嗎?

可以。用免費離線配音、公開素材庫的真實鏡頭和開源合成工具,就能做解說片或紀錄片風格短片。皮克斯級 AI 動畫才需要付費 API。

做一條 60 秒影片大概多少錢?

官方範例:簡單動畫科普約一杯咖啡價;帶 AI 運動鏡頭的短片約一份快餐價。系統會先估價,你也可以設上限。

和 Runway、CapCut 有什麼不一樣?

Runway 像自動販賣機——投 Prompt 得一小段。CapCut 像微波爐——模板化、人人會用。OpenMontage 像小工作室——從寫稿到匯出成片全流程,但要會一點終端機和 Cursor。

Mac 上有什麼要求?

裝 Python、FFmpeg、Node 即可跑通基礎流程。M 系列 Mac 做旁白和合成沒問題;渲染若硬碟不夠,可用雲端 Mac 或外接硬碟。

延伸閱讀