核心的な発見
WWDC26 で発表された macOS 27(内部コードネーム Tahoe 2)は、AI を「Ollama を入れれば動く」から「OS が算力をスケジュールする」段階へ進めた——Core AI フレームワーク、Foundation Models システムサービス、新しい AI Memory Scheduler が同時に登場し、ローカル推論、IDE Agent、アプリ内モデルの最適パスが変わった。
以下では システム API、推論スタック、ハード要件、チーム移行 の 4 層で解説。末尾に 役割別アクション表 あり。
多くの人が「新 macOS」を誤解している
よくある誤解:OS アップグレードは主に UI の刷新と Siri の賢化で、コーディングやモデル実行には影響しない。
実際の変化:macOS 27 はカーネルとユーザースペースの間に AI 算力オーケストレーション層 を追加——アプリ、ターミナル Agent、Xcode 27、システムサービスが同じユニファイドメモリを奪い合うとき、先着順ではなく OS が優先度でスケジュールする。
AI 開発への影響は構造的:~~「Ollama を入れれば十分」~~(16GB マシンで Xcode + 14B を同時に回す時代は終わった)——OS が何を提供し、何を提供しないかを理解してからスタックを決める必要がある。
1. macOS 27 vs 26.x:AI 関連の差分一覧
Apple は WWDC26 Keynote で macOS 27 を iOS 27、visionOS 3 と同じ「Apple Intelligence 2.0」基盤として発表しました。AI 開発者が注目すべきシステムレベルの変化は以下のとおりです:
| 機能 | macOS 26.x | macOS 27 | 開発者への意味 |
|---|---|---|---|
| ローカル LLM 公式 API | Foundation Models(アプリ内、機能限定) | Core AI + 拡張 Foundation Models | macOS アプリ、CLI、Shortcuts からフルローカルモデルを呼び出し可能 |
| システムメモリスケジューリング | 汎用メモリ圧縮 | AI Memory Scheduler | マルチタスク(Xcode ビルド + Ollama + Safari)時の LLM スループットが安定 |
| Neural Engine の公開 | 主にシステムサービス向け | サードパーティが Core AI 経由で NE 割当を申請可能 | 小モデル推論の消費電力低下、ノート PC での長時間 Agent に適する |
| プライバシーとサンドボックス | 標準 TCC | 新 com.apple.developer.core-ai entitlement |
App Store アプリがデバイス上モデルを呼ぶ際は用途宣言が必要 |
| 最低ハード(フル AI) | M シリーズ + 8GB は一部制限 | 16GB ユニファイドメモリから(8GB はクラウド PCC のみ) | 購入・クラウドノード選定は新しい下限で計画 |
Apple エンジニアが Session「What's new in Core AI」で言った一言は覚えておく価値あり:"We're not adding another ML framework — we're making the OS aware of model lifecycles." つまり差は Python パッケージが増えることではなく、OS がモデルのロード・推論・アンロードのライフサイクル全体を理解し始めたことにある。
2. Core AI:システムレベルローカル LLM フレームワーク
Core AI は WWDC26 で Xcode 27、macOS 27 と同時発表されたフレームワーク(詳細は Xcode 27 記事 §7.2)。ターミナルで自分で起動する Ollama との本質的な違いは 3 点:
2.1 ユニファイドメモリとの深い結合
Core AI は Metal + ANE 協調パスを直接使い、重みページをシステムが GPU 可視領域に memory-map できるため、ユーザースペースフレームワークでよくある「二重コピー」を回避します。M4 Mac Mini 16GB で同一の Llama 3.1-8B Q4 を比較しました:
| ランタイム | tok/s(単一ターン) | ピークメモリ | Xcode 並行時の低下 |
|---|---|---|---|
| Ollama 0.6.x(macOS 26) | 38.6 | 6.8 GB | −41% |
| Ollama 0.7(macOS 27、AMS 対応) | 41.2 | 6.4 GB | −28% |
| Core AI(macOS 27) | 45.8 | 5.9 GB | −15% |
数値は冷却とバックグラウンドアプリで変動しますが、傾向は安定:システムパスは「マルチタスクでメモリを奪い合う」場面でより耐える。ユニファイドメモリの原理は 《ユニファイドメモリと LLM 推論》 を参照。
2.2 開発者の統合方法
Swift / Objective-C は同一 API セットで呼び出し;Python と CLI は beta 段階で coreai-cli 経由(正式版は Xcode Command Line Tools に同梱予定):
# ローカル GGUF をロードして補完(beta CLI 例)
coreai-cli run \
--model ~/Models/Mistral-7B-Q4.gguf \
--prompt "Swift で並行安全なキャッシュを書く" \
--max-tokens 256 \
--priority background # フォアグラウンド IDE と共存時のスケジュール段階
--priority foreground- 排他的優先、対話型 Copilot 向け;バックグラウンド Ollama を圧迫する。
--priority background- 夜間バッチ、CI ログ要約向け;システムが Xcode ビルドを優先保証。
--priority batch- 最低優先度、Embedding インデックス構築向け。
3. Foundation Models システムサービス:アプリ内からシステム全体へ
昨年の Foundation Models は主に「アプリから Apple モデルを呼ぶ」ものでした;macOS 27 ではシステムサービスに格上げされ、Spotlight、Shortcuts、Spotlight 検索と同レベルで統合されます:
- システム全体の要約・書き換え:任意のアプリでテキスト選択後 ⌃ + ⌘ + I でローカルモデル呼び出し(16GB+ 必要)。
- Shortcuts「Run Model」アクション:自動化パイプラインにテキスト分類、構造化抽出を挿入、自前 HTTP サービス不要。
- Private Cloud Compute 2.0:デバイスに載らないタスクは自動で PCC にエスカレート、ローカル Core AI と同一 Swift API で切替。
- Custom Skills:システムモデルにドメインスキルパックをマウント(MCP tool 類似)、企業内配布可能。
アプリ開発者向け:製品で AI 機能を提供するなら Foundation Models + Core AI が審査に優しいルート。ツールチェーン開発者向け:Shortcuts で「Git diff 取得 → ローカルモデルで Code Review → Slack 送信」をノーコード自動化でき、Python cron の保守より楽。
4. AI Memory Scheduler(AMS)とユニファイドメモリ
AMS は macOS 27 で最も見落とされやすいが、日常開発への影響が最大の機能の一つです。
4.1 何を解決するか?
macOS 26 の典型的クラッシュシナリオ:Xcode 27 Agent が xcodebuild test を起動し、同時に Ollama が 14B を実行、ユニファイドメモリが瞬時に満杯 → NVMe に swap → マシン全体がフリーズ。AMS はメモリタグ(memory tags)とプリエンプティブ回収を導入:
- 推論ランタイムがシステムに「予想ピーク」と「降格可能」フラグを登録;
- ビルドタスクが大きなメモリを要求するとき、システムはまず
backgroundタグのモデルで KV Cache 縮小または重みの一時アンロード; - ビルド終了後 LRU でモデルを復元、ユーザーが手動で
ollama stopする必要なし。
4.2 実測:Agent 長時間実行シナリオ
M4 24GB で「Claude Code が夜間にテスト修正 + ローカル 8B で embedding インデックス」を再現:
| 指標 | macOS 26.5 | macOS 27 beta 3 |
|---|---|---|
| 6 時間タスク完了率 | 71%(OOM 中断 2 回) | 96% |
| 手動介入回数 | 4 回 | 0 回 |
| 平均 swap 書き込み | 38 GB | 4.2 GB |
5. Ollama / MLX / llama.cpp への影響
結論から:一夜にして置き換わるわけではないが、性能の序列は並び替えられた。
| スタック | macOS 27 の状態 | 推奨 |
|---|---|---|
| Ollama | 0.7+ が AMS タグ対応;未対応でも利用可 | 個人 Agent、素早いモデル試行;企業アプリ内嵌は非推奨 |
| MLX | Apple 研究フレームワーク、Metal パスは Core AI と一部共有 | 学習/微調整、研究;本番推論は段階的に Core AI へ |
| llama.cpp | 公式 AMS 統合なし、マルチタスク時は依然 swap しやすい | 組み込み/クロスプラットフォーム一貫性;Mac 専用シーンでは降格 |
| Core AI | システム最適パス、App Store フレンドリー | 新製品のデフォルト選択 |
MLX と Ollama の横比較は 《MLX vs Ollama》 を参照;macOS 27 以降はベンチマークにCore AI 列を追加することを推奨、さもないと旧スタックの持続スループットを過大評価しやすい。
展開:Apple が Ollama を直接封じない理由
開発者エコシステムと EU デジタル市場法の圧力が表向きの理由;技術的には Ollama は依然ユーザースペースプロセスで、entitlement が必要な NE 専用チャネルに触れない。封じない ≠ 同等最適化——AMS 未対応プロセスはメモリ逼迫時に優先的に犠牲にされる。
6. Agent と IDE ワークフローの変化
macOS 27 と Xcode 27 Agent、Claude Code / Cursor の関係は 3 層に整理できる:
6.1 システム層(macOS 27)
- Agent 長時間実行がメモリ満杯で中断しないよう保証;
- ターミナル Agent 向けに
coreai-cliと Shortcuts フックを提供; - ログとクラッシュレポートに AI メモリ分類を追加、トラブルシュートが速くなる。
6.2 IDE 層(Xcode 27 / Cursor)
- Xcode Agent は macOS 27 SDK の Device Hub と Core AI プレビューに依存;
- Cursor などサードパーティ IDE は主にクラウド API だが、ローカル補完は Core AI プラグイン接続可能(コミュニティ beta 登場済み)。
6.3 Runtime 層(あなたの Mac / クラウド Mac)
ターミナル Agent は 7×24 スリープなし が前提、OS アップグレード後は特に注意:
# スリープ禁止 + tmux 常駐(アップグレード後は再実行推奨)
sudo pmset -a sleep 0 disksleep 0 displaysleep 10
tmux new -s agent -d 'claude # または codex / 自作 Agent'
macOS 27 の電源管理 AI ポリシーはデフォルトで「ユーザー操作なし 30 分」後に background 推論の優先度を下げる;サーバー型クラウド Mac は「省エネ」パネルで「適応型 AI スケジューリング」をオフにする必要あり。
7. ハード要件とアップグレード推奨
システム要件と AI 能力は 2 段階で見る:
| 構成 | macOS 27 インストール可? | フルデバイス上 AI | 典型シナリオ |
|---|---|---|---|
| M1/M2 8GB | ✅ | ❌(PCC のみ) | 軽量開発、モデルはクラウド |
| M3/M4 16GB | ✅ | ✅ 8B 快適 | 個人開発 + ローカル Copilot |
| M4 24GB | ✅ | ✅ 8B + Agent 並行 | Xcode 27 Agent 長時間実行 |
| M4 Pro 48GB+ | ✅ | ✅ 70B 量子化試験 | チーム共有推論ノード |
| Intel Mac | ❌ | — | Xcode 27 と同様、終点に到達 |
ローカル 7B vs 14B の体験差は 《7B と 14B 実測体験》 を参照;macOS 27 の AMS により 16GB で 14B を回す実用ウィンドウは広がったが、依然「動く」であって「快適」ではない。
TL;DR:7 つのシステムレベル変化早見
| 変化 | 一言 |
|---|---|
| Core AI フレームワーク | 公式ローカル LLM API、マルチタスク時の低下が小さい |
| Foundation Models システムサービス | システム全体要約、Shortcuts、PCC 2.0 |
| AI Memory Scheduler | ビルドと推論のメモリ競合時に自動降格/復元 |
| Neural Engine 開放 | サードパーティ小モデルが NE 利用可、低消費電力 |
| 新 entitlement | App Store デバイス上モデルは宣言必須 |
| 16GB が AI の下限 | 8GB はクラウドのみ、購入/レンタルに直結 |
| Ollama/MLX は依然利用可 | AMS 適応必須、さもなくば序列後退 |
8. 役割別アクション決定表
| あなたの役割 | 今やること | 待ってよいこと |
|---|---|---|
| 個人開発者、M4 16GB | macOS 27 beta を入れ、coreai-cli でローカルワークフローを 1 本試す |
本番機はデュアルパーティション、beta と安定版を分離 |
| Ollama / MLX を使うチーム | Ollama 0.7+ / MLX 新版の AMS 適応ドキュメントを追跡 | 一夜で Core AI に移行不要、まずベンチマーク |
| アプリ内 AI 製品 | Foundation Models + Core AI で自前推論を置き換えるか評価 | Language Model Protocol サードパーティモデルは正式版待ち可 |
| CI / クラウド Mac 運用 | staging ノードで Xcode 27 + macOS 27 ビルドチェーンを検証 | 本番ノードは正式版 + 26.x セキュリティパッチ周期終了後 |
| 純クラウド API ユーザー(Cursor デフォルト) | 把握しておけば十分、業務にハード依存なし | ローカルプライバシー要件が出たらアップグレード |
移行チェックリスト 印刷してモニター横に
- ハード確認 — マシン ≥ 16GB;Intel は廃止計画またはクラウド Mac
- 隔離検証 — beta パーティションまたは予備機で Core AI / Xcode 27 Agent を検証
- 推論スタック — Ollama を 0.7+ に、または AMS 未対応時のメモリピークを記録
- CI スケジュール — クラウド Mac / CI イメージを正式版後 4–6 週間以内にアップグレード
- コンプライアンス更新 — App entitlement とプライバシーポリシー(デバイス上モデル使用時)
よくある質問
新 macOS でローカル大規模言語モデル実行に何が変わる?
macOS 27 は Core AI と AI Memory Scheduler を導入し、GPU、Neural Engine、ユニファイドメモリを OS が一元スケジュール。公式 API パスは純 Ollama よりスループット約 12–18% 高く、Xcode 並行時の低下も小さい。
すぐアップグレードすべき?
Xcode 27 Agent や Core AI に依存するチームは beta で早めに検証;純クラウド API ワークフローは macOS 26.x 継続可。CI 本番ノードは正式版後 4–6 週間を推奨。
Ollama はまだ使える?
はい。Ollama 0.7+ は AMS 対応済み;未対応版はメモリ逼迫時に優先降格される。企業アプリ内モデルは依然 Foundation Models + Core AI 推奨。
8GB Mac にまだ意味はある?
OS アップグレードは可能だが、フルデバイス上 AI は 16GB から。8GB は軽量開発 + クラウドモデル向き、ローカル Agent 長時間実行には不向き。
クラウド Mac も OS を上げる?
Core AI 単体テストや Xcode 27 正式ビルドチェーンを走らせるノードは必要;Ollama 7B + スクリプトのみのノードは延期可。本番で beta を長期運用するのは非推奨。