OpenClaw Gateway OpenAI 互換 HTTP API と交差検収

OpenClaw Gateway の OpenAI 互換レイヤは、クライアントが慣れた /v1/chat/completions/v1/models を叩ける一方で、CLI が通るのに HTTP だけ 401、あるいは ストリーミング中だけ途中切断 といった「経路差」で迷子になりがちです。ここでは HTTP と CLI を同じ認可情報で突き合わせ、openclaw gateway status --require-rpc で RPC 側の健全性まで含めて交差検収する手順を、2026.5.x の運用観点で整理します。 コンテナ隔離ゲートウェイと doctor 照合企業 Mac CI リソースプールの考え方 も併せて参照してください。

1. /v1/chat/completions と CLI の対照表

まず「どのベース URL に」「どのモデル名で」「どの認証ヘッダを載せているか」を一行で書きます。CLI が同じモデルに到達できるなら、HTTP だけ失敗するときは Authorization: Bearer … の欠落、別トークン、末尾スラッシュ差、リバースプロキシのヘッダ欠落のどれかに寄りがちです。非ストリームで短い max_tokens を切った最小リクエストから始め、成功したらストリーム(stream: true)へ進むと切り分けが速いです。

先に決める:ベース URL・モデル ID・Bearer トークンを CLI と HTTP で同一表に並べる。

2. /v1/models で「見えているモデル集合」を固定

/v1/models は認可とルーティングの縮図です。ここで期待した ID が出ない場合、ゲートウェイが参照しているプロバイダ設定やフィルタがズレています。CLI のモデル一覧と突き合わせ、差分がある行だけを設定ファイル側で直します。遠隔の高メモリ Mac に推論本体を逃がしている構成では、ゲートウェイが薄く、モデル解決だけ先行してバックエンド接続が遅延するパターンもあるため、models の応答時刻もログに残します。

3. 認証ヘッダと openclaw gateway status --require-rpc

HTTP 401 を追うときは、手元シェルと常駐プロセスで環境変数が食い違っていないかを最優先で疑います。openclaw gateway status --require-rpc は RPC が本当に応答しているかを強制確認するスイッチなので、status が緑でも RPC だけ落ちている「半健康」状態を炙り出せます。ループバック経由の管理 URL と外向き URL を混同している場合、status は前者を見ており HTTP クライアントは後者を叩いている、というズレが典型です。listen 行と実際の curl 先を並べて写真のように固定してください。

4. ストリーミングだけタイムアウトする再現手順

中間プロキシやロードバランサのアイドルタイムアウトが、チャンク間隔の長いストリームで先に発火することがあります。同じペイロードを非ストリームで通し、ストリームだけ落ちるなら HTTP/2 や chunked の経路設定を疑います。ゲートウェイ側のワーカー同時実行数と、上流への接続プール上限もセットで見直し、keep-alive と読み取りタイムアウトをログに秒単位で残すと再現が楽になります。

5. 401 をワンショットで潰す二分探索

(A) ヘッダ無しで叩いて 401 になること、(B) 正しい Bearer で 200 になることを両方記録します。その間を埋めるのが「プロキシが Authorization を削っていないか」「別環境の古いトークンを読んでいないか」です。curl -v で送信行を確認し、ゲートウェイの監査ログと時刻を突き合わせます。2026.5.x 系では依存更新が早いので、CLI とデーモンでビルド差が出ていないかも doctor 出力に一行添えておくと後追いが楽です。

6. 遠隔高メモリ Mac 常駐ゲートウェイのメモ

推論や重いスキルを遠隔 Mac に寄せるほど、ローカル側のゲートウェイは「認可と転送」に専念させた方が安定します。高メモリノードは長文コンテキストでバックプレッシャーがかかりやすいので、同時セッション上限とストリーム長のガードレールを運用メモに明記します。夜間バッチで叩く場合は、昼間の SLO と別タイムアウトを切ると事故が減ります。

7. チェックリスト

  • /v1/models の ID が CLI と一致しているか。
  • Authorization: Bearer がプロキシまで届いているか(curl -v)。
  • openclaw gateway status --require-rpc が成功し、HTTP ベース URL と listen が同一表か。
  • ストリームのみ失敗するとき、中間の idle タイムアウトとワーカー並列を確認したか。

HTTP ゲートウェイと重い推論を分けるなら Mac mini

薄いゲートウェイと高メモリ推論ノードを分ける運用は、静音・低待機電力 で常時待受できるマシンがあるほど回しやすくなります。Mac mini(Apple Silicon)は小さな筐体ながら 統合メモリ の帯域に強く、長時間のストリームやエージェント実行でも熱と電力のバランスが取りやすいです。macOSGatekeeper/SIP/FileVault は鍵とトークンを扱うゲートウェイ運用の説明責任を下げ、Unix 系ツールチェーンとも相性が良いので、本記事のような HTTP/CLI 交差検収を日々回すチームにも向きます。

常駐ゲートウェイと遠隔推論を無理なく分けたいなら、Mac mini M4 はコストと設置性のバランスが良い出発点です。本文の HTTP/CLI 交差検収を安定して回す土台として、Macstripe ホームで構成を比較し、今すぐ入手して運用を前に進めてください。