動画生成AIの長年の弱点だった「物理整合性の欠如」——液体が空中を漂い、剛体が歪む——が、2026年6月に入り実用水準で解消されつつある。建築ビジュアライゼーションと製品プロトタイプ動画という、精度要求の高い2領域で商用採用が本格化しており、専門CGプロダクションの業務委託件数にすでに影響が出始めている。
2026年5月末から6月にかけて、OpenAIの動画生成モデル(Sora後継世代)、GoogleのVeo 3、そして中国のKuaishouが提供するKlingの最新バージョンが相次いでアップデートを実施。各モデルが公開したベンチマーク「PhysicsQA-v2」で、前世代比30〜45ポイントのスコア改善が確認されている。
X(旧Twitter)では、建築事務所に勤める設計士とみられるユーザーがこう投稿している:
「先週1週間、Veo 3にパースムービーを作らせてみた。照明変化・ガラス反射・人の歩行がほぼ破綻しなかった。去年同じことをやったときとは別物。CGチームへの発注を半分以下にする判断をした」
建築・インテリア向けの動画生成ワークフローを提供するスタートアップ数社も、6月第1週だけで契約数が前月比2.3倍に急増したとLinkedInで報告している。
動画生成AIは2024年のSora公開以降、品質の急速な向上が続く一方、「物理現象の再現」という点で一貫して限界があった。剛体の衝突シミュレーション、流体の挙動、素材ごとの光反射特性——これらは従来の拡散モデルが苦手とする領域であり、CGソフトウェア(Houdini、Blender等)との差別化要因として機能してきた。
転換点は2つある。第一に、物理シミュレーションデータを事前学習に大量投入する手法が成熟した。合成データ活用の加速(実世界スキャンデータ+物理エンジン出力の組み合わせ)が各社の訓練パイプラインに組み込まれた。第二に、動画生成に特化した報酬モデルが整備され、「物理的に破綻したフレーム」を明示的に減点する強化学習が機能し始めた。
この2つが重なった結果、2025年後半から2026年Q1にかけて精度が急加速。業界標準ベンチマーク上の数値改善が実作業での採用判断に結びつく段階に入った。
従来、建築竣工前のCGムービー1本(30秒・4K)の外注費用は30〜80万円が相場だった。現行の動画生成AIでは、静止画パースと設計データを入力すれば同水準のクオリティが1時間以内・コスト数百円で出力可能になりつつある。中規模設計事務所でのコスト削減インパクトは年間数百万円規模に達すると見られる。
物理整合性の向上により、製品が実際に動作する様子——歯車の噛み合い、蝶番の開閉、液体容器の注ぎ——の動画生成が実務精度に近づいた。製品開発の上流フェーズで「動く試作品動画」を内製できれば、ステークホルダーへのプレゼンと実物試作の間のコミュニケーションコストが大幅に下がる。
単純な「置き換え」ではなく、Blender・Maya等の3DCGツールのプラグインとして動画生成AIを呼び出す統合ワークフローが主流になりつつある。3Dモデルを確定させたうえで動画化する部分だけをAIに渡すハイブリッド運用が、品質と速度を両立させる現実解とみられる。
物理整合性の向上は技術的進歩だが、生成素材の著作権帰属・クライアントへの権利移転の明文化は各社のポリシーが揃っていない。商用採用を進める企業は利用規約の精査が必須であり、この点は実務上のボトルネックとして残る。
動画生成AIの「物理整合性の欠如」は、2年ほど前から技術者コミュニティで「当面解決しない壁」として語られることが多かった。拡散モデルの確率的な生成プロセスと、決定論的な物理法則の相性が根本的に悪いという見方だ。
それが想定より早く実用水準を越えた背景には、合成データの質と量の急拡大がある。物理エンジンから無限に生成できる「正解動画」を学習に使えるようになったことで、現実世界のデータ不足という制約が事実上消えた。
注意すべき点は、「物理的に見える」と「物理的に正しい」の間にはまだギャップがあることだ。建築パースや製品紹介のような「視覚的説得力」を求めるユースケースでは今の水準で十分だが、工学シミュレーションや品質保証用途では依然として専用ツールが必要な領域が残る。採用判断はユースケースを精査して行う必要がある。
既存の専門CGプロダクションへの影響は実質的に始まっている。高付加価値・高精度領域への特化か、AIワークフローの内製化による効率化か——この2択を迫られる局面が本格化するのは、今後6〜12ヶ月と見られる。
動画生成AIが「物理的に破綻しない」水準を超えたことで、建築・製品設計という高精度要求領域での業務置き換えが数年先ではなく「今」の話になった。問題は技術の成熟ではなく、既存ワークフローへの組み込みと権利処理の整備に移っている。あなたの組織では、動画制作プロセスのどの工程が最初に変わるか——そこから逆算して動く企業が先行することになる。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。
物理シミュレーションとAI生成が融合し始めた転換点ですね。CGプロダクションへの影響が「すでに出ている」という速度感が気になります。建築や製品設計の現場では、どこまでの精度を「実用水準」と見なしているんでしょう?