華やかなデモ映像の裏側で、世界の投資マネーは「行動する機械」に向かって殺到している。
その理由は単純だ。世界GDPの大半を支える建設・製造・介護・物流といった物理的作業が、デジタル化の恩恵をほとんど受けていない最後の巨大フロンティアだからである。バブル的熱狂を冷静に見極めながら、本物の革新を見逃さないためにこの記事を読んでほしい。
フィジカルAIとは何か?「ほぼ人間」
フィジカルAIとは、物理法則を理解しながら現実世界で自律的に動くAIのことだ。ChatGPTのような生成AIがテキストや画像といった「デジタル情報」を処理するのに対し、フィジカルAIは重力・摩擦・質量・衝突といった自分が置かれている環境の「物理現象」を認識し、判断し、アクションを起こす。従来の産業用ロボットが楽譜通りにしか演奏できない自動ピアノだとすれば、フィジカルAIは状況を読んでパブで談笑をしながら即興演奏できるジャズピアニストのような存在だ。
この「物理世界への接地(グラウンディング)」こそが、AIの次なる進化軸であるとNVIDIAのジェンスン・ファンは2026年1月のCESで宣言した。同社はフィジカルAIの対象市場を50兆ドル(約7,500兆円)と見積もるが、その数字はIT産業の市場規模ではない。製造・物流・建設・農業・エネルギーといった、物理的なモノを扱う産業のGDP貢献額の総計だ。
GDPの過半数は物理領域にある
※概算値。内閣府 国民経済計算を参考に作成
「GDPの過半数は物理的作業によるもの」という主張は、フィジカルAIが第4次産業革命と位置づけられる根拠だ。第1次(蒸気)、第2次(電気)、第3次(デジタル)は物理産業を劇的に変えてきた。しかし第3次の主役であるインターネット・AI革命は、主にデジタル情報産業に恩恵をもたらし、建設・製造・介護・農業・物流といった産業の生産性を「向上させた」にとどまり、完全な自動化には至れていない。
日本のGDPを例に取ると、製造業(約20%)、建設・不動産(約12%)、卸売・小売(約13%)、運輸・物流(約5%)など、物理的作業を伴う産業が全体の半数以上を占める。さらに介護・医療・建設現場といった「人の手」が不可欠な領域まで含めれば、その比率はさらに高まる。これは日本に限らず先進国全体で共通する構造だ。チャットボットスタイルの生成AIがいかに賢くなっても、コンクリートは打設できないし、患者の体は支えられない。
「感覚」という未解決問題
ここで課題もある。世間を賑わすヒューマノイドのデモ映像の多くは、遠隔操作によるものか、外部サーバーへの依存しているなど、特殊な環境を前提とした状況でのパフォーマンスだ。三菱総研の分析によれば、現在のヒューマノイドは複雑な動作の計画や実行修正を外部サーバーに依存しており、完全自律動作はまだ実現していない。
技術的なボトルネックで最も深刻なのが「手の制御」だ。熟練作業者が行う繊細な把持作業には、自由度の高い手先の動きと、精密な触覚・視覚・聴覚の統合が必要とされる。現在のロボットハンドは、柔らかいものから硬いものまで状況に応じた把持ができず、スピードも人間より遅い。「歩く」ことは解決されつつあるが、「触れる」ことはまだ山の途中だ。
多くのロボットメーカーがLiDAR(距離感が分かるセンサー)を標準搭載する中、テスラの Optimusはカメラと強化学習のみで感覚を実現しようとするアプローチをとっている。まだ正解はわからない。
それでも、この技術的ハードルはバブル崩壊を意味するものではない。遠隔操作による大量のデータ収集→模倣学習→自律化という段階的なアプローチが急速に進んでおり、2026年は「遠隔操作から自律へ」の移行フェーズが本格化する勝負の年となる。Sim-to-Real技術(仮想環境で学習した動作を実機に転送)の成熟と、エッジAIチップの進化が、この転換を後押しする。
EVの次はヒューマノイドで世界制覇を狙う中国
フィジカルAI競争において、最も戦略的に動いているのが中国だ。2025年10月に採択された第15次五カ年計画(2026〜2030年)の建議では、「具現化AI(エンボディドAI)」が量子技術・6G・BMIと並ぶ「未来産業」として明記された。これは国家として「フィジカルAIで世界の覇権を取る」という宣言に等しい。
中国が描いているのは、EVで実証済みの垂直統合モデルの再現だ。第14次五カ年計画では国家主導のEV支援により、中国製自動車の世界輸出シェアが台数ベースで世界一に達した。同じ手法をロボティクスに適用する。政府補助金・税制優遇・実証フィールドの提供・国内需要の創出を組み合わせ、国内で量産体制を確立してから世界市場に低価格で展開するという戦略だ。
ヒューマノイドロボットと自動車製造の相性の良さ、複数分野の統合という産業的な類似性には着目するべきだろう。
実力はすでに数字に現れている。フィジカルAI関連特許の総合力ランキングでは、百度など中国勢がトップ3を独占し、米国を上回った(日経ビジネス・レクシスネクシス調査、2026年1月)。Unitree Roboticsが2024年に投入したG1ヒューマノイドは約1.37万ドル(約200万円)という破格の価格を実現した。第15次計画期間中に中国のロボット産業規模は約4,000億元(約8兆円)に達し、世界一になると予測されている。実際どこのロボット研究機関でもUnitree G1が置かれている。 優秀だという信認はすでに世界中から得ている。
今年の春節で公開されたパフォーマンスも話題を集めた。
人が消える「勝負の年」はいつか?実証から実装へ
出典:Emergen Research, MarketsandMarkets, NVIDIA各社資料を参考に作成
2025年のフィジカルAIは「実証元年」だった。2026年は「実装の勝負の年」だ。PwC Japanの分析によれば、これまで「PoC止まり」だった現場実装が商用稼働フェーズへ移行し始める。自動車工場、物流倉庫、コンビニ店舗のバックヤード、インフラ点検現場でヒューマノイドが正式に稼働を始める事例が増加する。
投資家も本気だ。2025年の最初の9ヶ月間だけで、フィジカルAI関連スタートアップは161億ドルを調達した。Figure AI(6.75億ドル)、Neuralink(6.5億ドル)、Scale AIへのMeta大規模投資がその代表例だ。生成AI基盤モデルへの投資が一巡し、「思考する機械」から「行動する機械」へと資金がシフトしている構造は明確だ。
一方で短期的なバブル的側面も否定できない。「手の制御」が解決されない限り、ヒューマノイドが熟練職人の代替となる日は来ない。しかしその技術的ハードルを越える過程で生まれる要素技術(柔軟把持・触覚センサ・エッジ推論モジュール)は、特化型の産業用ロボットを大幅に高度化させる。これこそが日本の製造業が最も注目すべき副産物だ。
バブルを見抜きながら、革命を見逃すな
フィジカルAIに対しては、二つの誤った態度がある。一つは「デモを見て全部できると思い込む過信」、もう一つは「技術課題を理由にした静観」だ。どちらも致命的だ。特に日本においては、ホンダのAsimoや、ソフトバンクのペッパーなどの記憶が抜けていない。「ロボットが何かを変えてくれる」という期待感が高まりにくい環境にある。
正しい見方は、短期的なハイプを冷静に見極めながら、長期的な構造変化には早期に備えるというものだ。感覚的問題が解決されるまで熟練職人の代替は起きない。しかし現場への部分導入・データ収集・自律化の段階的進展は2026年から本格化する。そしてその先に待っているのは、世界GDPの9割を占める物理領域の生産性革命だ。
VLA基盤モデルで世界最前線
莫大な計算資源と資本力
2024-25年VC投資161億ドル超
EV垂直統合モデルを再現
特許総合力で世界首位(2026年)
2030年ロボット産業8兆円規模
産業用ロボット導入台数世界一
政府AI予算1.2兆円(26年度)
ソフト・自律化で出遅れが深刻
出典:PwC Japan(2025)、三菱総研(2026)、日経ビジネス(2026年1月)を参考に作成
中国は国家として、米国は資本として、この革命に全力で賭けている。それも失敗したらかなりまずいレベルで。この動き方は確信をもっていると言うほかないだろう。
第15次五カ年計画にフィジカルAIを明記した中国の動きは、EVで世界市場を塗り替えた前例を考えれば現実的な脅威だ。日本が「デジタル敗戦」に続く「ロボット敗戦」を避けるためには、精密ハードウェアという比類なき強みに自律化の知性を組み合わせ、現場データを戦略資産として積み上げていくことが急務だ。画面の外の革命は、すでに始まっている。
