週刊 最先端AIウォッチ 2026-06-15 — フィジカルAI・新ツール・Built with AI
最終更新 2026-06-15無料ガイド
フィジカルAI/ロボティクス・出たばかりの新ツールとケイパビリティ・AIで成し遂げられた偉業を、公開一次情報から出典付きで毎週まとめる最先端AIウォッチ(無料)。
「これができるようになった」を毎週。フィジカルAI・新しいツールやスキル・誰かがAIで成し遂げた偉業を、各社の一次発表から出典付きで構造化します。要約で終わらせず、誰が何をどう実現したかを残します。本ページは無料です。
フィジカルAI・ロボティクス (physical-ai)
- Figure 03 — Figureが第3世代ヒューマノイド Figure 03 を発表。手のひらカメラ+指先触覚センサと洗濯可能なソフト外装で家庭運用を狙い、Helix VLA 前提に再設計。BotQ工場で年12,000台規模の量産体制。 Figure AI, 2025-10-09〔信頼度: high〕
- Figure Helix-02 寝室リセット(多体協調) — 2体のHelix-02ヒューマノイドが中央調整も通信もなく、相手の意図を動きだけから推定する単一VLAで寝室を2分弱で協調リセット。pixels-to-actionの多体協調ロコマニピュレーション初実演。 Figure AI, 2026-05-08〔信頼度: high〕
- Helix 全自動ランドリー折りたたみ — Figure の Helix VLA が混在した山からタオルを取り、開始状態に応じ折り方を変えながら全自動で折るデモ。多指ハンドのヒューマノイドがend-to-endニューラルネットだけで変形物体を扱った初例とされる。 Figure AI, 2025-08-12〔信頼度: high〕
- Physical Intelligence π0.7 — 5BパラメータのVLA π0.7を公開。「何を」だけでなく「どうやるか」を多モーダル条件で制御できるsteerable設計で、未知環境のマルチステージ家事やエスプレッソマシン操作をゼロショット実行。 Physical Intelligence, 2026-04-16〔信頼度: high〕
- Gemini Robotics 1.5 / ER 1.5 — Google DeepMindがVLAのGemini Robotics 1.5とembodied-reasoningのER 1.5を公開。行動前に自然言語で多段推論しGoogle検索等ツールも呼ぶ。motion transferで異なる身体間に挙動移植。「考えてから動く」物理エージェント。 Google DeepMind, 2025-10〔信頼度: high〕
- NVIDIA Isaac GR00T 参照ヒューマノイド — NVIDIAがGTC Taipeiで業界初の完全統合・オープンなヒューマノイド参照設計を発表。Unitree H2 Plus筐体+Sharpa触覚5指ハンド(75DoF)+Jetson Thor。GR00T基盤モデル含む全ソフトスタックを開放。 NVIDIA, 2026-05-31〔信頼度: high〕 CNBC, 2026-06-01〔信頼度: high〕
- Electric Atlas + Large Behavior Model (BD×TRI) — Boston DynamicsとToyota Research Instituteが電動Atlasを単一のLarge Behavior Modelで駆動。手書きせずデータから新挙動を学習し、部品箱のずれや落下にも対処。汎用ヒューマノイド向け基盤モデル化。 Boston Dynamics, 2025-11〔信頼度: high〕
- Skild Brain(omni-bodied 基盤モデル) — 四足・ヒューマノイド・卓上アーム等、身体形状を問わず制御する『omni-bodied』基盤モデルを公開。未訓練ロボットや極端な形状変化にもリアルタイム適応と主張。2026年1月に約14億ドル調達。 The Robot Report, 2026-01〔信頼度: high〕
- 1X NEO(家庭向け量産・出荷開始) — 1Xが家庭用ヒューマノイドNEOの予約販売を開始、米国家庭への出荷を2026年に。22DoFのハンドとソフトボディ、Hayward工場で量産。価格2万ドル/月499ドルサブスク。 GlobeNewswire / 1X, 2026-04-30〔信頼度: high〕
- Agility Digit × GXO(10万トート突破) — Agility RoboticsのDigitがGXO倉庫で商用連続稼働し、2025年11月時点で10万トート超を処理、2026年に通年稼働。RoboFabからAmazon・GXO等へフリート出荷。ヒューマノイドが実労働へ。 Robotics & Automation News, 2025-11-24〔信頼度: high〕
- Gemini Robotics On-Device — ローカル実行可能なVLAを公開。ネット接続なしで低遅延推論し、50〜100デモで微調整可能な初の公開VLA。ALOHA/Franka/Apptronik Apolloまで多様な身体に適応。 Google DeepMind, 2025-06-24〔信頼度: high〕
- Tesla Optimus V3(量産計画) — Teslaが第3世代Optimusを2026年夏にFremontで量産開始予定と発表。37関節・歩行1.2m/sで器用さ改良、Model S/Xライン転用で将来年100万台を狙う。完全なGen3公開デモは限定的で要検証。 Electrek, 2026-04-22〔信頼度: low・未確認〕
新ケイパビリティ・ツール (capabilities)
- Claude Opus 4.8 — Anthropicの最新フラッグシップ。Online-Mind2Webで84%を記録しcomputer-use/ブラウザエージェントで最強と主張、effortスライダーで応答ごとの思考量を制御でき、会話途中のsystem指示挿入にも対応。 Anthropic, 2026-05-28〔信頼度: high〕
- Claude Code Dynamic Workflows — Claudeが自分でオーケストレーション用スクリプトを書き、1セッション内で数十〜数百(最大~1,000)の並列サブエージェントを走らせ結果を自己検証してから返す。数十万行のコード移行・全域バグ調査・セキュリティ監査を自動化。 Anthropic, 2026-05-28〔信頼度: high〕 InfoQ, 2026-06〔信頼度: high〕
- Claude Managed Agents (Dreaming/Outcomes) — Code with Claude 2026で発表の運用エージェント機能群。Dreamingはセッション間でメモリを精製し学習を共有、Outcomesは別評価器がルーブリックで採点して修正指示を返す自己採点ループ、並列オーケストレーション。 InfoQ, 2026-05〔信頼度: high〕
- GPT-5.2-Codex — OpenAIの長時間ソフトウェアエンジニアリング特化モデル。ネイティブcontext compactionで数百万トークン規模・24時間級のコーディングセッションを破綻させず継続。大規模リファクタ/マイグレーション、Windowsサポート強化。 OpenAI, 2025-12〔信頼度: high〕
- Cursor 2.0 + Composer — agent-first IDEに刷新。自社高速モデルComposer(同等知能比4倍速)を中核に、git worktree/リモートマシンで最大8エージェントを並列実行し同一問題を別アプローチで解かせ、ネイティブブラウザツールでエージェントが成果を自己検証。 Cursor, 2025-10-29〔信頼度: high〕
- Google Antigravity — Googleのagent-first開発プラットフォーム(IDE+CLI+SDK)。複雑なコーディングを自律エージェントに委任し、エディタ/ターミナル/統合ブラウザに直接アクセスさせ、タスクリスト・実装計画・ブラウザ録画等の検証可能Artifactsを生成。 Google, 2025-11〔信頼度: high〕
- MCP 2026 Roadmap (Stateless / Tasks) — Model Context Protocolの2026ロードマップ。ステートレスなコアで水平スケールを可能にし、長時間ジョブ向けTasks拡張、.well-knownによるライブ接続なしのサーバー能力探索、OAuth/OIDC寄りの認可、A2A連携を整備。単一ツール接続からマルチエージェント基盤へ。 Model Context Protocol, 2026〔信頼度: high〕
- Microsoft Agent Framework (CodeAct) — Build 2026発表。Agent Harnessは任意のチャットクライアントを1メソッドで本番エージェント化、CodeActは複数ツール呼び出しを1ターンのPythonにまとめサンドボックス実行して52.4%高速・63.9%トークン削減、Foundry Hosted Agentsはscale-to-zero。 Microsoft DevBlogs, 2026-06〔信頼度: high〕
- GPT-Realtime-2 / Translate / Whisper — OpenAIが本番音声エージェント向けに3モデルを公開。GPT-Realtime-2はGPT-5級推論を持つ初のライブ音声で複雑要求・ツール呼び出し・割り込み復帰に対応、Translateは70+言語の同時通訳、Whisperは低遅延ストリーミング文字起こし。 9to5Mac, 2026-05-07〔信頼度: high〕
- Gemma 4 (12B, on-device agentic) — Googleの最新オープンモデル。Gemini 3研究由来でマルチモーダル、12Bは16GB RAMのノートPCで動くサイズに最適化。Google AI Edge/LiteRTと組み合わせ自律的データ処理・ツール使用・Web生成をオンデバイスで。 Google Developers Blog, 2026-06〔信頼度: high〕
- Apple Foundation Models (WWDC 2026) — AppleがFoundation Modelsフレームワークを拡張。新LanguageModelプロトコルでオンデバイスApple・Anthropic Claude・Google Geminiを同一APIで扱える抽象レイヤーを提供し、サードパーティAIを含むagentic体験をOS横断で構築可能に。 Tech Research Online, 2026-06〔信頼度: med〕
Built with AI(偉業・デモ) (built-with-ai)
- Anthropic本番コードの80%超をClaudeが書いている — Anthropicが2026/6公開の『When AI Builds Itself』で、本番コードベースにマージされる新規コードの80%超をClaude自身が著述していると公表。AIがAIを作るコードの大半を書く再帰的自己改善の到達点。 VentureBeat, 2026-06〔信頼度: high〕 Tom's Hardware, 2026-06〔信頼度: high〕
- Google Big SleepがSQLiteの0-dayを実環境で阻止 — GoogleのAIエージェントBig Sleepが、攻撃者しか知らずエクスプロイト寸前だったSQLiteの重大脆弱性(CVE-2025-6965)を発見。AIエージェントが実環境での脆弱性悪用を直接阻止した初の事例とされる。 The Record, 2025-07〔信頼度: high〕
- Claude製エージェントがFirefox/Thunderbirdで42件のCVEを発見 — AI発見CVEを追跡するtrackerによれば、Anthropicの(Claudeベース)エージェントが2026/2〜3にFirefox/Thunderbirdのuse-after-free等42件、4月にwolfSSLで9件のCVEを発見。AIによる脆弱性発見が量産フェーズへ。 GitHub (securin-public), 2026〔信頼度: med〕
- AIが80年未解決の数学問題を自律的に解いた(Erdős単位距離) — OpenAIの汎用推論モデルが、1946年にErdősが提起した平面上の単位距離問題で1984年以来の人間の上界を破る配置を発見し数学者が検証。著名な未解決問題が初めてAIにより自律的に解かれた例とされる。 Live Science, 2026-05-29〔信頼度: high〕
- Gemini Deep ThinkがErdős未解決問題と宇宙ひも物理を自律的に解いた — Google DeepMindが、Gemini Deep Think(Aletheiaエージェント)が複数のErdős未解決問題を自律解決し、宇宙ひもの重力放射計算で無限級数を有限閉形式に縮約する新解法を発見と報告。全結果を専門家が採点。 Google DeepMind, 2026-02〔信頼度: high〕
- Claude(Claudius)が自律運営する売店を黒字化 — Andon Labs×Anthropicの『Project Vend』で、ClaudeベースのエージェントClaudiusがオフィス売店の仕入れ・価格設定・接客を自律運営。Phase1は赤字だったがPhase2でマネージャエージェント導入により不正割引を約80%削減し黒字転換。 Anthropic, 2025〔信頼度: high〕
- DoctolibがClaude Codeで旧テスト基盤を数時間で移行 — 医療予約大手Doctolibがエンジニアリング全体にClaude Codeを展開し、レガシーなビジュアル回帰テスト基盤の移行を『数週間でなく数時間で』完了。PRレビュー・ドキュメント・技術的負債対応にも組込み開発速度を大幅向上。 Anthropic / Claude, 2026〔信頼度: high〕
- eSentireがAIで脅威分析を5時間→7分に圧縮 — サイバーセキュリティ企業eSentireがAI駆動の脅威分析を導入し、専門家の分析時間を5時間から7分へ短縮。AIの判断はシニアのセキュリティ専門家と95%一致したと報告する実運用成果。 Anthropic / Claude, 2026〔信頼度: med〕
投資家向けの深掘り(有料)
資金の流れと評価額の読み、国内勢の張りどころ、法務リスクの投資含意、過熱・撤退シグナルは、投資家向けレポートにまとめています。
→ 生成AI市場 投資家向けインテリジェンス 2026 H1
このサイトについて
Nichefolio のニッチ市場レポートは、まさにこの手法で公開データを構造化して作っています。気になる分野があれば、無料プレビューから覗いてみてください。