カリフォルニア州マウンテンビュー、2026年5月19日。ショアライン・アンフィシアターのステージで、CEOのサンダー・ピチャイ氏はGoogle I/O 2026の冒頭、簡潔な声明を発表しました。「私たちは、質問に答えるAIから、あなたに代わって行動するAIへと移行しています。」

これは、I/O 2026で最も期待され、かつ最も強い印象を与えた製品です。
Gemini Omniは、Google DeepMindが「Any-to-Any」という理念のもと開発した、新世代のマルチモーダルモデルシリーズです。すなわち、テキスト、画像、音声、動画など、あらゆる形式の入力を受け付け、対応する出力を生成します。初代バージョンであるGemini Omni Flashは、動画の生成と編集に特化しています。
従来の動画AIツールがテキストによる指示のみを受け付けていたのとは異なり、Omniはユーザーが複数回の対話を通じて動画を段階的に編集することを可能にします。編集のたびに、指定された要素のみが変更され、他の部分は乱されません。例えば、以下のような流れです。
「背景を夕焼けに変えて。」
→「右側に人物を追加して。」
→「今度はカメラを下から上に移動させて。」
このモデルは、物理現象、重力、動きをシミュレートする能力を持つとされ、Geminiの推論能力とDeepMindのメディアモデル(Veo、Genie、Nano Banana)を組み合わせています。
Omniを使用すると、ユーザー自身の外見と声を持ち、以降の動画に自動的に登場するデジタルアバターを作成できます。ディープフェイクの悪用を防ぐため、オンボーディングプロセスでは、ユーザー自身がシステムが生成したランダムな数字列を読み上げて録画することが求められ、本人の同意を確認します。
⚠️ 現在の制限: クリップは10秒に制限されています(モデルの限界ではなく、実装上の判断です)。アップロードされたファイルからの音声・サウンド編集機能は現在ロックされています。Googleは機能拡大前に、安全性の確認にさらに時間を要しています。
これは、フロンティア級の知能とAIエージェント(agentic)タスク実行能力を組み合わせたモデルです。Gemini 3.5 Flashは、ほとんどのプログラミングおよびマルチモーダルベンチマークでGemini 3.1 Proを凌駕し、他のフロンティアモデルと比較してトークン処理速度が4倍高速です。このモデルは、Geminiアプリ、Google検索、Antigravity 2.0、Gemini APIで直ちに利用可能となりました。
現在、社内テスト段階にあります。高度な安全トレーニング手法に基づいて構築されており、有害なコンテンツを低減し、安全な質問を誤って拒否することを抑制します。2026年6月に一般公開される予定です。
Gemini Sparkは、Googleが「プロアクティブなAIコンパニオン」と位置付けるものです。単に質問に答えるだけでなく、ユーザーに代わって自律的に作業を実行し、ユーザーが端末を開いていない時でもクラウド上でバックグラウンド動作します。
Sparkは以下のことが可能です。
Sparkは、メール送信、予約、取引完了などの重要なアクションを実行する前に必ず確認を求めます。
現在の利用可否: 米国のAI Ultraサブスクライバー向けにベータ版提供中。来週中に展開予定。2026年夏には、サードパーティアプリケーションとのMCP統合を拡大する予定です。
Googleは開発プラットフォームAntigravityをバージョン2.0にアップグレードし、開発者向けのAIエージェントオーケストレーションのハブへと変貌させました。これは、Claude Code、GitHub Copilot、OpenAI Codexの直接の競合となります。
ユーザーはキーワードを入力する代わりに、複雑な質問を投げかけ、さらに連続して深掘りすることが可能です。システムはYouTubeの全ライブラリ(Shortsおよび長尺動画)をスキャンし、最も関連性の高い動画リストを構造化された応答とともに返します。
現在、米国のYouTube Premium加入者は、youtube.com/newを通じて利用可能です。
AIコマンドを入力したり手動で編集したりすることなく、自然な音声でドキュメントの作成・編集が可能です。今夏、AndroidおよびiOS向けに、AI ProおよびUltraプランで提供開始予定です。
Googleはデジタル透かしシステム「SynthID」を業界横断的な標準規格として拡大します。OpenAI、Kakao、ElevenLabsがすでにC2PA標準に準拠して採用しています。ユーザーは以下の操作が可能です:
Google I/O 2026は、単一機能の発表イベントではありません。これはエコシステムの再定義です。会話による動画制作の可能性を広げるOmni、個人の業務を自動化するSpark、AIプログラミングツール市場を狙うAntigravity 2.0まで、Googleはあらゆる戦線で一斉に展開を進めています。
しかしながら、多くの重要な機能は依然として地理的制限(米国)や高額プラン(Ultra)に縛られており、あるいは試験段階にあります。真の問いは、Googleに何ができるかではなく、それがいつ、誰に対して提供されるかということでしょう。
出典:Google Blog、9to5Google、TechCrunch、The Next Web、Engadget — 2026年5月19日~21日
コメント
まだコメントはありません。最初のコメントを投稿しましょう。
コメントするにはログインが必要です。