
Gemini Omni とは? Google の「会話で動画が作れる」AI を、AI に詳しくない人向けに整理した
Gemini Omni は Google が 2026-05-19 の I/O 2026 で発表した「会話で動画が作れる」AI。Sora 2 / Veo 3 との違い、新設の AI Ultra $100 プラン、SynthID 透かしと限界、ビジネス活用の境界線まで AI に詳しくない人向けに整理しました。

中澤 圭志
@keishi_nakazawaSales Claw 開発者

Key Facts
発表日
2026-05-19 (Google I/O 2026 keynote、Sundar Pichai)
提供モデル
Gemini Omni Flash (第 1 モデル、動画出力)
入口
Gemini app / Google Flow / YouTube Shorts Remix / YouTube Create App
対応プラン
Google AI Plus / Pro / Ultra (YouTube Shorts は 18 歳以上無料)
「Gemini Omni ってよく聞くけど、結局なに?Sora と何が違うの?月額 $100 のプラン、ふつうの人にも関係ある?」—— 本記事では、Google が 2026-05-19 の Google I/O 2026 で発表した Gemini Omni を、 Google 公式 Blog・Gemini 公式ページ・公式サブスクリプションページを一次情報として読み解き、AI に詳しくない人が「自分の生活や仕事に取り入れる前に知っておくべきこと」を整理します。 2026 年 5 月時点で出ているのは「Omni 一族の最初のモデル」である Gemini Omni Flash で、 今後 image・audio 出力対応や、API での開発者向け提供も予定されています。 いま全体像をつかんでおけば、続く本格版が来た瞬間に判断できるようになります。
本記事は Google Blog「Introducing Gemini Omni」(2026-05-19)・Google Blog「100 things we announced at Google I/O 2026」(2026-05-20)・Google Blog「Everything new in our Google AI subscriptions」(2026-05-20)・Gemini Apps Release Notes・Gemini 公式サブスクリプションページ を一次情報として参照しています。 Google I/O 2026 全体の文脈や Antigravity・Gemini Spark との関係は Google I/O 2026 総まとめ を、競合の Codex 系での動画・画像生成体験は gpt-image-2 で記事画像を作る実践ガイド を、AI モデルのプラン比較全般は GitHub Copilot 2026 の機能・料金 (一般読者向け) を、ブラウザ操作系 AI との使い分けは ChatGPT Atlas 一般読者向けガイド を併読してください。
1. Gemini Omni とは — 一言で言うと「会話で動画が作れる」 AI

Gemini Omni (以下 Omni) は、Google および Google DeepMind が 2026 年 5 月 19 日に発表した 新しい AI モデルファミリーです。【公式発表】 Google 公式ページは Omni を「create anything from any input」と位置付け、 最初のモデルとして「Gemini Omni Flash」が同日に提供開始されました。
ふつうの人にとっての一番大きな違いを比喩で説明すると、これまでの動画 AI が「指示文を投げて、出てきたものをそのまま使う自販機」だとすれば、 Omni は「ぜんぶ文脈を覚えていて、何度でも会話で直せる助手」のようなものです。 この助手は、いま編集しているシーンの内容を全部把握しており、
- 「もう少し夕日のオレンジを強くして」と頼めば、最初から作り直さずに色だけ直す
- 「同じキャラを別シーンに登場させて」と言えば、見た目を保ったまま別の場面を生成する
- 「BGM はもっと静かに」と頼めば、すでに乗っている音だけ調整する
こうした 「会話で繰り返し直せる動画 AI」という設計が、 Omni の根本的な新しさです。これまでの動画 AI は基本的に「プロンプトを変えて作り直す」モデルでしたが、 Omni は 編集を意識して作られた生成モデルであり、Google はこれを Omni と他モデルを分ける「商品哲学の根本的な違い」だと説明しています。
【著者見解】 「動画 AI = プロンプトガチャ」だったのが、「動画 AI = 助手と会話して仕上げる」に変わりつつある、 というのが Omni 登場の本当の意味だと考えています。素材を 1 発で出す精度では、まだ Seedance 2 や Sora 2 Pro に分があると外部評価サイトでも報告されていますが、 「最初から作り直さずに直せる」体験は、ふつうの人が動画 AI を実用にするうえで決定的に重要です。
2. 今できること・できないこと — 入力と出力を整理

入力で受け取れる 4 つの素材
【公式発表】 Google 公式 Blog は、Omni が 「a combination of images, audio, video and text」を 入力として受け取り、高解像度の動画と音声を出力できると説明しています。これは Sora 2 や Veo 3 と比較した ときの大きな差別化ポイントです。たとえば次のような組み合わせが想定されています。
| 入力の組み合わせ例 | 出てくる動画のイメージ |
|---|---|
| テキストのみ「夕日のなかを犬が走る、シネマティック」 | 10 秒前後の高画質クリップ |
| 写真 1 枚 + 「この犬が走り出す動画にして」 | 写真のキャラを保ったまま動く動画 |
| 既存の短い動画 + 「BGM を爽やかに、最後にロゴを足して」 | 音と末尾だけ差し替わった動画 |
| 音声トラック + 「この音楽に合う 10 秒のオープニング動画」 | 音楽に同期したオープニングクリップ |
出力でいま「できない」こと
一方で、2026 年 5 月時点の Omni Flash には 正直に「まだ厳しい」領域もあります。 外部評価サイト Artificial Analysis Video Arena では、2026 年 5 月時点で Seedance 2.0 が text-to-video / image-to-video の両方で 1 位を獲得しており、Omni Flash・Veo 3.1・Sora 2 は その下に並んでいます。【公式未確認 / 第三者ベンチ】
- 長尺動画: 1 クリップあたり 10 秒前後の制限 (Google は「展開上の選択であってモデルの制約ではない」と説明)
- キャラクター一貫性が極めて厳密に必要なナラティブ動画: 連続シーンでの細部の一致は Sora 2 がリード
- 映画的なカメラワーク: 計算されたパン・ドリーなど film-style の制御は Veo 3 が引き続き強い
- 画像出力・音声出力: 将来対応予定 (現状は動画出力のみ)
3. Sora 2 / Veo 3 / Seedance 2 と何が違う? — 3 大動画 AI 比較
「結局どれを使えばいいの?」が、ふつうの人の一番知りたい部分だと思います。 2026 年 5 月時点での 外部評価サイト Artificial Analysis Video Arena と各社公式情報を 元に、用途別に整理しました。

| 項目 | Gemini Omni Flash | OpenAI Sora 2 |
|---|---|---|
| 一番の強み | 会話で何度も直せる編集体験 | キャラクター一貫性とストーリー |
| 入力モダリティ | テキスト + 画像 + 音声 + 動画 | テキスト + 画像 (音声入力は弱い) |
| 出力長さ | 10 秒前後 | Sora 2 Pro で 25 秒まで |
| プラン | Google AI Plus / Pro / Ultra | ChatGPT Plus / Pro |
| 無料入口 | YouTube Shorts Remix (18 歳以上) | 無料枠は限定的 |
| 透かし | SynthID (DeepMind 標準) | OpenAI 独自の電子透かし |
用途別の使い分けガイド
- SNS / YouTube Shorts の素材を量産したい → Gemini Omni Flash (YouTube Shorts Remix から無料で入れる)
- 連続したシーンで同じキャラを登場させたい → Sora 2 (キャラ一貫性が一番強い)
- 映画的なカメラワーク・シネマティック表現が欲しい → Google Veo 3.1 (Omni と並行存続、Google Flow から利用)
- とにかく 1 発で最高品質の素材が欲しい → Seedance 2.0 (外部ベンチでトップ、ただし日本での提供形態は限定的)
- 商品写真を動かしたい・既存動画を会話で直したい → Gemini Omni Flash (image-to-video + 編集対話が強み)
4. 料金 — Google AI Ultra $100 と、ChatGPT / Claude プランの比較

Google は I/O 2026 と同時に、AI サブスクリプションの構造を大きく見直しました。【公式発表】 新設された 「Google AI Ultra $100/月」は、Google VP Shimrit Ben-Yair の言葉によれば 「developers, technical leads, knowledge workers and advanced creators」向けに 設計されたプランです。

$100 の AI Ultra で何が含まれるか
【公式発表】 Google Blog によれば、$100/月の AI Ultra プランには以下が含まれます。
- Gemini app と Google Antigravity で Pro プラン比 5 倍の usage limit
- Gemini Omni / Gemini 3.5 Flash アクセス
- Google Antigravity への優先アクセス (新しい AI IDE)
- 20TB のクラウドストレージ
- YouTube Premium の個人プラン含有
- Gemini Spark (新 24/7 AI エージェント) アクセス
ChatGPT / Claude プランとの比較
| 項目 | Google AI Ultra ($100/月) | ChatGPT Pro ($200/月) |
|---|---|---|
| 動画生成 | Gemini Omni Flash + Veo 3.1 | Sora 2 + Sora 2 Pro |
| 画像生成 | Nano Banana | gpt-image-2 |
| 推論モデル | Gemini 3.5 Flash | GPT-5.5 Pro |
| ストレージ | 20TB | (別途 Google Drive 等) |
| メディア特典 | YouTube Premium 個人プラン | なし |
| コーディング統合 | Antigravity 優先アクセス | Codex |
【著者見解】 「動画と YouTube Premium と 20TB ストレージ全部欲しい」「Google エコシステムにすでにいる」なら $100 の AI Ultra は 単純に得です。一方で「動画は使わない、テキストの推論精度だけ重視」なら ChatGPT Plus や Claude Pro の $20 プランで充分な人も多いはず。「自分が動画 AI を月にどれくらい使うか」が プラン選びの一番大きな分岐点になります。
5. 始め方 — Gemini app / Google Flow / YouTube Shorts の 3 つの入口

経路 1: Gemini app から触る
- gemini.google.com もしくは Gemini アプリにログイン
- Google AI Plus / Pro / Ultra のいずれかを契約 (無料 AI Free プランでは Omni は使えません)
- チャット入力欄で「短い動画を作って: 夕日のなかを犬が走る、シネマティック」のように指示
- 10-30 秒待つと動画が出てくる。「もう少しオレンジ強く」のように会話で直していく
経路 2: Google Flow で本格的に編集する
- Google Flow (Google AI Plus 以上で利用可) にアクセス
- 素材を投入 (テキスト指示 + 写真 + 既存クリップ + 音声トラックなど)
- シーンごとに会話で生成・編集を繰り返す
- キャラクター一貫性を保ったまま複数シーンを繋ぐワークフローが可能
経路 3: YouTube Shorts Remix から無料で試す
- YouTube アプリの Shorts セクションを開く
- 気になる動画の Remix 機能から Omni Flash で素材生成を依頼 (18 歳以上のみ)
- SNS 投稿用の短い動画素材として出力される
- YouTube Create アプリ (今週から無料) でも利用可能
6. リスクと注意点 — フェイク動画・著作権・SynthID 透かし
フェイク動画リスクと SynthID の限界
【公式発表】 Google は「Omni で生成された動画には全て、目に見えない SynthID デジタル透かしが埋め込まれる」と 明言しています。透かしは Gemini app または専用ツールで 「この動画は AI 生成か?」と検証可能な仕組みです。
ただし、SynthID は 「AI 製と検出するための仕組み」であって、「悪用そのものを防ぐ仕組みではない」点に注意が必要です。具体的には:
- SynthID 透かしは 動画を強く再エンコードすると壊れる可能性がある
- 透かしを 検証する側がツールを持っていなければ意味がない (一般 SNS では検証されない)
- 悪意ある加工 (透かし除去攻撃) に対しては 常に攻撃側がアップデートを上回る可能性がある
ふつうの人でも絶対やってはいけないこと
ビジネス利用時の追加注意点
- 社内ガイドラインの整備: 社員が動画 AI を業務で使う際の許諾範囲を明文化
- 著作権チェックフロー: 出力動画が既存著作物と類似しすぎていないか目視確認
- 「AI 生成」表示の徹底: 顧客向け配信時は AI 生成である旨を明示
- 業界規制への対応: 医療・金融・教育・公共系は別途規制があるので法務確認推奨
7. ビジネスでどう使える? — Sales Claw 視点での営業利用
現実的な業務利用シーン
- SNS マーケティング: X / Instagram / Threads / TikTok 向けの 10 秒素材を週次量産
- 採用ページ: 「働いてる風景」を AI 生成し採用ピッチに使用 (実在社員の顔は使わない)
- サービス紹介: LP 上の hero 動画として「使ってる雰囲気」を AI 動画化
- 社内研修: 文章だけの研修資料に「この場面の例」を AI 動画化して挿入
- イベント告知: ウェビナー・展示会の告知用ティザー動画
Sales Claw 視点での補足
Sales Claw は、ポリシー制御付き自律運用・送信前自動検査・営業 NG 検出・CAPTCHA 検出時停止・ 送信頻度制限・監査ログ保存・自動停止条件によって、誤送信とコンプライアンス違反リスクを下げる設計の OSS ツールです。 Gemini Omni のような動画 AI と Sales Claw の関係は、次の通り整理できます。
- 動画 AI = 入口の素材作り: SNS や LP に置く動画を量産する道具
- Sales Claw = 出口のフォーム営業: リード企業の問い合わせフォームに文面を送る道具
- BtoB のフォーム営業で動画を添付するのは むしろ忌避される ので、両者は別のチャネルで使うのが基本
- 動画 AI で作ったコンテンツは LP / SNS / 採用ページ側に置き、Sales Claw はそこへの誘導文面を生成・送信する役割分担
8. まとめ — 「会話で動画が作れる時代」をどう迎えるか

Gemini Omni は、動画 AI の競争を 「単発の生成精度」から「対話で直し続けられるか」へと シフトさせる、大きな節目のリリースだと考えています。Sora 2 や Veo 3 と直接競合するというより、「用途で使い分ける時代」に入ったのが 2026 年 5 月時点の現在地です。
ふつうの人にとっての一番大事な現実的判断は、「自分が動画 AI を月にどれくらい使うか」を見極めることです。月に数回しか使わないなら YouTube Shorts Remix の無料枠で充分。週に何本も SNS 素材を作るなら Google AI Plus、本気で業務に組み込むなら新設の AI Ultra $100 プランが現実的な ライン。逆に「動画は使わない、テキストの推論精度だけ重視」なら、別途 ChatGPT Plus や Claude Pro の $20 プランで充分です。
次のアクション: まずは YouTube Shorts Remix から無料で 1 本作ってみるのが、 一番リスクなく Omni の感触をつかめます。本気で導入するなら法務・社内ガイドラインの整備を先に。 Sales Claw でフォーム営業の自動化を組みたい場合は、 Sales Claw の無料ダウンロード から始められます。 類似トピックは Google I/O 2026 総まとめ も併せてお読みください。
よくある質問
Gemini Omni を一言で言うと?
料金はいくらですか? Google AI Ultra $100 プランとは?
Sora 2 や Veo 3 とどう違いますか?
SynthID 透かしとは何ですか? 普通の人にも関係ありますか?
商用利用やビジネスでの活用はできますか? 注意点は?
日本でも使えますか? 制限はありますか?
参考文献
本記事は X 公式アカウントと公式ドキュメントを一次情報として参照しています。
- [01]
- [02]
- [03]
- [04]
- [05]Gemini Apps Release Notes (公式)2026-05-22
- [06]Gemini 公式サブスクリプションページ (公式)2026-05-22
- [07]Google DeepMind — Gemini Model Page (公式)2026-05-22
- [08]Gemini Apps 公式入口2026-05-22


