ワールドモデル(世界知識)を活用した生成・編集
Gemini 2.0 Flash Experimentalの大きな特徴の一つが「ワールドモデル」と呼ばれる世界に関する深い知識だ。これは単なる画像生成能力を超え、物理法則、物体の形状、空間認識、さらには文化的背景まで理解した上で画像を生成・編集できることを意味する。
従来の画像生成AIは、与えられたプロンプトから画像を生成することはできても、三次元空間における物体の配置や視点の変更といった複雑な操作を正確に行うことは難しかった。例えば「この人物を後ろから見た姿で描いて」という指示は、同一人物の特徴を維持しながら空間的に異なる角度から描画するという高度な理解が必要だ。
Gemini 2.0 Flash Experimentalは、このような世界に関する知識を活用することで、物体や人物の角度変更、視点の切り替え、さらには料理レシピの視覚化のような複雑なタスクも実行できる。これにより、プロンプトだけでは表現しきれない空間的な要素や文脈も正確に反映した画像生成が可能になっている。
では試していこう。まずは「日本車を描いて」というシンプルなプロンプトから車の画像を生成。
続けて「この車を後方45度から見た姿を生成して」というプロンプトを入力すると、なんとこの車の後ろ姿を描写してくれた。
次にスマホで撮影した風景写真をアップロードし、「上の方から見た画像を描画して」と入力。
確かに視点が30度程度上に移動している。
「広角で引いた画像にして」と入力すると元写真で描写されていない部分も含めて生成された。
レシピや工程などを図入りで作成することもできる。
プロンプト:鶏肉とキノコのカレーの作り方を5つのステップで、各ステップの画像付きで説明して
一瞬で写真入りの5ステップレシピが完成した。
もちろん完成写真も生成されたものである。

この連載の記事
-
第35回
AI
ここがヤバい!「Nano Banana Pro」画像編集AIのステージを引き上げた6つの進化点 -
第34回
AI
無料で始める画像生成AI 人気モデルとツールまとめ【2025年11月最新版】 -
第33回
AI
初心者でも簡単!「Sora 2」で“プロ級動画”を作るコツ -
第32回
AI
【無料】動画生成AI「Wan2.2」の使い方 ComfyUI設定、簡単インストール方法まとめ -
第31回
AI
“残念じゃない美少女イラスト”ができた! お絵描きAIツール4選【アニメ絵にも対応】 -
第30回
AI
画像生成AI「Midjourney」動画生成のやり方は超簡単! -
第29回
AI
創作のプロセスを激変させる画像生成AI「Midjourney V7」の使い方 ドラフトモード、パーソナライズ機能に大注目 -
第28回
AI
ローカル動画生成AIの革命児「FramePack」の使い方 -
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり - この連載の一覧へ













