アップルが10月22日、新たなAI研究用データセット「Pico Banana 400K」を公開した。約40万枚の実写画像をもとに作成されたもの。
具体的には、グーグルが提供する「Open Images」の画像を素材に、グーグルのマルチモーダルモデル「Nano Banana(Gemini 2.5 Flash Image)」がペアを生成し、Gemini 2.5 FlashとGemini 2.5 Proがプロンプトを生成したうえ、品質を評価している。
背景にあるのは、画像編集技術の研究に向けたデータセットの不足だ。OpenAIの「GPT-4o」や、Nano Bananaなどのマルチモーダルモデルは驚異的な画像編集能力を備えている。しかし研究者コミュニティーからは、実際の画像から構築された、大規模かつ高品質なデータセットにアクセスができなかった。
Pico Banana 400Kの発表により、研究者は非商用・研究目的に限って、データセットを無償で利用できるようになった。







