このページの本文へ

アップル、グーグル「Nano Banana」モデルを利用したデータセット「Pico-Banana-400K」発表

2025年10月28日 10時05分更新

文● G.Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 アップルが10月22日、新たなAI研究用データセット「Pico Banana 400K」を公開した。約40万枚の実写画像をもとに作成されたもの。

 具体的には、グーグルが提供する「Open Images」の画像を素材に、グーグルのマルチモーダルモデル「Nano Banana(Gemini 2.5 Flash Image)」がペアを生成し、Gemini 2.5 FlashとGemini 2.5 Proがプロンプトを生成したうえ、品質を評価している。

 背景にあるのは、画像編集技術の研究に向けたデータセットの不足だ。OpenAIの「GPT-4o」や、Nano Bananaなどのマルチモーダルモデルは驚異的な画像編集能力を備えている。しかし研究者コミュニティーからは、実際の画像から構築された、大規模かつ高品質なデータセットにアクセスができなかった。

 Pico Banana 400Kの発表により、研究者は非商用・研究目的に限って、データセットを無償で利用できるようになった。

カテゴリートップへ

ピックアップ