AIツールが増えすぎて、まず何を触ればいいのか迷っていませんか?

Google Workspace(以下、GWS)の社用アカウントさえあれば、Google AI Studioを今日からすぐに使い始められます。Web版は無料で試せて、必要に応じて低コストで利用範囲を広げることができ、機能は会議の文字起こしや要約、画像の生成・編集に加え、得られた結果をコード化して社内アプリ開発へつなぐところまで、一つの環境で扱えます。本記事では、その使いどころと進め方を画像生成・編集モデル「Nano Banana」(Gemini 2.5 Flash Image)の実例に絞って解説します。

💡OPTのAI通信ではAIエンジニアが書く最新のAIニュースをお届けしております。

1|AI studioがおすすめな理由

  • 社内導入が速いです。 GWSの管理者が利用可否を部門単位で制御できるため、小さく導入→段階展開がしやすいです。
  • 試しやすい価格です。 WebのAI Studioは無料で利用でき、上限や要件が出てきたらAPIキーを発行してAPI利用に切り替えて拡張できます。
  • 業務に直結します。 画面のやり取りを**コード化(Get code)**して、自社アプリや自動処理に組み込めます。画像生成・動画生成(Veo 3の利用権限がある場合)・音声処理なども扱えます。

2|AI Studioで“できること”

  • 文字起こし(音声→テキスト):会議音声や素材の書き起こしに使えます。長尺や大きなファイルはFiles APIで扱えます(後ほど説明)。
  • 画像生成・編集:服装変更、髪型変更、背景差し替え、スタイル転写などの**編集(Nano Banana)が可能です。AI生成・編集画像には不可視の透かし(SynthID)**が入ります。
  • 文章生成・要約・整理:原稿、説明文、台本の叩き台づくりがすばやく進みます。
  • アプリ開発:画面で固めた設定をコード化し、アプリのモックを短時間で作れます。

多機能なAI Studioの中から、今回は画像生成・編集モデル「Nano Banana」(Gemini 2.5 Flash Image)に絞って、実例含めてご紹介します。

3|例:Nano Bananaを“触ってみる”

話題の Nano Banana はAI Studio上で無料で試せます。さっそく触っていきます。

  • Nano Banana = Gemini 2.5 Flash Image(Preview)です。人物の一貫性を保ちつつ、部分的な編集(局所編集)や画像ブレンドがしやすいのが特長です。生成・編集した画像には不可視の透かし(SynthID)が自動で入ります。

Step 1|まずは単語1つで生成

  • Userjapanese woman(日本人女性)と入力します。
  • 最初は短い指示でモデルの傾向を把握します。次のステップで必要な条件だけ追加していきます。

Nano Bananaを使用する際は、赤枠の右上のモデル選択

gemini-2.5-flash-image-preview

になっていることを確認してください。

Step 2|髪色だけを変える(局所編集)

  • UserDye your hair blonde(髪を金髪にして)と入力します。
  • 人物・服・背景はそのままで、髪色だけが変わります。
  • ぶれたら、変更しない要素を明示します。
  • 再現性を上げたいときは temperature を低め(0.6–0.8)にします。

Step 3|服装だけを変える

  • UserChange into a blue dress(青いワンピースに服を変えて)と入力します。
  • 人物と背景は固定して、衣装だけを差し替えます。

Step 4|カメラアングルを変える(構図の変更)

  • UserChange to high angle(ハイアングルに変更して)と入力します。
  • 人物と背景の一貫性を保ったまま視点(俯瞰)に切り替わります。背景側の遠近感もアングルに追随するのが見どころです。

4|使い方

  1. Model:左上のドロップダウンでモデルを選びます(例:gemini-2.5-flash-image-preview)。

  2. Run settings:右ペインでtemperatureなどの生成パラメータを調整します(0.0–2.0。低いほど再現性が高く、 高いほど多様性が出ます)。

  3. Get code:良い出力になったらPython / Nodeなどのコードを取得し、社内アプリに組み込みます。

    (Files / Files API:長尺の音声や大きな画像はFiles APIにアップロードして扱います)

temperature とは
出力のランダム性の度合いです。低めはブレずに忠実、高めは発想が広がります。まずは低〜中で安定させ、探索のときに上げるのがおすすめです。

Files API とは
音声や画像など大きなファイルを安全にやり取りするための仕組みです。Web画面で扱いづらいサイズも、APIなら安定して処理できます。

5|料金と上限

  • まずは無料で試せます。 Webの Google AI Studio は無料で使えます。(2025年現在)
  • 本格利用はAPIに切り替えます。 実運用や上限拡大が必要になったら、APIで呼び出す使い方に切り替えます(AI Studio右上の 「Get code」 から Python/Node のコードを取得して実装します)。料金は使った分だけです。 Google AI for Developers

APIの主な料金(代表モデル・抜粋)

用途

モデル

料金(USD)

テキスト/画像/動画の軽量処理

Gemini 2.5 Flash-Lite

入力 $0.10 / 100万トークン、出力 $0.40 / 100万トークン(標準) Google AI for Developers

テキスト/画像/動画の汎用処理

Gemini 2.5 Flash

入力 $0.30 / 100万トークン、出力 $2.50 / 100万トークン(標準) Google AI for Developers

画像生成・編集(Nano Banana)

Gemini 2.5 Flash Image(Preview)

1枚あたり $0.039(標準)/バッチは $0.0195/枚。プロンプトの入力は $0.30 / 100万トークンGoogle AI for Developers

動画生成(参考)

Veo 3 / Veo 3 Fast(Preview)

$0.40/秒(Veo 3)、$0.15/秒(Veo 3 Fast) Google AI for Developers

6|業務ユースケース

  • 議事録を自動でまとめる(音声→要約)

    会議の音声ファイルをアップするだけで、要点・決定事項・宿題に整理できます。ひな形(テンプレート)を決めておけば、毎回同じ体裁で出力できます。

  • 役員・社員写真の背景統一/服装・髪型の仮合わせ(画像編集の例)

    写真に対して「背景をオフィスに」「髪型をショートに」など自然な日本語で指示すると変更できます。撮り直し前のイメージ合わせに便利です(※AI生成・編集画像には不可視の透かしが入る場合があります。公開前に確認してください)。

  • 音声→文字起こし→要点抽出→配信までを自動化

    録音データを投入すると、文字起こし→要点抽出→DocsやSlackへの配信まで一気に進められます。定例会やウェビナー後の配信がスムーズになります。

  • 画像生成から短尺動画までを一つのミニアプリにまとめる

    試作で固めた設定をコード化して、社内のミニツールに実装します。画像生成→短尺動画の作成→書き出しまでを一つの画面で回せるようになり、待ち時間と手戻りを減らせます。

8|まとめ

GWSで使える・無料で試せる・多機能が一画面にそろっています。まずは一本作って、現場で確かめることから始めませんか。足りない上限や要件は、API(有料ティア)で拡張できます。

ご相談ください:業務課題に対するAI活用をお考えの方へ

弊社では、クライアントの業務課題に対して、

AI技術と業界知見を掛け合わせたソリューション提案を行っております。

  • 業務効率化や自動化の可能性を検討したい
  • 社内のデータを活かして、AI導入を進めたい
  • 情報収集やリサーチの仕組みを改善したい

など、どんな段階でも構いません。まずはお気軽にご相談ください。

付録|用語ミニ辞典

  • temperature:出力のランダム性を決めるパラメータです(0.0–2.0)。低いほど再現性が高く、 高いほど多様性が出ます。
  • Files API:音声・画像など大きなファイルをアップロードして解析する仕組みです。
  • SynthID:AI生成・編集コンテンツに埋め込まれる不可視透かしです。
  • Nano Banana:**Gemini 2.5 Flash Image(Preview)**の通称です。局所編集・一貫性・ブレンドに強い画像生成・編集モデルです。

おまけ

Nano Banana Tips|背景を丸ごと差し替える(ロケーションの総入れ替え)

  • UserTransform the entire space into a Parisian city(空間全体をパリの街に変えて)と入力します。

結果のポイント

  • 人物はそのまま維持しつつ、周囲一帯がパリの街並みに入れ替わります。
  • 遠近感やライティングが新しい背景に合わせて自然に更新されます(アングルに追随します)。
上へ戻る