SECTION 15

Vertex AI 基礎と API設計

Googleのエンタープライズ AI プラットフォームを使いこなす
— モデル選定・API設計・コスト管理を体系的に学ぶ —

2026年4月 LCREATOR.Inc Google AI 研修プログラム

SECTION 15 — Vertex AI 基礎

Vertex AI とは何か

SLIDE 02

Google Cloud の統合 AI プラットフォーム

ML モデルの構築・学習・デプロイ・モニタリングを
ワンストップで行える Google Cloud のサービス群

psychology

Gemini API(生成AI)

Gemini 2.5 Flash / Pro などの最新モデルをAPIで利用。テキスト・画像・動画・音声のマルチモーダル対応。

biotech

AutoML(自動機械学習)

コードなしで画像分類・テキスト分類・表形式データのモデルを構築できる。

inventory_2

Model Garden

Google製・オープンソースのモデルを一覧から選択してすぐにデプロイ可能。

Vertex AI が選ばれる理由

  • Google の最新モデルに最速でアクセスできる
  • エンタープライズ級セキュリティ(VPC, CMEK)
  • SLA 99.9%の商用グレード可用性
  • MLOps パイプラインとの統合
  • 他の Google Cloud サービスと連携しやすい
lightbulb
ポイント: 本研修では Vertex AI を基本的に利用します。企業のセキュリティ要件・IAM管理・SLAに対応できるため、業務利用に最適です。
Vertex AI 全体アーキテクチャ図

SECTION 15 — Vertex AI 基礎

Vertex AI vs Google AI Studio:どちらを使うか

SLIDE 03
比較項目 Vertex AI
エンタープライズ向け
Google AI Studio
開発者・個人向け
主な用途 本番システム、業務アプリへの組み込み プロトタイプ作成、学習、個人プロジェクト
料金 従量課金(企業契約・割引あり) 無料枠あり、超過分は従量課金
認証 サービスアカウント / Workload Identity APIキー(シンプル)
データ残留 学習に使われない 企業データ保護 設定依存 デフォルトは改善に利用
SLA 99.9% 保証 ベストエフォート
スケール 自動スケーリング、高負荷対応 レート制限あり(RPM/TPM)
MLOps Pipelines, Model Registry, Monitoring 統合 基本的なプロンプト管理のみ
check_circle
本研修の方針: 研修・業務ともに Vertex AI を基本利用します。GCPプロジェクトのIAM管理下で安全にAPIを利用できます。

SECTION 15 — Vertex AI 基礎

Vertex AI の主要サービス一覧

SLIDE 04
生成AI / LLM
Gemini API
テキスト・画像・動画・音声生成
Model Garden
Llama, Mistral等OSS含む200+モデル
Imagen / Veo
画像・動画生成専用モデル
Embeddings API
テキスト・マルチモーダル埋め込み
ML 開発・運用
AutoML
ノーコードでモデル構築・学習
Custom Training
GPU/TPUで独自モデルを学習
Feature Store
特徴量の管理・再利用
Pipelines
ML ワークフローの自動化
データ・エージェント
Agent Builder
RAG・会話AIエージェント構築
Vector Search
高速なベクトル類似検索
Model Monitoring
本番モデルのドリフト検出
Model Registry
モデルバージョン管理・デプロイ

SECTION 15 — Vertex AI 基礎

Google Cloud コンソール:Vertex AI ダッシュボード

SLIDE 05
console.cloud.google.com/vertex-ai
Vertex AI ダッシュボード スクリーンショット
search
コンソール左メニューで各サービスに素早くアクセス可能。「Vertex AI」で検索するとまとめて表示されます。

主要メニュー項目

1

Model Garden

利用可能なモデルの一覧。フィルタリングで用途別に絞り込める。

2

Gemini API / Vertex AI Studio

ブラウザ上でプロンプトをテスト。APIキーなしでUIから試せる。

3

Endpoints(デプロイ済みモデル)

デプロイ済みモデルへのエンドポイントURL・認証情報を確認。

4

Monitoring & Logs

APIリクエスト数・レイテンシ・エラー率をリアルタイムで監視。

SECTION 15 — Vertex AI 基礎

Gemini API の仕組み:リクエストからレスポンスまで

SLIDE 06
computer クライアント
(アプリ)
enhanced_encryption 認証
(Bearer Token)
language Vertex AI
API Gateway
psychology Gemini
モデル
upload レスポンス
(JSON)

リクエスト例(JSON)

JSON // POST /v1/projects/{project}/locations/us-central1/ // publishers/google/models/gemini-2.5-flash:generateContent { "contents": [{ "role": "user", "parts": [{ "text": "日本の首都はどこですか?" }] }], "generationConfig": { "temperature": 0.7, "maxOutputTokens": 256 } }

レスポンス例(JSON)

JSON { "candidates": [{ "content": { "parts": [{ "text": "日本の首都は東京です。" }], "role": "model" }, "finishReason": "STOP" }], "usageMetadata": { "promptTokenCount": 12, "candidatesTokenCount": 9, "totalTokenCount": 21 } }

SECTION 15 — Vertex AI 基礎

モデル選定ガイド:Flash vs Pro vs 3.x Preview

SLIDE 07

Gemini 2.5 Flash

速度重視・コスト最小

  • 要約・分類・簡単なQ&A
  • チャットボット・カスタマーサポート
  • 大量バッチ処理
  • リアルタイム応答が必要な場面
$0.075 / 1M tokens (入力)

Gemini 2.5 Pro

品質と速度のバランス

  • 複雑な文書作成・レポート
  • コード生成・デバッグ
  • 多言語翻訳・ローカライズ
  • 構造化データ抽出・分析
$1.25 / 1M tokens (入力)

Gemini 3.x Preview

最新機能・プレビュー版

  • 最新のAI機能を先行利用
  • リージョンが異なる(global)
  • APIキーでもアクセス可能
  • 本番利用にはGA版を待つ
AI Studio無料枠 or Vertex AI global
warning
選定の鉄則: まず Flash で動くか試す → 品質不十分なら Pro へ。3.x Previewは最新機能の検証用。コストは Flash → Pro で約17倍の差があります。

API 設計

認証・リクエスト構造・パラメータチューニングをマスターする

認証方式
リクエスト設計
パラメータ調整

SECTION 15 — API 設計

RESTful API 概要:HTTP の基本

SLIDE 09

HTTP メソッドと役割

メソッド 操作 Vertex AI での使用例
POST データ送信・生成 generateContent(テキスト生成)
GET データ取得 モデル情報の取得
PUT データ更新 エンドポイント設定の更新
DELETE データ削除 デプロイ済みモデルの削除
lightbulb
Gemini API は POST のみ使用。「何かを生成する」操作はすべて POST で送ります。

リクエストの構成要素

HTTP POST /v1/projects/my-project/locations/us-central1/ publishers/google/models/gemini-2.5-flash:generateContent # ヘッダー Authorization: Bearer {ACCESS_TOKEN} Content-Type: application/json x-goog-user-project: my-project-id # ボディ(JSON) { "contents": [...], "generationConfig": {...}, "safetySettings": [...] }

エンドポイント構造
{region}-aiplatform.googleapis.com/v1/projects/{project-id}/locations/{region}/publishers/google/models/{model-id}:{method}

SECTION 15 — API 設計

認証方式:APIキー vs サービスアカウント vs OAuth 2.0

SLIDE 10

APIキー

Google AI Studio 向け

固定の文字列をHTTPヘッダーに付与するシンプルな方式。

# ヘッダー例 x-goog-api-key: AIzaSy... # または URL パラメータ ?key=AIzaSy...
warning
注意: 本番環境・機密データには使わない。リポジトリにコミット禁止。

サービスアカウント

Vertex AI 推奨

システム間通信に使うロボットアカウント。JSON キーファイルで認証。

# gcloud で認証情報を設定 $ gcloud auth application-default login # Python SDK は自動検出 import vertexai vertexai.init(project="my-project", location="us-central1")
check_circle
推奨: キーファイルを使わず ADC(Application Default Credentials)を利用する。

OAuth 2.0

ユーザー代理アクセス

ユーザーの権限でAPIにアクセスする方式。Webアプリの「Googleでログイン」と同じ仕組み。

# アクセストークンを Bearer で送信 $ TOKEN=$(gcloud auth print-access-token) $ curl -H "Authorization: Bearer $TOKEN" \ -H "Content-Type: application/json" \ -d '{"contents":[...]}' \ https://us-central1-aiplatform...
lightbulb
トークンの有効期限は1時間。定期的なリフレッシュが必要。

SECTION 15 — API 設計

Gemini API リクエスト構造:JSON ボディの詳細

SLIDE 11
JSON { // ① 会話履歴(マルチターン対応) "contents": [ { "role": "user", "parts": [ { "text": "この画像を分析してください" }, { "inlineData": { "mimeType": "image/png", "data": "BASE64_ENCODED_IMAGE" } } ] }, { "role": "model", "parts": [{ "text": "画像には..." }] } ], // ② システム指示 "systemInstruction": { "parts": [{ "text": "あなたは医療専門家です。" }] }, // ③ 生成設定 "generationConfig": { "temperature": 0.7, "topK": 40, "topP": 0.95, "maxOutputTokens": 1024, "responseMimeType": "application/json" }, // ④ 安全性設定 "safetySettings": [{ "category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "BLOCK_ONLY_HIGH" }] }

各フィールドの役割

① contents

ユーザーとモデルの会話履歴。
role は "user" または "model"。マルチモーダル(テキスト+画像)も同じparts 配列で表現。

② systemInstruction

モデルへの役割・ペルソナ設定。会話全体に適用される「背景ルール」。

③ generationConfig

出力のランダム性・長さを制御。responseMimeType で JSON 出力も強制可能。

④ safetySettings

有害コンテンツのフィルタリング感度。業務用途に応じて調整(BLOCK_ONLY_HIGH 推奨)。

SECTION 15 — API 設計

レスポンス解析:candidates / safetyRatings / usageMetadata

SLIDE 12
JSON レスポンス { "candidates": [ { "content": { "parts": [ { "text": "生成されたテキスト..." } ], "role": "model" }, "finishReason": "STOP", "index": 0, "safetyRatings": [ { "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "probability": "NEGLIGIBLE" }, { "category": "HARM_CATEGORY_HATE_SPEECH", "probability": "NEGLIGIBLE" } ] } ], "usageMetadata": { "promptTokenCount": 128, "candidatesTokenCount": 256, "totalTokenCount": 384, "cachedContentTokenCount": 0 } }

重要フィールド解説

candidates[0].content.parts[0].text

実際の生成テキスト。Python での取り出し: response.candidates[0].content.parts[0].text または response.text

finishReason の値

STOP正常終了
MAX_TOKENSトークン上限に到達
SAFETY安全フィルタで停止
RECITATION著作権関連で停止

usageMetadata でコスト計算

totalTokenCount × 単価 = リクエスト1回のコスト。
ログに保存してコスト追跡に活用する。

SECTION 15 — API 設計

パラメータチューニング:temperature / topK / topP / maxOutputTokens

SLIDE 13
temperature 0.0 〜 2.0

出力のランダム性・創造性を制御。0に近いほど決定論的、高いほど多様な出力。

0.0〜0.3事実確認・分類・データ抽出
0.5〜0.8文書作成・要約・Q&A(推奨)
1.0〜2.0ブレインストーミング・創作
maxOutputTokens 1 〜 8192

生成するトークンの最大数。1トークン ≒ 日本語1.5文字 / 英語0.75単語。

warning
大きすぎるとコスト増大。用途に合わせて上限を設定する。要約なら256〜512、レポートなら2048程度。
topK 1 〜 40

次のトークン候補を上位K個に絞る。topK=1は最も確実性が高い(greedy)。通常はデフォルト(40)で十分。

"topK": 40 // デフォルト推奨 "topK": 1 // 最確定出力
topP 0.0 〜 1.0

累積確率がP以上になるまでトークンを選択。topP=0.95は上位95%の確率質量から選択。

"topP": 0.95 // 推奨(バランス良い) "topP": 1.0 // 制限なし(最も多様)
lightbulb
実践Tips: temperature と topP を同時に変更するより、どちらか一方を調整する方が制御しやすい。

コスト管理

トークン課金の仕組みを理解して、賢くコストを最小化する

トークン課金
最適化戦略
予算アラート

SECTION 15 — コスト管理

トークン課金の仕組み:Input vs Output

SLIDE 15

トークンとは何か

テキストを分割した最小単位。英語は約4文字で1トークン、日本語は約1.5〜2文字で1トークン。

Input Tokens(入力)

システムプロンプト + 会話履歴 + ユーザーの質問 + 添付ファイル(画像・動画)のすべてがカウントされる。長い会話履歴は積み上がるので注意。

Output Tokens(出力)

モデルが生成したテキストのトークン数。通常、Input の2〜5倍の単価が設定されている。Streaming時も同様。

lightbulb
実験: 「この文章は何トークンですか?」→ Vertex AI Studio の「Token Count」機能で即確認可能。

Vertex AI 公式価格表(2026年4月時点)

モデル 入力(/1M tokens) 出力(/1M tokens) 特記
Gemini 2.5 Flash $0.075 $0.30 推奨
Gemini 2.5 Flash(128K超) $0.15 $0.60 長文注意
Gemini 2.5 Pro $1.25 $10.00
Gemini 2.5 Pro(128K超) $2.50 $15.00 高コスト注意
text-embedding-005 $0.00002 超低コスト
warning
価格は変更されることがあります。本番設計時は cloud.google.com/vertex-ai/pricing で最新価格を確認してください。

SECTION 15 — コスト管理

コスト最適化 3つの鉄則

SLIDE 16

鉄則1
Flash を使い倒す

Pro と Flash の価格差は約17倍。Flash で動く用途はすべて Flash を選ぶ。

# Pro → Flash で17倍のコスト削減 # 月100万req、1req=1000tokens の場合 Pro: $1,250 / 月 Flash: $75 / 月
  • 要約・分類・翻訳
  • 定型文生成・テンプレート埋め込み
  • FAQ自動回答

鉄則2
Context Caching

長いシステムプロンプトや共通文書を「キャッシュ」として保存。再利用で入力コストを最大75%削減。

# キャッシュ作成(初回のみ) create_cached_content( model="gemini-2.5-flash", contents=[長いマニュアル], ttl="3600s" ) # 以降のリクエストでキャッシュ参照
  • 社内規定・マニュアル参照
  • 長いシステムプロンプトの再利用
  • 大量のバッチ処理

鉄則3
出力を絞る

出力トークンは入力より単価が高い。不要な出力を減らすことで大幅なコスト削減が可能。

# 上限を設定(デフォルト8192は過剰) "maxOutputTokens": 256 # JSON出力で冗長な説明を省く "responseMimeType": "application/json" # プロンプトで指示 "50文字以内で回答してください"
  • maxOutputTokens の適切な設定
  • JSON出力で冗長なテキストを排除
  • プロンプトで出力長を明示指定

SECTION 15 — コスト管理

予算管理:Google Cloud Budgets & Alerts の設定

SLIDE 17
console.cloud.google.com/billing/budgets
Budgets & Alerts 設定画面スクリーンショット
check_circle
プロジェクト作成後、最初にやること の1つ。$50, $100などで通知を設定し、請求ショックを防ぐ。

Budget 設定手順

1

予算の範囲を選択

プロジェクト全体 or 特定サービス(Vertex AI のみ)を選択。Vertex AI に絞ることで API コストのみ監視できる。

2

予算金額を設定

月額予算(例: $100)を設定。過去の請求額から自動計算する「前月実績ベース」も選択可能。

3

アラートのしきい値を設定

50%・80%・100%・120% など複数のしきい値で通知メールを受け取る。

4

Pub/Sub で自動対応(上級)

予算超過時に Cloud Functions を呼び出してAPIを自動停止する自動化も可能。

SECTION 15 — コスト管理

無料枠の活用:賢く無料リクエストを使い切る

SLIDE 18
60
Gemini 3.x Flash
無料 RPM(リクエスト/分)
Google AI Studio
1M
Gemini 3.x Flash
無料 TPD(トークン/日)
Google AI Studio
$300
Google Cloud
新規登録クレジット
90日間有効
90日
無料トライアル
期間
Vertex AI も対象
プラットフォーム モデル 無料リクエスト 無料トークン 制限
Google AI Studio Gemini 3.x Flash Preview 60 RPM 1M TPD 商用利用不可(研究・開発のみ)。2.5系は非対応
Google AI Studio Gemini 3.1 Pro Preview 5 RPM 250K TPD 商用利用不可。2.5 Proは非対応
Vertex AI 全モデル $300 クレジット(新規のみ)
Vertex AI text-embedding 250 req/月 Embeddings のみ永続無料枠
lightbulb
戦略: 3.x系モデルの検証は Google AI Studio の無料枠で開始 → 本番移行時に Vertex AI へ切り替え。2.5系モデルは Vertex AI のみ($300クレジットを活用)。

ハンズオン

実際に手を動かして Vertex AI と Gemini API を体験しよう

ハンズオン 1: コンソール
ハンズオン 2: curl 呼び出し
ハンズオン 3: コスト試算

SECTION 15 — ハンズオン

ハンズオン 1:Vertex AI コンソールでモデル一覧を確認

SLIDE 20
1

Google Cloud コンソールにログイン

ブラウザで console.cloud.google.com を開き、研修用 GCP プロジェクトを選択する。

2

Vertex AI を検索して開く

上部の検索バーに「Vertex AI」と入力 → 「Vertex AI」をクリック。

3

Model Garden を開く

左メニュー「Model Garden」をクリック。利用可能なモデルが一覧表示される。

4

Gemini 2.5 Flash を検索・確認

検索バーに「gemini」と入力。モデルカードに価格・コンテキスト長・機能が表示されることを確認。

5

Vertex AI Studio でプロンプトをテスト

モデルカードの「試す」ボタン → Vertex AI Studio が開く。「こんにちは」と送信してレスポンスを確認する。

console.cloud.google.com/vertex-ai/model-garden
Model Garden 画面(モデル一覧)
gps_fixed
確認ポイント: gemini-2.5-flash の「コンテキストウィンドウ: 1M tokens」と「マルチモーダル対応」のバッジが表示されていること。
timer
所要時間: 約 10 分。うまくいかない場合は講師に声をかけてください。

SECTION 15 — ハンズオン

ハンズオン 2:curl コマンドで Gemini API を呼び出す

SLIDE 21

ターミナルで以下のコマンドを実行してください

Bash # Step 1: gcloud 認証(初回のみ) $ gcloud auth application-default login # Step 2: アクセストークンを取得 $ TOKEN=$(gcloud auth print-access-token) # Step 3: PROJECT_ID を設定 $ PROJECT_ID="your-project-id" # ←変更してください # Step 4: Gemini API を呼び出す $ curl -s -X POST \ "https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/gemini-2.5-flash:generateContent" \ -H "Authorization: Bearer ${TOKEN}" \ -H "Content-Type: application/json" \ -d '{ "contents": [{ "role": "user", "parts": [{"text": "日本の都道府県を3つ答えてください。"}] }], "generationConfig": { "maxOutputTokens": 100, "temperature": 0.1 } }' | python3 -m json.tool

期待されるレスポンス(抜粋)

JSON(期待レスポンス) { "candidates": [ { "content": { "parts": [ { "text": "日本の都道府県を3つ\n1. 東京都\n2. 大阪府\n3. 北海道" } ], "role": "model" }, "finishReason": "STOP" } ], "usageMetadata": { "promptTokenCount": 16, "candidatesTokenCount": 24, "totalTokenCount": 40 } }
warning
よくあるエラー: 401 Unauthorized → TOKEN の再取得。403 Forbidden → プロジェクトで Vertex AI API が有効化されているか確認。
timer
所要時間: 約 15 分。Python SDK版(google-genai)でも同じ結果を確認してみましょう。

SECTION 15 — ハンズオン

ハンズオン 3:自社ユースケースの API コストを試算する

SLIDE 22

試算シート(自分の数値を入れてください)

項目 数値
1日のリクエスト数 _____ 件
1リクエストの入力トークン数 _____ tokens
1リクエストの出力トークン数 _____ tokens
選択モデル Flash / Pro
計算式 # 1日のコスト計算(Flashの場合) 入力コスト = (リクエスト数 × 入力tokens) / 1,000,000 × $0.075 出力コスト = (リクエスト数 × 出力tokens) / 1,000,000 × $0.30 月額コスト = (入力コスト + 出力コスト) × 30日 # 例: 1000件/日、入力500tokens、出力200tokens 入力: (1000 × 500) / 1M × $0.075 = $0.0375/日 出力: (1000 × 200) / 1M × $0.30 = $0.06/日 月額: ($0.0375 + $0.06) × 30 = $2.93/月

業種別 参考コスト試算

メール要約ツール

200件/日、入力2000 tokens、出力300 tokens
Flash 月額: 約 $5.4 / 月

社内 FAQ チャットボット

500件/日、入力1000 tokens、出力500 tokens
Flash 月額: 約 $3.4 / 月

提案書ドラフト生成

50件/日、入力3000 tokens、出力2000 tokens
Pro 月額: 約 $108 / 月

calculate
公式の Pricing Calculator(cloud.google.com/products/calculator)でも試算できます。GCP アカウントなしで利用可能。

SECTION 15 — セキュリティ

セキュリティとガバナンス:エンタープライズ要件を満たす

SLIDE 23
lock

VPC Service Controls

Vertex AI へのアクセスを特定の VPC ネットワーク内に限定。インターネット経由のアクセスをブロックし、データ漏洩を防止。

key

Customer-Managed Encryption Keys (CMEK)

データの暗号化キーを自社 Cloud KMS で管理。Google が暗号化キーにアクセスできない状態を実現。金融・医療で必須。

assignment

IAM(Identity and Access Management)

最小権限の原則に基づくアクセス制御。ロールで「読み取り専用」「実行のみ」等を細かく設定できる。

bar_chart

Cloud Audit Logs

誰がいつどのモデルを呼び出したか、すべてのAPI呼び出しを BigQuery に自動記録。コンプライアンス対応・監査に対応。

Vertex AI のデータ保護ポリシー

  • 入力データはモデル学習に使用されない
  • データはリクエスト処理後に保持されない
  • 日本リージョン(asia-northeast1)でデータ残留可能
  • SOC 2, ISO 27001, FedRAMP 認定取得済み
warning
要注意: Google AI Studio(APIキー方式)は 商用データには使わない。Vertex AI に必ず移行すること。

SECTION 15 — まとめ

Vertex AI 活用チェックリスト

SLIDE 24

基盤設定

  • GCP プロジェクト作成・Vertex AI API 有効化
  • サービスアカウント作成・最小権限の IAM 設定
  • 予算アラート($50/$100)の設定
  • VPC Service Controls の検討(機密データの場合)

API 設計

  • 用途に合わせたモデル選定(まず Flash から)
  • temperature・maxOutputTokens の適切な設定
  • systemInstruction でペルソナ・ルールを設定
  • finishReason・safetyRatings のエラーハンドリング実装

コスト管理

  • usageMetadata をログに記録して使用量追跡
  • 長いシステムプロンプトは Context Caching を活用
  • 定期的にモデルを見直し(より安いモデルが出た場合)
  • Batch Prediction API で大量処理のコスト削減

セキュリティ

  • APIキーをソースコード・Gitにコミットしない
  • Cloud Audit Logs を有効化・定期レビュー
  • 個人情報・機密情報をプロンプトに含める前にマスク
  • レスポンスの safetyRatings を本番で必ずチェック
rocket_launch
この4つのチェックリストをクリアすれば、エンタープライズグレードの Vertex AI 活用が実現できます!

セクション15 完了

Section 15「Vertex AI 基礎と API設計」お疲れ様でした。
Vertex AI の基礎からコスト管理・セキュリティまで習得しました。

次へ → Section 16: 実践 AI アプリケーション開発
学習モデル
3種
Flash / Pro / 3.x Preview
API パターン
4種
REST / SDK / curl / Studio
ハンズオン
3本
コンソール / curl / 試算
チェックリスト
16
本番移行前の確認項目
🏠 研修ポータル ▶ この章の動画 📺 動画一覧