SECTION 15

Vertex AI 基礎と API設計

Googleのエンタープライズ AI プラットフォームを使いこなす
— モデル選定・API設計・コスト管理を体系的に学ぶ —

2026年4月 LCREATOR.Inc Google AI 研修プログラム

SECTION 15 — Vertex AI 基礎

Vertex AI とは何か

SLIDE 02

Google Cloud の統合 AI プラットフォーム

ML モデルの構築・学習・デプロイ・モニタリングを
ワンストップで行える Google Cloud のサービス群

psychology

Gemini API（生成AI）

Gemini 2.5 Flash / Pro などの最新モデルをAPIで利用。テキスト・画像・動画・音声のマルチモーダル対応。

biotech

AutoML（自動機械学習）

コードなしで画像分類・テキスト分類・表形式データのモデルを構築できる。

inventory_2

Model Garden

Google製・オープンソースのモデルを一覧から選択してすぐにデプロイ可能。

Vertex AI が選ばれる理由

Google の最新モデルに最速でアクセスできる
エンタープライズ級セキュリティ（VPC, CMEK）
SLA 99.9%の商用グレード可用性
MLOps パイプラインとの統合
他の Google Cloud サービスと連携しやすい

lightbulb

ポイント: 本研修では Vertex AI を基本的に利用します。企業のセキュリティ要件・IAM管理・SLAに対応できるため、業務利用に最適です。

SECTION 15 — Vertex AI 基礎

Vertex AI vs Google AI Studio：どちらを使うか

SLIDE 03

比較項目	Vertex AI エンタープライズ向け	Google AI Studio 開発者・個人向け
主な用途	本番システム、業務アプリへの組み込み	プロトタイプ作成、学習、個人プロジェクト
料金	従量課金（企業契約・割引あり）	無料枠あり、超過分は従量課金
認証	サービスアカウント / Workload Identity	APIキー（シンプル）
データ残留	学習に使われない企業データ保護	設定依存デフォルトは改善に利用
SLA	99.9% 保証	ベストエフォート
スケール	自動スケーリング、高負荷対応	レート制限あり（RPM/TPM）
MLOps	Pipelines, Model Registry, Monitoring 統合	基本的なプロンプト管理のみ

check_circle

本研修の方針: 研修・業務ともに Vertex AI を基本利用します。GCPプロジェクトのIAM管理下で安全にAPIを利用できます。

SECTION 15 — Vertex AI 基礎

Vertex AI の主要サービス一覧

SLIDE 04

生成AI / LLM

Gemini API
テキスト・画像・動画・音声生成

Model Garden
Llama, Mistral等OSS含む200+モデル

Imagen / Veo
画像・動画生成専用モデル

Embeddings API
テキスト・マルチモーダル埋め込み

ML 開発・運用

AutoML
ノーコードでモデル構築・学習

Custom Training
GPU/TPUで独自モデルを学習

Feature Store
特徴量の管理・再利用

Pipelines
ML ワークフローの自動化

データ・エージェント

Agent Builder
RAG・会話AIエージェント構築

Vector Search
高速なベクトル類似検索

Model Monitoring
本番モデルのドリフト検出

Model Registry
モデルバージョン管理・デプロイ

SECTION 15 — Vertex AI 基礎

Google Cloud コンソール：Vertex AI ダッシュボード

SLIDE 05

console.cloud.google.com/vertex-ai

search

コンソール左メニューで各サービスに素早くアクセス可能。「Vertex AI」で検索するとまとめて表示されます。

主要メニュー項目

1

Model Garden

利用可能なモデルの一覧。フィルタリングで用途別に絞り込める。

2

Gemini API / Vertex AI Studio

ブラウザ上でプロンプトをテスト。APIキーなしでUIから試せる。

3

Endpoints（デプロイ済みモデル）

デプロイ済みモデルへのエンドポイントURL・認証情報を確認。

4

Monitoring & Logs

APIリクエスト数・レイテンシ・エラー率をリアルタイムで監視。

SECTION 15 — Vertex AI 基礎

Gemini API の仕組み：リクエストからレスポンスまで

SLIDE 06

computer クライアント
（アプリ）

→

enhanced_encryption 認証
（Bearer Token）

→

language Vertex AI
API Gateway

→

psychology Gemini
モデル

→

upload レスポンス
（JSON）

リクエスト例（JSON）

 JSON
// POST /v1/projects/{project}/locations/us-central1/
// publishers/google/models/gemini-2.5-flash:generateContent
{
 "contents": [{
 "role": "user",
 "parts": [{
 "text": "日本の首都はどこですか？"
 }]
 }],
 "generationConfig": {
 "temperature": 0.7,
 "maxOutputTokens": 256
 }
}
 

レスポンス例（JSON）

 JSON
{
 "candidates": [{
 "content": {
 "parts": [{
 "text": "日本の首都は東京です。"
 }],
 "role": "model"
 },
 "finishReason": "STOP"
 }],
 "usageMetadata": {
 "promptTokenCount": 12,
 "candidatesTokenCount": 9,
 "totalTokenCount": 21
 }
}
 

SECTION 15 — Vertex AI 基礎

モデル選定ガイド：Flash vs Pro vs 3.x Preview

SLIDE 07

Gemini 2.5 Flash

速度重視・コスト最小

要約・分類・簡単なQ&A
チャットボット・カスタマーサポート
大量バッチ処理
リアルタイム応答が必要な場面

$0.075 / 1M tokens (入力)

Gemini 2.5 Pro

品質と速度のバランス

複雑な文書作成・レポート
コード生成・デバッグ
多言語翻訳・ローカライズ
構造化データ抽出・分析

$1.25 / 1M tokens (入力)

Gemini 3.x Preview

最新機能・プレビュー版

最新のAI機能を先行利用
リージョンが異なる（global）
APIキーでもアクセス可能
本番利用にはGA版を待つ

AI Studio無料枠 or Vertex AI global

warning

選定の鉄則: まず Flash で動くか試す → 品質不十分なら Pro へ。3.x Previewは最新機能の検証用。コストは Flash → Pro で約17倍の差があります。

API 設計

認証・リクエスト構造・パラメータチューニングをマスターする

認証方式

リクエスト設計

パラメータ調整

SECTION 15 — API 設計

RESTful API 概要：HTTP の基本

SLIDE 09

HTTP メソッドと役割

メソッド	操作	Vertex AI での使用例
POST	データ送信・生成	generateContent（テキスト生成）
GET	データ取得	モデル情報の取得
PUT	データ更新	エンドポイント設定の更新
DELETE	データ削除	デプロイ済みモデルの削除

lightbulb

Gemini API は POST のみ使用。「何かを生成する」操作はすべて POST で送ります。

リクエストの構成要素

 HTTP
POST /v1/projects/my-project/locations/us-central1/
 publishers/google/models/gemini-2.5-flash:generateContent

# ヘッダー
Authorization: Bearer {ACCESS_TOKEN}
Content-Type: application/json
x-goog-user-project: my-project-id

# ボディ（JSON）
{
 "contents": [...],
 "generationConfig": {...},
 "safetySettings": [...]
}
 

エンドポイント構造
{region}-aiplatform.googleapis.com/v1/projects/{project-id}/locations/{region}/publishers/google/models/{model-id}:{method}

SECTION 15 — API 設計

認証方式：APIキー vs サービスアカウント vs OAuth 2.0

SLIDE 10

APIキー

Google AI Studio 向け

固定の文字列をHTTPヘッダーに付与するシンプルな方式。

# ヘッダー例
x-goog-api-key: AIzaSy...

# または URL パラメータ
?key=AIzaSy...
 

warning

注意: 本番環境・機密データには使わない。リポジトリにコミット禁止。

サービスアカウント

Vertex AI 推奨

システム間通信に使うロボットアカウント。JSON キーファイルで認証。

# gcloud で認証情報を設定
$ gcloud auth application-default login

# Python SDK は自動検出
import vertexai
vertexai.init(project="my-project",
 location="us-central1")
 

check_circle

推奨: キーファイルを使わず ADC（Application Default Credentials）を利用する。

OAuth 2.0

ユーザー代理アクセス

ユーザーの権限でAPIにアクセスする方式。Webアプリの「Googleでログイン」と同じ仕組み。

# アクセストークンを Bearer で送信
$ TOKEN=$(gcloud auth print-access-token)

$ curl -H "Authorization: Bearer $TOKEN" \
 -H "Content-Type: application/json" \
 -d '{"contents":[...]}' \
 https://us-central1-aiplatform...
 

lightbulb

トークンの有効期限は1時間。定期的なリフレッシュが必要。

SECTION 15 — API 設計

Gemini API リクエスト構造：JSON ボディの詳細

SLIDE 11

 JSON
{
 // ① 会話履歴（マルチターン対応）
 "contents": [
 {
 "role": "user",
 "parts": [
 { "text": "この画像を分析してください" },
 {
 "inlineData": {
 "mimeType": "image/png",
 "data": "BASE64_ENCODED_IMAGE"
 }
 }
 ]
 },
 {
 "role": "model",
 "parts": [{ "text": "画像には..." }]
 }
 ],
 // ② システム指示
 "systemInstruction": {
 "parts": [{ "text": "あなたは医療専門家です。" }]
 },
 // ③ 生成設定
 "generationConfig": {
 "temperature": 0.7,
 "topK": 40,
 "topP": 0.95,
 "maxOutputTokens": 1024,
 "responseMimeType": "application/json"
 },
 // ④ 安全性設定
 "safetySettings": [{
 "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
 "threshold": "BLOCK_ONLY_HIGH"
 }]
}
 

各フィールドの役割

① contents

ユーザーとモデルの会話履歴。
role は "user" または "model"。マルチモーダル（テキスト＋画像）も同じparts 配列で表現。

② systemInstruction

モデルへの役割・ペルソナ設定。会話全体に適用される「背景ルール」。

③ generationConfig

出力のランダム性・長さを制御。responseMimeType で JSON 出力も強制可能。

④ safetySettings

有害コンテンツのフィルタリング感度。業務用途に応じて調整（BLOCK_ONLY_HIGH 推奨）。

SECTION 15 — API 設計

レスポンス解析：candidates / safetyRatings / usageMetadata

SLIDE 12

 JSON レスポンス
{
 "candidates": [
 {
 "content": {
 "parts": [
 { "text": "生成されたテキスト..." }
 ],
 "role": "model"
 },
 "finishReason": "STOP",
 "index": 0,
 "safetyRatings": [
 {
 "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
 "probability": "NEGLIGIBLE"
 },
 {
 "category": "HARM_CATEGORY_HATE_SPEECH",
 "probability": "NEGLIGIBLE"
 }
 ]
 }
 ],
 "usageMetadata": {
 "promptTokenCount": 128,
 "candidatesTokenCount": 256,
 "totalTokenCount": 384,
 "cachedContentTokenCount": 0
 }
}
 

重要フィールド解説

candidates[0].content.parts[0].text

実際の生成テキスト。Python での取り出し: response.candidates[0].content.parts[0].text または response.text

finishReason の値

`STOP`	正常終了
`MAX_TOKENS`	トークン上限に到達
`SAFETY`	安全フィルタで停止
`RECITATION`	著作権関連で停止

usageMetadata でコスト計算

totalTokenCount × 単価 = リクエスト1回のコスト。
ログに保存してコスト追跡に活用する。

SECTION 15 — API 設計

パラメータチューニング：temperature / topK / topP / maxOutputTokens

SLIDE 13

temperature 0.0 〜 2.0

出力のランダム性・創造性を制御。0に近いほど決定論的、高いほど多様な出力。

0.0〜0.3	事実確認・分類・データ抽出
0.5〜0.8	文書作成・要約・Q&A（推奨）
1.0〜2.0	ブレインストーミング・創作

maxOutputTokens 1 〜 8192

生成するトークンの最大数。1トークン ≒ 日本語1.5文字 / 英語0.75単語。

warning

大きすぎるとコスト増大。用途に合わせて上限を設定する。要約なら256〜512、レポートなら2048程度。

topK 1 〜 40

次のトークン候補を上位K個に絞る。topK=1は最も確実性が高い（greedy）。通常はデフォルト（40）で十分。

"topK": 40 // デフォルト推奨
"topK": 1 // 最確定出力
 

topP 0.0 〜 1.0

累積確率がP以上になるまでトークンを選択。topP=0.95は上位95%の確率質量から選択。

"topP": 0.95 // 推奨（バランス良い）
"topP": 1.0 // 制限なし（最も多様）
 

lightbulb

実践Tips: temperature と topP を同時に変更するより、どちらか一方を調整する方が制御しやすい。

コスト管理

トークン課金の仕組みを理解して、賢くコストを最小化する

トークン課金

最適化戦略

予算アラート

SECTION 15 — コスト管理

トークン課金の仕組み：Input vs Output

SLIDE 15

トークンとは何か

テキストを分割した最小単位。英語は約4文字で1トークン、日本語は約1.5〜2文字で1トークン。

Input Tokens（入力）

システムプロンプト + 会話履歴 + ユーザーの質問 + 添付ファイル（画像・動画）のすべてがカウントされる。長い会話履歴は積み上がるので注意。

Output Tokens（出力）

モデルが生成したテキストのトークン数。通常、Input の2〜5倍の単価が設定されている。Streaming時も同様。

lightbulb

実験: 「この文章は何トークンですか？」→ Vertex AI Studio の「Token Count」機能で即確認可能。

Vertex AI 公式価格表（2026年4月時点）

モデル	入力（/1M tokens）	出力（/1M tokens）	特記
Gemini 2.5 Flash	$0.075	$0.30	推奨
Gemini 2.5 Flash（128K超）	$0.15	$0.60	長文注意
Gemini 2.5 Pro	$1.25	$10.00
Gemini 2.5 Pro（128K超）	$2.50	$15.00	高コスト注意
text-embedding-005	$0.00002	—	超低コスト

warning

価格は変更されることがあります。本番設計時は cloud.google.com/vertex-ai/pricing で最新価格を確認してください。

SECTION 15 — コスト管理

コスト最適化 3つの鉄則

SLIDE 16

鉄則1
Flash を使い倒す

Pro と Flash の価格差は約17倍。Flash で動く用途はすべて Flash を選ぶ。

# Pro → Flash で17倍のコスト削減
# 月100万req、1req=1000tokens の場合
Pro: $1,250 / 月
Flash: $75 / 月
 

要約・分類・翻訳
定型文生成・テンプレート埋め込み
FAQ自動回答

鉄則2
Context Caching

長いシステムプロンプトや共通文書を「キャッシュ」として保存。再利用で入力コストを最大75%削減。

# キャッシュ作成（初回のみ）
create_cached_content(
 model="gemini-2.5-flash",
 contents=[長いマニュアル],
 ttl="3600s"
)
# 以降のリクエストでキャッシュ参照
 

社内規定・マニュアル参照
長いシステムプロンプトの再利用
大量のバッチ処理

鉄則3
出力を絞る

出力トークンは入力より単価が高い。不要な出力を減らすことで大幅なコスト削減が可能。

# 上限を設定（デフォルト8192は過剰）
"maxOutputTokens": 256

# JSON出力で冗長な説明を省く
"responseMimeType": "application/json"

# プロンプトで指示
"50文字以内で回答してください"
 

maxOutputTokens の適切な設定
JSON出力で冗長なテキストを排除
プロンプトで出力長を明示指定

SECTION 15 — コスト管理

予算管理：Google Cloud Budgets & Alerts の設定

SLIDE 17

console.cloud.google.com/billing/budgets

check_circle

プロジェクト作成後、最初にやること の1つ。$50, $100などで通知を設定し、請求ショックを防ぐ。

Budget 設定手順

1

予算の範囲を選択

プロジェクト全体 or 特定サービス（Vertex AI のみ）を選択。Vertex AI に絞ることで API コストのみ監視できる。

2

予算金額を設定

月額予算（例: $100）を設定。過去の請求額から自動計算する「前月実績ベース」も選択可能。

3

アラートのしきい値を設定

50%・80%・100%・120% など複数のしきい値で通知メールを受け取る。

4

Pub/Sub で自動対応（上級）

予算超過時に Cloud Functions を呼び出してAPIを自動停止する自動化も可能。

SECTION 15 — コスト管理

無料枠の活用：賢く無料リクエストを使い切る

SLIDE 18

60

Gemini 3.x Flash
無料 RPM（リクエスト/分）
Google AI Studio

1M

Gemini 3.x Flash
無料 TPD（トークン/日）
Google AI Studio

$300

Google Cloud
新規登録クレジット
90日間有効

90日

無料トライアル
期間
Vertex AI も対象

プラットフォーム	モデル	無料リクエスト	無料トークン	制限
Google AI Studio	Gemini 3.x Flash Preview	60 RPM	1M TPD	商用利用不可（研究・開発のみ）。2.5系は非対応
Google AI Studio	Gemini 3.1 Pro Preview	5 RPM	250K TPD	商用利用不可。2.5 Proは非対応
Vertex AI	全モデル	—	—	$300 クレジット（新規のみ）
Vertex AI	text-embedding	250 req/月	—	Embeddings のみ永続無料枠

lightbulb

戦略: 3.x系モデルの検証は Google AI Studio の無料枠で開始 → 本番移行時に Vertex AI へ切り替え。2.5系モデルは Vertex AI のみ（$300クレジットを活用）。

ハンズオン

実際に手を動かして Vertex AI と Gemini API を体験しよう

ハンズオン 1: コンソール

ハンズオン 2: curl 呼び出し

ハンズオン 3: コスト試算

SECTION 15 — ハンズオン

ハンズオン 1：Vertex AI コンソールでモデル一覧を確認

SLIDE 20

1

Google Cloud コンソールにログイン

ブラウザで console.cloud.google.com を開き、研修用 GCP プロジェクトを選択する。

2

Vertex AI を検索して開く

上部の検索バーに「Vertex AI」と入力 → 「Vertex AI」をクリック。

3

Model Garden を開く

左メニュー「Model Garden」をクリック。利用可能なモデルが一覧表示される。

4

Gemini 2.5 Flash を検索・確認

検索バーに「gemini」と入力。モデルカードに価格・コンテキスト長・機能が表示されることを確認。

5

Vertex AI Studio でプロンプトをテスト

モデルカードの「試す」ボタン → Vertex AI Studio が開く。「こんにちは」と送信してレスポンスを確認する。

console.cloud.google.com/vertex-ai/model-garden

gps_fixed

確認ポイント: gemini-2.5-flash の「コンテキストウィンドウ: 1M tokens」と「マルチモーダル対応」のバッジが表示されていること。

timer

所要時間: 約 10 分。うまくいかない場合は講師に声をかけてください。

SECTION 15 — ハンズオン

ハンズオン 2：curl コマンドで Gemini API を呼び出す

SLIDE 21

ターミナルで以下のコマンドを実行してください

 Bash
# Step 1: gcloud 認証（初回のみ）
$ gcloud auth application-default login

# Step 2: アクセストークンを取得
$ TOKEN=$(gcloud auth print-access-token)

# Step 3: PROJECT_ID を設定
$ PROJECT_ID="your-project-id" # ←変更してください

# Step 4: Gemini API を呼び出す
$ curl -s -X POST \
 "https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/gemini-2.5-flash:generateContent" \
 -H "Authorization: Bearer ${TOKEN}" \
 -H "Content-Type: application/json" \
 -d '{
 "contents": [{
 "role": "user",
 "parts": [{"text": "日本の都道府県を3つ答えてください。"}]
 }],
 "generationConfig": {
 "maxOutputTokens": 100,
 "temperature": 0.1
 }
 }' | python3 -m json.tool
 

期待されるレスポンス（抜粋）

 JSON（期待レスポンス）
{
 "candidates": [
 {
 "content": {
 "parts": [
 {
 "text": "日本の都道府県を3つ\n1. 東京都\n2. 大阪府\n3. 北海道"
 }
 ],
 "role": "model"
 },
 "finishReason": "STOP"
 }
 ],
 "usageMetadata": {
 "promptTokenCount": 16,
 "candidatesTokenCount": 24,
 "totalTokenCount": 40
 }
}
 

warning

よくあるエラー: 401 Unauthorized → TOKEN の再取得。403 Forbidden → プロジェクトで Vertex AI API が有効化されているか確認。

timer

所要時間: 約 15 分。Python SDK版（google-genai）でも同じ結果を確認してみましょう。

SECTION 15 — ハンズオン

ハンズオン 3：自社ユースケースの API コストを試算する

SLIDE 22

試算シート（自分の数値を入れてください）

項目	数値
1日のリクエスト数	_____ 件
1リクエストの入力トークン数	_____ tokens
1リクエストの出力トークン数	_____ tokens
選択モデル	Flash / Pro

 計算式
# 1日のコスト計算（Flashの場合）
入力コスト = (リクエスト数 × 入力tokens) / 1,000,000 × $0.075
出力コスト = (リクエスト数 × 出力tokens) / 1,000,000 × $0.30
月額コスト = (入力コスト + 出力コスト) × 30日

# 例: 1000件/日、入力500tokens、出力200tokens
入力: (1000 × 500) / 1M × $0.075 = $0.0375/日
出力: (1000 × 200) / 1M × $0.30 = $0.06/日
月額: ($0.0375 + $0.06) × 30 = $2.93/月
 

業種別参考コスト試算

メール要約ツール

200件/日、入力2000 tokens、出力300 tokens
Flash 月額: 約 $5.4 / 月

社内 FAQ チャットボット

500件/日、入力1000 tokens、出力500 tokens
Flash 月額: 約 $3.4 / 月

提案書ドラフト生成

50件/日、入力3000 tokens、出力2000 tokens
Pro 月額: 約 $108 / 月

calculate

公式の Pricing Calculator（cloud.google.com/products/calculator）でも試算できます。GCP アカウントなしで利用可能。

SECTION 15 — セキュリティ

セキュリティとガバナンス：エンタープライズ要件を満たす

SLIDE 23

lock

VPC Service Controls

Vertex AI へのアクセスを特定の VPC ネットワーク内に限定。インターネット経由のアクセスをブロックし、データ漏洩を防止。

key

Customer-Managed Encryption Keys (CMEK)

データの暗号化キーを自社 Cloud KMS で管理。Google が暗号化キーにアクセスできない状態を実現。金融・医療で必須。

assignment

IAM（Identity and Access Management）

最小権限の原則に基づくアクセス制御。ロールで「読み取り専用」「実行のみ」等を細かく設定できる。

bar_chart

Cloud Audit Logs

誰がいつどのモデルを呼び出したか、すべてのAPI呼び出しを BigQuery に自動記録。コンプライアンス対応・監査に対応。

Vertex AI のデータ保護ポリシー

入力データはモデル学習に使用されない
データはリクエスト処理後に保持されない
日本リージョン（asia-northeast1）でデータ残留可能
SOC 2, ISO 27001, FedRAMP 認定取得済み

warning

要注意: Google AI Studio（APIキー方式）は 商用データには使わない。Vertex AI に必ず移行すること。

SECTION 15 — まとめ

Vertex AI 活用チェックリスト

SLIDE 24

基盤設定

GCP プロジェクト作成・Vertex AI API 有効化
サービスアカウント作成・最小権限の IAM 設定
予算アラート（$50/$100）の設定
VPC Service Controls の検討（機密データの場合）

API 設計

用途に合わせたモデル選定（まず Flash から）
temperature・maxOutputTokens の適切な設定
systemInstruction でペルソナ・ルールを設定
finishReason・safetyRatings のエラーハンドリング実装

コスト管理

usageMetadata をログに記録して使用量追跡
長いシステムプロンプトは Context Caching を活用
定期的にモデルを見直し（より安いモデルが出た場合）
Batch Prediction API で大量処理のコスト削減

セキュリティ

APIキーをソースコード・Gitにコミットしない
Cloud Audit Logs を有効化・定期レビュー
個人情報・機密情報をプロンプトに含める前にマスク
レスポンスの safetyRatings を本番で必ずチェック

rocket_launch

この4つのチェックリストをクリアすれば、エンタープライズグレードの Vertex AI 活用が実現できます！

セクション15 完了

Section 15「Vertex AI 基礎と API設計」お疲れ様でした。
Vertex AI の基礎からコスト管理・セキュリティまで習得しました。

次へ → Section 16: 実践 AI アプリケーション開発

学習モデル

3種

Flash / Pro / 3.x Preview

API パターン

4種

REST / SDK / curl / Studio

ハンズオン

3本

コンソール / curl / 試算

チェックリスト

16

本番移行前の確認項目

Vertex AI 基礎と API設計

Vertex AI とは何か

Gemini API（生成AI）

AutoML（自動機械学習）

Model Garden

Vertex AI が選ばれる理由

Vertex AI vs Google AI Studio：どちらを使うか

Vertex AI の主要サービス一覧

Google Cloud コンソール：Vertex AI ダッシュボード

主要メニュー項目

Model Garden

Gemini API / Vertex AI Studio

Endpoints（デプロイ済みモデル）

Monitoring & Logs

Gemini API の仕組み：リクエストからレスポンスまで

モデル選定ガイド：Flash vs Pro vs 3.x Preview

API 設計

RESTful API 概要：HTTP の基本

HTTP メソッドと役割

リクエストの構成要素

認証方式：APIキー vs サービスアカウント vs OAuth 2.0

APIキー

サービスアカウント

OAuth 2.0

Gemini API リクエスト構造：JSON ボディの詳細

各フィールドの役割

レスポンス解析：candidates / safetyRatings / usageMetadata

重要フィールド解説

パラメータチューニング：temperature / topK / topP / maxOutputTokens

コスト管理

トークン課金の仕組み：Input vs Output

Vertex AI 公式価格表（2026年4月時点）

コスト最適化 3つの鉄則

鉄則1Flash を使い倒す

鉄則2Context Caching

鉄則3出力を絞る

予算管理：Google Cloud Budgets & Alerts の設定

Budget 設定手順

予算の範囲を選択

予算金額を設定

アラートのしきい値を設定

Pub/Sub で自動対応（上級）

無料枠の活用：賢く無料リクエストを使い切る

ハンズオン

ハンズオン 1：Vertex AI コンソールでモデル一覧を確認

Google Cloud コンソールにログイン

Vertex AI を検索して開く

Model Garden を開く

Gemini 2.5 Flash を検索・確認

Vertex AI Studio でプロンプトをテスト

ハンズオン 2：curl コマンドで Gemini API を呼び出す

ハンズオン 3：自社ユースケースの API コストを試算する

業種別 参考コスト試算

セキュリティとガバナンス：エンタープライズ要件を満たす

VPC Service Controls

Customer-Managed Encryption Keys (CMEK)

IAM（Identity and Access Management）

Cloud Audit Logs

Vertex AI 活用チェックリスト

基盤設定

API 設計

コスト管理

セキュリティ

セクション15 完了

鉄則1
Flash を使い倒す

鉄則2
Context Caching

鉄則3
出力を絞る

業種別参考コスト試算