Googleのエンタープライズ AI プラットフォームを使いこなす
— モデル選定・API設計・コスト管理を体系的に学ぶ —
SECTION 15 — Vertex AI 基礎
Google Cloud の統合 AI プラットフォーム
ML モデルの構築・学習・デプロイ・モニタリングを
ワンストップで行える Google Cloud のサービス群
Gemini 2.5 Flash / Pro などの最新モデルをAPIで利用。テキスト・画像・動画・音声のマルチモーダル対応。
コードなしで画像分類・テキスト分類・表形式データのモデルを構築できる。
Google製・オープンソースのモデルを一覧から選択してすぐにデプロイ可能。
SECTION 15 — Vertex AI 基礎
| 比較項目 |
Vertex AI エンタープライズ向け |
Google AI Studio 開発者・個人向け |
|---|---|---|
| 主な用途 | 本番システム、業務アプリへの組み込み | プロトタイプ作成、学習、個人プロジェクト |
| 料金 | 従量課金(企業契約・割引あり) | 無料枠あり、超過分は従量課金 |
| 認証 | サービスアカウント / Workload Identity | APIキー(シンプル) |
| データ残留 | 学習に使われない 企業データ保護 | 設定依存 デフォルトは改善に利用 |
| SLA | 99.9% 保証 | ベストエフォート |
| スケール | 自動スケーリング、高負荷対応 | レート制限あり(RPM/TPM) |
| MLOps | Pipelines, Model Registry, Monitoring 統合 | 基本的なプロンプト管理のみ |
SECTION 15 — Vertex AI 基礎
SECTION 15 — Vertex AI 基礎
利用可能なモデルの一覧。フィルタリングで用途別に絞り込める。
ブラウザ上でプロンプトをテスト。APIキーなしでUIから試せる。
デプロイ済みモデルへのエンドポイントURL・認証情報を確認。
APIリクエスト数・レイテンシ・エラー率をリアルタイムで監視。
SECTION 15 — Vertex AI 基礎
リクエスト例(JSON)
レスポンス例(JSON)
SECTION 15 — Vertex AI 基礎
Gemini 2.5 Flash
速度重視・コスト最小
Gemini 2.5 Pro
品質と速度のバランス
Gemini 3.x Preview
最新機能・プレビュー版
認証・リクエスト構造・パラメータチューニングをマスターする
SECTION 15 — API 設計
| メソッド | 操作 | Vertex AI での使用例 |
|---|---|---|
| POST | データ送信・生成 | generateContent(テキスト生成) |
| GET | データ取得 | モデル情報の取得 |
| PUT | データ更新 | エンドポイント設定の更新 |
| DELETE | データ削除 | デプロイ済みモデルの削除 |
エンドポイント構造
{region}-aiplatform.googleapis.com/v1/projects/{project-id}/locations/{region}/publishers/google/models/{model-id}:{method}
SECTION 15 — API 設計
固定の文字列をHTTPヘッダーに付与するシンプルな方式。
システム間通信に使うロボットアカウント。JSON キーファイルで認証。
ユーザーの権限でAPIにアクセスする方式。Webアプリの「Googleでログイン」と同じ仕組み。
SECTION 15 — API 設計
① contents
ユーザーとモデルの会話履歴。
role は "user" または "model"。マルチモーダル(テキスト+画像)も同じparts 配列で表現。
② systemInstruction
モデルへの役割・ペルソナ設定。会話全体に適用される「背景ルール」。
③ generationConfig
出力のランダム性・長さを制御。responseMimeType で JSON 出力も強制可能。
④ safetySettings
有害コンテンツのフィルタリング感度。業務用途に応じて調整(BLOCK_ONLY_HIGH 推奨)。
SECTION 15 — API 設計
candidates[0].content.parts[0].text
実際の生成テキスト。Python での取り出し: response.candidates[0].content.parts[0].text または response.text
finishReason の値
STOP | 正常終了 |
MAX_TOKENS | トークン上限に到達 |
SAFETY | 安全フィルタで停止 |
RECITATION | 著作権関連で停止 |
usageMetadata でコスト計算
totalTokenCount × 単価 = リクエスト1回のコスト。
ログに保存してコスト追跡に活用する。
SECTION 15 — API 設計
出力のランダム性・創造性を制御。0に近いほど決定論的、高いほど多様な出力。
| 0.0〜0.3 | 事実確認・分類・データ抽出 |
| 0.5〜0.8 | 文書作成・要約・Q&A(推奨) |
| 1.0〜2.0 | ブレインストーミング・創作 |
生成するトークンの最大数。1トークン ≒ 日本語1.5文字 / 英語0.75単語。
次のトークン候補を上位K個に絞る。topK=1は最も確実性が高い(greedy)。通常はデフォルト(40)で十分。
累積確率がP以上になるまでトークンを選択。topP=0.95は上位95%の確率質量から選択。
トークン課金の仕組みを理解して、賢くコストを最小化する
SECTION 15 — コスト管理
トークンとは何か
テキストを分割した最小単位。英語は約4文字で1トークン、日本語は約1.5〜2文字で1トークン。
Input Tokens(入力)
システムプロンプト + 会話履歴 + ユーザーの質問 + 添付ファイル(画像・動画)のすべてがカウントされる。長い会話履歴は積み上がるので注意。
Output Tokens(出力)
モデルが生成したテキストのトークン数。通常、Input の2〜5倍の単価が設定されている。Streaming時も同様。
| モデル | 入力(/1M tokens) | 出力(/1M tokens) | 特記 |
|---|---|---|---|
| Gemini 2.5 Flash | $0.075 | $0.30 | 推奨 |
| Gemini 2.5 Flash(128K超) | $0.15 | $0.60 | 長文注意 |
| Gemini 2.5 Pro | $1.25 | $10.00 | |
| Gemini 2.5 Pro(128K超) | $2.50 | $15.00 | 高コスト注意 |
| text-embedding-005 | $0.00002 | — | 超低コスト |
SECTION 15 — コスト管理
Pro と Flash の価格差は約17倍。Flash で動く用途はすべて Flash を選ぶ。
長いシステムプロンプトや共通文書を「キャッシュ」として保存。再利用で入力コストを最大75%削減。
出力トークンは入力より単価が高い。不要な出力を減らすことで大幅なコスト削減が可能。
SECTION 15 — コスト管理
プロジェクト全体 or 特定サービス(Vertex AI のみ)を選択。Vertex AI に絞ることで API コストのみ監視できる。
月額予算(例: $100)を設定。過去の請求額から自動計算する「前月実績ベース」も選択可能。
50%・80%・100%・120% など複数のしきい値で通知メールを受け取る。
予算超過時に Cloud Functions を呼び出してAPIを自動停止する自動化も可能。
SECTION 15 — コスト管理
| プラットフォーム | モデル | 無料リクエスト | 無料トークン | 制限 |
|---|---|---|---|---|
| Google AI Studio | Gemini 3.x Flash Preview | 60 RPM | 1M TPD | 商用利用不可(研究・開発のみ)。2.5系は非対応 |
| Google AI Studio | Gemini 3.1 Pro Preview | 5 RPM | 250K TPD | 商用利用不可。2.5 Proは非対応 |
| Vertex AI | 全モデル | — | — | $300 クレジット(新規のみ) |
| Vertex AI | text-embedding | 250 req/月 | — | Embeddings のみ永続無料枠 |
実際に手を動かして Vertex AI と Gemini API を体験しよう
SECTION 15 — ハンズオン
ブラウザで console.cloud.google.com を開き、研修用 GCP プロジェクトを選択する。
上部の検索バーに「Vertex AI」と入力 → 「Vertex AI」をクリック。
左メニュー「Model Garden」をクリック。利用可能なモデルが一覧表示される。
検索バーに「gemini」と入力。モデルカードに価格・コンテキスト長・機能が表示されることを確認。
モデルカードの「試す」ボタン → Vertex AI Studio が開く。「こんにちは」と送信してレスポンスを確認する。
SECTION 15 — ハンズオン
ターミナルで以下のコマンドを実行してください
期待されるレスポンス(抜粋)
401 Unauthorized → TOKEN の再取得。403 Forbidden → プロジェクトで Vertex AI API が有効化されているか確認。SECTION 15 — ハンズオン
試算シート(自分の数値を入れてください)
| 項目 | 数値 |
| 1日のリクエスト数 | _____ 件 |
| 1リクエストの入力トークン数 | _____ tokens |
| 1リクエストの出力トークン数 | _____ tokens |
| 選択モデル | Flash / Pro |
メール要約ツール
200件/日、入力2000 tokens、出力300 tokens
Flash 月額: 約 $5.4 / 月
社内 FAQ チャットボット
500件/日、入力1000 tokens、出力500 tokens
Flash 月額: 約 $3.4 / 月
提案書ドラフト生成
50件/日、入力3000 tokens、出力2000 tokens
Pro 月額: 約 $108 / 月
SECTION 15 — セキュリティ
Vertex AI へのアクセスを特定の VPC ネットワーク内に限定。インターネット経由のアクセスをブロックし、データ漏洩を防止。
データの暗号化キーを自社 Cloud KMS で管理。Google が暗号化キーにアクセスできない状態を実現。金融・医療で必須。
最小権限の原則に基づくアクセス制御。ロールで「読み取り専用」「実行のみ」等を細かく設定できる。
誰がいつどのモデルを呼び出したか、すべてのAPI呼び出しを BigQuery に自動記録。コンプライアンス対応・監査に対応。
Vertex AI のデータ保護ポリシー
SECTION 15 — まとめ
Section 15「Vertex AI 基礎と API設計」お疲れ様でした。
Vertex AI の基礎からコスト管理・セキュリティまで習得しました。