GCP Vertex AI

配置 GCP Vertex AI 与 Cline 以访问领先的生成式 AI 模型,如 Claude 3.5 Sonnet v2。本指南涵盖 GCP 环境设置、身份验证和企业团队的安全集成。

概述

GCP Vertex AI: 一个完全托管的服务,提供对领先的生成式 AI 模型(如 Anthropic 的 Claude 3.5 Sonnet v2)的访问——通过 Google Cloud。了解更多关于 GCP Vertex AIarrow-up-right

本指南专为具有已建立 GCP 环境的组织(利用 IAM 角色、服务账户和资源管理最佳实践)量身定制,以确保安全和合规的使用。


步骤 1:准备您的 GCP 环境

1.1 创建或使用 GCP 项目

1.2 设置 IAM 权限和服务账户

  • 分配必需角色:

    • 为您的用户(或服务账户)授予 Vertex AI User 角色(roles/aiplatform.user

    • 对于服务账户,还要附加 Vertex AI Service Agent 角色(roles/aiplatform.serviceAgent)以启用某些操作

    • 根据需要考虑其他预定义角色:

      • Vertex AI Platform Express Admin

      • Vertex AI Platform Express User

      • Vertex AI Migration Service User

  • 跨项目资源访问:

    • 对于不同项目中的 BigQuery 表,分配 BigQuery Data Viewer 角色

    • 对于不同项目中的 Cloud Storage 存储桶,分配 Storage Object Viewer 角色

    • 对于外部数据源,请参阅 GCP Vertex AI 访问控制文档arrow-up-right


步骤 2:验证区域和模型访问

2.1 选择并确认区域

Vertex AI 支持多个区域。选择一个满足您的延迟、合规性和容量需求的区域。示例包括:

  • us-east5(哥伦布,俄亥俄)

  • us-central1(爱荷华)

  • europe-west1(比利时)

  • europe-west4(荷兰)

  • asia-southeast1(新加坡)

  • global(全球)

全局端点可能提供更高的可用性并减少资源耗尽错误。仅支持 Gemini 模型。

2.2 启用 Claude 3.5 Sonnet v2 模型

  • 打开 Vertex AI 模型花园: 在云控制台中,导航到 Vertex AI → Model Garden

  • 启用 Claude 3.5 Sonnet v2: 找到 Claude 3.5 Sonnet v2 的模型卡并点击 启用


步骤 3:配置 Cline VS Code 扩展

3.1 安装和打开 Cline

VS Code 中的 Cline 扩展

3.2 配置 Cline 设置

  • 打开 Cline 设置: 在 Cline 扩展中点击设置 ⚙️ 图标

  • 设置 API 提供商: 从 API 提供商下拉菜单中选择 GCP Vertex AI

  • 输入您的 Google Cloud 项目 ID: 提供您之前设置的项目 ID

  • 选择区域: 选择支持的区域之一(例如 us-east5

  • 选择模型: 从可用列表中选择 Claude 3.5 Sonnet v2

  • 保存和测试: 保存您的设置并通过发送简单提示词进行测试(例如"生成一个 Python 函数来检查数字是否为质数。")


步骤 4:身份验证和凭据设置

选项 A:使用您的 Google 账户(用户凭据)

  1. 安装 Google Cloud CLI: 遵循安装指南arrow-up-right

  2. 初始化和身份验证:

    • 这使用您的 Google 账户设置应用程序默认凭据(ADC)

  3. 重启 VS Code: 确保 VS Code 已重启,以便 Cline 扩展获取新凭据

选项 B:使用服务账户(JSON 密钥)

  1. 创建服务账户:

    • 在 GCP 控制台中,导航到 IAM & Admin > Service Accounts

    • 创建新服务账户(例如"vertex-ai-client")

  2. 分配角色:

    • 附加 Vertex AI Userroles/aiplatform.user

    • 附加 Vertex AI Service Agentroles/aiplatform.serviceAgent

    • 可选择根据需要添加其他角色

  3. 生成 JSON 密钥:

    • 在服务账户部分,管理您的服务账户的密钥并下载 JSON 密钥

  4. 设置环境变量:

    • 这指示 Google Cloud 客户端库(和 Cline)使用此密钥

  5. 从设置了 GOOGLE_APPLICATION_CREDENTIALS 变量的终端启动 VS Code


步骤 5:安全性、监控和最佳实践

5.1 强制最小权限

  • 最小权限原则: 仅授予最低必要的权限。与广泛的预定义角色相比,自定义角色可以提供更细粒度的控制

  • 最佳实践: 请参阅 GCP IAM 最佳实践arrow-up-right

5.2 管理资源访问

  • 项目级与资源级访问: 访问可以在两个级别进行管理。请注意,资源级权限(例如对于 BigQuery 或 Cloud Storage)会添加到,但不会覆盖项目级策略

5.3 监控使用情况和配额

  • 模型可观测性仪表板:

    • 在 Vertex AI 控制台中,导航到 Model Observability 仪表板

    • 监控请求吞吐量、延迟和错误率(包括 429 配额错误)等指标

  • 配额管理:

5.4 服务代理和跨项目注意事项

  • 服务代理: 注意不同的服务代理:

    • Vertex AI Service Agent

    • Vertex AI RAG Data Service Agent

    • Vertex AI Custom Code Service Agent

    • Vertex AI Extension Service Agent

  • 跨项目访问: 对于其他项目中的资源(例如 BigQuery、Cloud Storage),确保分配了适当的角色(BigQuery Data Viewer、Storage Object Viewer)


结论

通过遵循这些步骤,您的企业团队可以安全地将 GCP Vertex AI 与 Cline VS Code 扩展集成,以利用 Claude 3.5 Sonnet v2 的强大功能:

  • 准备您的 GCP 环境: 创建或使用项目,使用最小权限配置 IAM,并确保附加了必要的角色(包括 Vertex AI Service Agent 角色)

  • 验证区域和模型访问: 确认您选择的区域支持 Claude 3.5 Sonnet v2 并且该模型已启用

  • 在 VS Code 中配置 Cline: 安装 Cline,输入您的项目 ID,选择适当的区域,并选择模型

  • 设置身份验证: 使用用户凭据(通过 gcloud auth application-default login)或带有 JSON 密钥的服务账户

  • 实施安全性和监控: 遵循 IAM 最佳实践,仔细管理资源访问,并使用模型可观测性仪表板监控使用情况

如需更多详细信息,请查阅 GCP Vertex AI 文档arrow-up-right和您的内部安全策略。 编码愉快!

本指南将随着 GCP Vertex AI 和 Cline 的发展而更新。请始终参阅最新文档以获取当前实践。

Last updated