如何使用 Google Cloud Platform 里的 Gemini (Vertex AI)

2026-04-11 08:141阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

论坛内关于这方面的教程散落在各处,所以我想给未来的佬友们做一个方便的指引。
本人没怎么写过教程,若有内容遗漏、差错等还请见谅。

[!note]- 这个教程将假设你已经完成注册
账号注册、风控、信用卡和预付费这些东西,变数太多,站内也有这些讨论,所以就不多展开。
这个教程将假设你已经领取到了赠金,并成功进入控制台。
a11202×551 37.7 KB

[!question]- 我的赠金不是 $300?
赠金固定 300 美元,不会给多或给少。
说明你在注册 GCPGoogle Cloud Platform时,地区选择了美国外的地方(或其他原因导致的地区变化)。
比如澳元、港币和新台币,这些货币的符号也会显示为 $,但数字跟随当地货币;
日元 ¥ 同理。

[!info]- 那个额外的 $1000 赠金是什么?
前往导航菜单(侧边栏) - 结算Billing → 赠金Credits
除了 Free Trial,还有一个 $1000 的 Trial credit for GenAI App Builder
据我所知,这个用途非常窄,基本可以当作不存在。

[!question]- 新政策下,赠金不能再抵扣 Gemini?
来源:免费 Google Cloud 功能和试用优惠 | Google Cloud Free Program | Google Cloud Documentation
2026 年 3 月 2 号开始,佬友们常用的 Google AI Studio 不能再使用赠金抵扣了,GCP 内的 Vertex AI 不受影响

谷歌的新政策堵上了免费赠金用户的主要 AI 使用渠道。
在新政策前,佬友们常使用 AI StudioGenerative Language API 来创建密钥。
严格来说,这种方式创建出的密钥,走的是(类似)AI Studio 渠道的付费层级,并不是 Vertex AI 渠道。
新政策收紧了(类似)AI Studio 渠道,除非花真钱,否则从这里创建出来的也是基本上没什么可用的免费层级。

[!danger]- 新号谨慎使用 AI Studio,会被反薅!
2026 年 3 月 2 号后注册的账号受新政策影响,AI Studio 会绕过赠金直接扣真钱!
站内已经有被反薅先例了。

[!note]- 请确认自己使用的工具是否可以直接调用 Vertex AI
快速确认

  1. 你的工具是否有 Vertex AI 提供商,或者 Google 提供商里有 Vertex AI 开关?
    → 有,让我输入服务邮箱、私钥和项目 ID 等字段:可以直接调用 (用服务账号密钥)跟随第 1, 3, 3.1, 4.1 章
    → 有,让我输入 API 密钥:可以直接调用 (用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2 章
    → 要求安装 Google Cloud SDK:可以直接调用 跟随第 1, 4.3 章
    → 上述情况都不符合:继续……

  2. 你的工具是否会自动处理提供商 URL?比如加上 v1beta 后缀。
    不会自动处理:可以直接调用 (用 Google 提供商 + 自定义 URL,用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2, 4.2 章
    → 会自动处理,也没有相关设置:大概率无法直接调用 需要转发/中转

Vertex AI 的优缺点

优点:

  1. GCP 作为 To B面向组织/企业的产品,给模型降智这点很少发生。
  2. 配额限制非常高,没有每日请求次数上限(硬要说的话,有一个 30000 RPM 的请求限制),但请看缺点 2
  3. (NSFW) 本人实测 Vertex AI 渠道在这方面门槛很低,调用时 safetySettings 全设为关,被拦截的概率很小。但别忘了还有大模型内部安全对齐,所以破限多少得带点,但不用那么麻烦。(Nano banana 系列模型是例外,生成的图片仍会有额外审查且会拦截)

缺点:

  1. 赠金只有 300 美元,只有90天,一个账号只有一次。
  2. 除了固定的配额限制,还采用 共享池 + 动态配额,429 错误通常不是配额达到上限,而是你暂时没抢到算力资源,这也导致请求随时都可能 429(使用赠金的用户优先级很低)。整体上,白天(美国黑天)通常会流畅一些。
  3. 不稳定的首 Token 时间,有可能马上响应,也有可能要等个好几分钟(和缺点 2 有很大关系)。
  4. API 调用方式不方便,也不容易分享。

以上缺点基本都能用真钱消费解决,缺点 4 可以采用中转站的方式来分享。

这个教程会带领你使用 Vertex AI。
首先需要启用 API。

1. 启用 Vertex AI API

前往导航菜单(侧边栏) → API 和服务APIs & Services → 库Library
a2896×550 40.7 KB
找到 Vertex AI API,进入后点击启用Enable
a3967×120 9.15 KB
a4643×242 12.1 KB
成功启用后,对应按钮会变成管理Manage

成功启用 API 后,可以进入 Vertex AI Studio 在线使用。
如果需要外部调用,跟随第 3 和 4 章创建服务账号并创建密钥即可。
可以在上面的 请确认自己使用的工具…… 里面确认什么密钥适合自己,是可以用熟悉的一串 API 密钥,还是得用服务账号密钥,还是不能直接调用。

如果工具要求安装 Google Cloud SDK,或者在 Python/NodeJS 里通过官方库调用,那你或许直接使用 Google Cloud SDK 登录个人账号即可,无需服务账号(可直接跳到 4.3.)。

2. 使用 - Vertex AI Studio

前往导航菜单(侧边栏) → Vertex AI → Vertex AI Studio。
你能看到熟悉的对话界面,可以直接在这里体验各种谷歌家的模型,比如对话、生图、视频等。
注意这里也会消耗赠金。

你可能发现了左下角有 获取 API 密钥
那个本质上是 Generative Language API,和 AI Studio 是类似的东西,赠金用户属于免费层级,有严格配额限制,没什么可用的。
(如果你付费花真钱,那么这个会变成付费层级,是可以用的)

3. 创建服务账号

首先确认你的 GCP 是否有组织。

a381355×495 32.5 KB

如果和图中一样,窗口左上角可以切换组织,那么就是有组织的。
GCP 账号注册后可能会自带一个组织 + 项目,也可能只有一个无组织项目。
如果你的 GCP 有组织,我个人推荐创建并使用无组织项目,省事。
如果你仍要使用组织下的项目也是可以的,只是中途会比无组织项目多几个步骤,教程也兼顾了组织下的项目。

创建无组织项目

点击窗口右上角的 新建项目New project
a36799×577 12.2 KB

项目名称和 ID 随意;
结算账号选择 我的结算账号My Billing Account(带新用户赠金的账号);
组织选择 无组织No organization
点击 创建Create 即可。
a37528×545 21.8 KB


前往导航菜单(侧边栏) → IAM 和管理IAM & Admin → 服务账号Service Accounts
a5482×571 28.1 KB

来到如下界面。
点击上面的 创建服务账号Create service account
a6717×364 20.4 KB

服务账号名称和 ID 随意,然后点击 创建并继续Create and continue
a7588×579 22.6 KB

不小心提前点击完成Done

已经能看到新的服务账号了。
找到右侧 操作Actions 下方的三个点,点击 管理权限Manage permissions 继续配置。
a10758×341 12 KB
a11919×571 41.5 KB


然后给予角色,只是拿来调用 AI 的话,Vertex AI User 这个角色的权限已经足够。
a8540×510 19.2 KB
a9495×366 17.6 KB
然后点击 完成Done

[!danger]- 不要向服务账号给予 Owner 角色!
Owner 角色的权限非常高,可接管整个 GCP 项目,包括支付与结算
若密钥泄露,后果严重!
建议只给予需要的角色,让账号只获得需要的权限。

3.1. 获取服务账号密钥

从第 3 章结尾,创建服务账号后继续。

服务账号的密钥不是简单的一串字符,而是以下三个字段联合,缺一不可:

  • 账户邮箱Client Email
  • 私钥Private Key
  • 项目 IDProject ID

找到右侧 操作Actions 下方的三个点,点击 管理密钥Manage keys 继续配置密钥。
a12758×341 12 KB

点击 添加键Add key,再点击 创建新密钥Create new key,类型选择 JSON。
a13434×511 16.3 KB
a14492×309 8.73 KB

[!failure] 密钥创建功能已停用?
这是因为当前项目属于某个组织下,组织政策里默认禁止了密钥创建。
你可以继续在当前项目下去关闭政策,
也可以去创建一个无组织项目,然后回到第 1 章从启用 API 重新开始。

关闭对应政策

a15583×466 25.2 KB
复制这个:iam.managed.disableServiceAccountKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。


密钥创建完毕,会自动下载一个 JSON 密钥文件。
密钥文件只能下载这一次,丢了需要创建新密钥。
妥善保管,同时避免泄露!
a21801×188 4.62 KB

3.2. 获取一串 API 密钥

从第 3 章结尾,创建服务账号后继续。

如果你的项目属于某组织,则需要关闭一个组织政策,防止 API 密钥创建被阻止。
复制这个:iam.managed.disableServiceAccountApiKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。

前往导航菜单(侧边栏) → API 和服务APIs & Services → 凭证Credentials
a39448×419 18.2 KB

点击上面的 创建凭证Create credentials,选择 API 密钥API key
a40587×297 16.7 KB

密钥名称随意;
先点击 通过服务账号对 API 调用进行身份验证Authenticate API calls through a service account
选择有对应角色/权限的服务账号(比如 Vertex AI User 角色),
然后选择使用 Vertex AI API,
最后点击下面的 创建Create
a41586×554 28.7 KB

成功后熟悉的一串密钥就创建了,通常是 AQ. 开头。
请继续跟随第 4.2. 章。

3.3. 关闭组织政策

点击左上角选择项目/组织,确认属于某个组织;点击弹窗右上角的三个点,点击 组织政策Organization policies
a161216×879 63.9 KB

[!failure] 组织政策显示没有权限查看?↓ 跟随 错误 1.1 再继续

错误 1.1

a22796×753 43.5 KB

项目的 IAM 和组织的 IAM 是互相独立的,说明你在组织里缺少必要角色的权限。
直接在顶部居中的搜索框里输入 Organization details 然后进入。
a23700×568 43.2 KB

a241263×459 19.4 KB
可以看到已经提示缺少权限了,点击右侧的 授予访问权限Grant access
等待两三分钟让更改生效

必要的权限都没有,大概率也会遇到 错误 1.2,建议也跟随。


进入如下画面,在过滤输入框里搜索(或粘贴之前让你复制的),可以看到有一个 强制执行状态Enforcement state 为 有效Active 的政策。
a17v21439×872 72.8 KB

点击进入那个政策,然后点击右上角的 管理政策Manage policy
a18582×559 20.9 KB

[!failure] 管理政策Manage policy 按钮是灰色,无法点击?↓ 跟随 错误 1.2 再继续

错误 1.2

项目的 IAM 和组织的 IAM 是互相独立的。
进入 IAM,注意是组织的 IAM
找到主账号(邮箱是你的),点击右侧的铅笔按钮。
a251218×640 45.8 KB

搜索 Organization Policy Administrator 并给予这个角色。
a26517×389 23.6 KB

点击 保存Save等待两三分钟让更改生效


政策来源Policy source 改为 覆盖父资源的政策Override parent’s policy
添加规则Add a rule,实施Enforcement 选择 关闭Off,点击右下角 完成Done,最后点击 设置政策Set policy
a19549×685 23.7 KB
a20532×564 17.9 KB

成功后即可看到 强制执行状态Enforcement state 变成了 未实施Not enforced
等待两三分钟让更改生效


4. 查看可用模型 & 区域的选择

[!info] 无法拉取模型列表是正常现象
即使配置正确,列表里也拉取不了任何模型,这是正常的,Vertex AI API 不提供这个功能。
你需要手动添加模型。

Vertex AI 也是最快获取 Gemini 新模型的渠道之一。
Gemini 新模型上架后,只需查查它的模型 ID,通常都能在 Vertex AI 里使用。

查看可用模型

前往导航菜单(侧边栏) → Vertex AI → 模型库Model Garden
你能看到有各种各样的模型,不仅限于 Gemini 系列。

别想得太美,别家模型(Claude 等)都不能直接用,需要申请(Google 自家的非 Gemini 系列模型也类似);
且不说能不能申请通过,受新政策影响的账号即使申请成功了,调用别家模型也不会使用赠金(激活/升级账号后也一样)。
赠金用户基本就老实用用 Gemini 系列模型吧。

点击一个模型,可以查看详细信息,模型 ID 就在右侧。
这个页面的模型 ID 写得太完全了,通常添加模型时要取最后的 gemini-* 部分。
a421110×617 48.6 KB
(这一长串模型 ID 的前部分指的是用一串 API 密钥调用时的 URL 路径)

区域Location的选择

大部分情况下选择 us-central1 即可。
如果你要使用预览模型(模型 ID 带 -preview 后缀),需要选择 global,否则会报错找不到模型。

4.1. 使用 - Vertex AI API(服务账号密钥)

从第 3.1. 章结尾,下载 JSON 密钥文件后继续。
如果配置界面中要求填写 JSON,那么只需打开密钥文件,把整个内容复制粘贴进去即可。
否则,你需要提取 账号邮箱、私钥和项目 ID 这些字段。

密钥文件的结构大概如下:

{ "type": "service_account", "project_id": "项目 ID", "private_key_id": "*****", "private_key": "-----BEGIN PRIVATE KEY-----\n非常长的私钥\n-----END PRIVATE KEY-----\n", "client_email": "服务账号邮箱", "client_id": "*****", "auth_uri": "https://accounts.google.com/o/oauth2/auth", "token_uri": "https://oauth2.googleapis.com/token", "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs", "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/*****.iam.gserviceaccount.com", "universe_domain": "googleapis.com" }

账号邮箱对应 client_email
私钥对应 private_key,建议完整地复制私钥,包括前后的 -----BEGIN/END PRIVATE KEY-----
项目 ID 对应 project_id

4.2. 使用 - Vertex AI API(一串 API 密钥)

从第 3.2. 章结尾,获取一串 API 密钥后继续。
这章主要针对没有 Vertex AI 提供商的工具,可以用 Google 提供商 + 自定义 URL 做替代方案。

Vertex AI API 不使用原先的 generativelanguage.googleapis.com
需要更改提供商 URL:
https://{区域?}-aiplatform.googleapis.com/v1/publishers/google

比如使用 us-central1 区域就是:
https://us-central1-aiplatform.googleapis.com/v1/publishers/google

如果是 global 区域,开头的 {区域}- 不用加:
https://aiplatform.googleapis.com/v1/publishers/google

URL 后面不要加上 v1beta,加上会 404!建议检查工具是否会自动处理 URL。

4.3. 使用 - Vertex AI API(Google Cloud SDK - 登录谷歌账号)

首先安装完 Google Cloud SDK 后,
打开控制台,执行 gcloud init
成功后会询问 You must sign in to continue. Would you like to sign in (Y/n)?,输入 Y,会弹出浏览器,登录你的 GCP 谷歌账号。

登录成功后,控制台会显示如下文字:

You are signed in as: [example@example.com]. Pick cloud project to use: [1] 项目 ID [2] 更多项目 ID... [n] Enter a project ID [n] Create a new project Please enter numeric choice or text value (must exactly match list item):

选择一个项目,输入左侧的序号。

成功后会显示这行文字:Your current project has been set to: [项目 ID].

接下来给程序创建默认凭据ADC
执行 gcloud auth application-default login,会再弹出浏览器,再登录一次你的 GCP 谷歌账号。

登录成功会显示这行文字:Credentials saved to file: [your\path\gcloud\application_default_credentials.json].

完成,之后通过官方 GenAI 库还是通过 SDK 调用时,都会找到默认凭据。

常用命令

查看账号(保存的所有账号、当前激活的账号):gcloud auth list
查看配置(当前账号和项目):gcloud config list

登录账号:gcloud auth login
切换当前激活账号:gcloud config set account 账号邮箱

设置当前项目:gcloud config set project 项目ID

登出指定账号:gcloud auth revoke 账号邮箱
登出所有账号:gcloud auth revoke --all

[!warning]- 不想被反薅就不要点 激活/升级
如果你只想使用赠金,用完即停,就不要点击页面右上角或其他任何和账号有关的 激活Activate 或 升级Upgrade 按钮。

其他 1. 查看赠金剩余

前往导航菜单(侧边栏) - 结算Billing
有新用户赠金的结算账号通常叫 我的结算账号My Billing Account
在左上角可以切换查看,查看有新用户赠金的结算账号时右下角会直接显示剩余金额和时间。
从使用到计费会有 2~5 小时的延迟。
a271252×997 73.4 KB

还有通用的方法,对所有结算账号都可用。
点击左侧的 赠金Credits,就会显示当前的赠金。
a281270×631 30.5 KB

其他 2. 切换项目的结算账号

GCP 偶尔会有 5 美元的赠金羊毛(佬友们也会分享),领取后会新建一个结算账号。
左上角打开选择结算账号的窗口,点击 管理结算账号Manage billing accounts
a29407×277 11.6 KB

点击 您的项目Your projects,若找不到项目就检查上面的组织选择是否正确。
然后点击项目右侧 操作Actions 下方的三个点,点击 更改结算信息Change billing
a30834×401 14.1 KB

选择其他结算账号后点击 设置账号Set account 即可。
a31561×291 16 KB

其他 3.1. 查看本月的 Token 消耗量(桌面端 - 快速方便)

前往导航菜单(侧边栏) - Vertex AI → 信息中心Dashboard
进入后下滑页面,即可看到各模型的 Token 消耗和费用。
gemini-3.1-pro-preview 的消耗也算在 3 Pro 里)
a321018×404 32.6 KB

移动端大概率不显示这个信息,不知什么原因(可能是视口宽度不够?)。
如果没有桌面端又想看,或者想看模型调用次数,可以跟随 其他 3.2. 的通用方法。

其他 3.2. 查看 Token 消耗量和模型调用次数(通用)

前往导航菜单(侧边栏) - Monitoring → Metrics Explorer。
右上角选择想查询的时间范围,右侧的 Widget 类型Widget type 选择 Table,点击右上角偏下的 PromQL。
a331017×463 21.2 KB

点击 PromQL 后,左侧变成了命令输入框。
复制粘贴下面的查询命令后点击右上角的 执行查询Run Query 或打开 自动运行Auto-Run
一个输入框只放一条命令。

查询各模型的输入/输出 Token 消耗量

sum by ("model_user_id","type")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/token_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))

结果示例

a34691×574 35.1 KB

查询各模型的调用次数

sum by ("model_user_id")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/model_invocation_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))

结果示例

a35691×341 16.3 KB

其他 4.1. 请求体 safetySetting - 内容过滤设置

请求时,在请求体Request body一同传入,不传的话 threshold 默认都是 OFF

KeysafetySetting
Value为一个对象数组,每个对象通常都由 categorythreshold 组成。

[ { "category": "过滤类型", "threshold": "触发阈值" } ]

过滤类型

以下四个类型在所有 Gemini 渠道都可用:
HARM_CATEGORY_HATE_SPEECH:仇恨内容
HARM_CATEGORY_DANGEROUS_CONTENT:(暴力等)危险内容
HARM_CATEGORY_HARASSMENT:(辱骂、欺凌等)侮辱内容
HARM_CATEGORY_SEXUALLY_EXPLICIT:NSFW 内容

以下五个类型仅在 Vertex AI 渠道可用,其他渠道不支持:
HARM_CATEGORY_JAILBREAK:大模型破限/越狱内容
HARM_CATEGORY_IMAGE_HATE:包含仇恨内容的图片
HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT:包含危险内容的图片
HARM_CATEGORY_IMAGE_HARASSMENT:包含侮辱内容的图片
HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT:包含 NSFW 内容的图片
(以上四个图片相关设置似乎并不作用于 Nano Banana 生图,图片照样会拦截)

触发阈值

BLOCK_LOW_AND_ABOVE:可能性低也触发
BLOCK_MEDIUM_AND_ABOVE:可能性中等也触发
BLOCK_ONLY_HIGH:仅在可能性高时触发
BLOCK_NONE:(尽可能)不触发
OFF:关闭

BLOCK_NONEOFF 不代表 100% 不触发,只是把触发概率降到最低了(即使这样也比 AI Studio 的触发概率低很多)。
BLOCK_NONE 仍会在返回中带上安全评级,OFF 不会。
另外别忘了还有大模型的内部安全对齐。

详细内容可查看 官方文档 。

值的完全体:

[ { "category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "OFF" }, { "category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_HARASSMENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_JAILBREAK", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_HATE", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_HARASSMENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT", "threshold": "OFF" } ]

其他 4.2. 请求头 ...Request-Type - 随用随付PayGo类型

请求时,在请求头Request header一同传入,不传的话将使用 标准Standard 类型。

有三种随用随付类型,分别是 灵活Flex、标准Standard 和 优先Priority

灵活 类型用更慢的响应换更低的费用倍率,优先 类型用更高的费用倍率换更快的响应。

KeyX-Vertex-AI-LLM-Shared-Request-Type
Value请看表格:

类型 响应速度 费用倍率
灵活 flex 更慢 0.5x
标准 - 正常 1x
优先 priority 更快 1.8x

详细内容可查看官方文档:灵活、标准、优先 和 费用表

网友解答:
--【壹】--:

image1920×1090 229 KB
为什么这边没办法管理政策?


--【贰】--:

vertex的预览版Gemini疯狂429啊…


--【叁】--:

感谢, 是在
image784×154 6.38 KB
这里面增加缺失的权限即可


--【肆】--:

感谢教程


--【伍】--:

感谢佬的喂饭教程,vertex面板太复杂了


--【陆】--: Nacreon:

iam.managed.disableServiceAccountKeyCreation

我解决了 ==


--【柒】--:

其实还有一个比较简单的方法,是新建一个无组织,就不用折腾IAM了


--【捌】--:

佬 怎么解决的?


--【玖】--:

感谢大佬教程


--【拾】--:

用非预览模型的话,轮询多个区域Location是可以的;
预览模型的话提升不大,因为通常都是用global,在这一个区域里抢。


--【拾壹】--:

呜呜┭┮﹏┭┮太感谢佬了,我之前一段时间搞了GCP后四处找不到教程,你这个写得太好了


--【拾贰】--:

感谢分享!


--【拾叁】--: 大帅哥:

感谢大佬教程

感谢大佬教程。还以为未来的赠金没法用了


--【拾肆】--: Nacreon:

你可能发现了左下角有 获取 API 密钥,不要用它。

完啦佬,就用的这个


--【拾伍】--:

给你自己的账号设置授权


--【拾陆】--:

想请问一下我一个号创建多个项目,使用多个json key来调用vertex能提高并发吗不频繁429吗


--【拾柒】--:

写的很好,前排支持


--【拾捌】--:

感谢教程


--【拾玖】--:

谢谢分享

问题描述:

论坛内关于这方面的教程散落在各处,所以我想给未来的佬友们做一个方便的指引。
本人没怎么写过教程,若有内容遗漏、差错等还请见谅。

[!note]- 这个教程将假设你已经完成注册
账号注册、风控、信用卡和预付费这些东西,变数太多,站内也有这些讨论,所以就不多展开。
这个教程将假设你已经领取到了赠金,并成功进入控制台。
a11202×551 37.7 KB

[!question]- 我的赠金不是 $300?
赠金固定 300 美元,不会给多或给少。
说明你在注册 GCPGoogle Cloud Platform时,地区选择了美国外的地方(或其他原因导致的地区变化)。
比如澳元、港币和新台币,这些货币的符号也会显示为 $,但数字跟随当地货币;
日元 ¥ 同理。

[!info]- 那个额外的 $1000 赠金是什么?
前往导航菜单(侧边栏) - 结算Billing → 赠金Credits
除了 Free Trial,还有一个 $1000 的 Trial credit for GenAI App Builder
据我所知,这个用途非常窄,基本可以当作不存在。

[!question]- 新政策下,赠金不能再抵扣 Gemini?
来源:免费 Google Cloud 功能和试用优惠 | Google Cloud Free Program | Google Cloud Documentation
2026 年 3 月 2 号开始,佬友们常用的 Google AI Studio 不能再使用赠金抵扣了,GCP 内的 Vertex AI 不受影响

谷歌的新政策堵上了免费赠金用户的主要 AI 使用渠道。
在新政策前,佬友们常使用 AI StudioGenerative Language API 来创建密钥。
严格来说,这种方式创建出的密钥,走的是(类似)AI Studio 渠道的付费层级,并不是 Vertex AI 渠道。
新政策收紧了(类似)AI Studio 渠道,除非花真钱,否则从这里创建出来的也是基本上没什么可用的免费层级。

[!danger]- 新号谨慎使用 AI Studio,会被反薅!
2026 年 3 月 2 号后注册的账号受新政策影响,AI Studio 会绕过赠金直接扣真钱!
站内已经有被反薅先例了。

[!note]- 请确认自己使用的工具是否可以直接调用 Vertex AI
快速确认

  1. 你的工具是否有 Vertex AI 提供商,或者 Google 提供商里有 Vertex AI 开关?
    → 有,让我输入服务邮箱、私钥和项目 ID 等字段:可以直接调用 (用服务账号密钥)跟随第 1, 3, 3.1, 4.1 章
    → 有,让我输入 API 密钥:可以直接调用 (用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2 章
    → 要求安装 Google Cloud SDK:可以直接调用 跟随第 1, 4.3 章
    → 上述情况都不符合:继续……

  2. 你的工具是否会自动处理提供商 URL?比如加上 v1beta 后缀。
    不会自动处理:可以直接调用 (用 Google 提供商 + 自定义 URL,用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2, 4.2 章
    → 会自动处理,也没有相关设置:大概率无法直接调用 需要转发/中转

Vertex AI 的优缺点

优点:

  1. GCP 作为 To B面向组织/企业的产品,给模型降智这点很少发生。
  2. 配额限制非常高,没有每日请求次数上限(硬要说的话,有一个 30000 RPM 的请求限制),但请看缺点 2
  3. (NSFW) 本人实测 Vertex AI 渠道在这方面门槛很低,调用时 safetySettings 全设为关,被拦截的概率很小。但别忘了还有大模型内部安全对齐,所以破限多少得带点,但不用那么麻烦。(Nano banana 系列模型是例外,生成的图片仍会有额外审查且会拦截)

缺点:

  1. 赠金只有 300 美元,只有90天,一个账号只有一次。
  2. 除了固定的配额限制,还采用 共享池 + 动态配额,429 错误通常不是配额达到上限,而是你暂时没抢到算力资源,这也导致请求随时都可能 429(使用赠金的用户优先级很低)。整体上,白天(美国黑天)通常会流畅一些。
  3. 不稳定的首 Token 时间,有可能马上响应,也有可能要等个好几分钟(和缺点 2 有很大关系)。
  4. API 调用方式不方便,也不容易分享。

以上缺点基本都能用真钱消费解决,缺点 4 可以采用中转站的方式来分享。

这个教程会带领你使用 Vertex AI。
首先需要启用 API。

1. 启用 Vertex AI API

前往导航菜单(侧边栏) → API 和服务APIs & Services → 库Library
a2896×550 40.7 KB
找到 Vertex AI API,进入后点击启用Enable
a3967×120 9.15 KB
a4643×242 12.1 KB
成功启用后,对应按钮会变成管理Manage

成功启用 API 后,可以进入 Vertex AI Studio 在线使用。
如果需要外部调用,跟随第 3 和 4 章创建服务账号并创建密钥即可。
可以在上面的 请确认自己使用的工具…… 里面确认什么密钥适合自己,是可以用熟悉的一串 API 密钥,还是得用服务账号密钥,还是不能直接调用。

如果工具要求安装 Google Cloud SDK,或者在 Python/NodeJS 里通过官方库调用,那你或许直接使用 Google Cloud SDK 登录个人账号即可,无需服务账号(可直接跳到 4.3.)。

2. 使用 - Vertex AI Studio

前往导航菜单(侧边栏) → Vertex AI → Vertex AI Studio。
你能看到熟悉的对话界面,可以直接在这里体验各种谷歌家的模型,比如对话、生图、视频等。
注意这里也会消耗赠金。

你可能发现了左下角有 获取 API 密钥
那个本质上是 Generative Language API,和 AI Studio 是类似的东西,赠金用户属于免费层级,有严格配额限制,没什么可用的。
(如果你付费花真钱,那么这个会变成付费层级,是可以用的)

3. 创建服务账号

首先确认你的 GCP 是否有组织。

a381355×495 32.5 KB

如果和图中一样,窗口左上角可以切换组织,那么就是有组织的。
GCP 账号注册后可能会自带一个组织 + 项目,也可能只有一个无组织项目。
如果你的 GCP 有组织,我个人推荐创建并使用无组织项目,省事。
如果你仍要使用组织下的项目也是可以的,只是中途会比无组织项目多几个步骤,教程也兼顾了组织下的项目。

创建无组织项目

点击窗口右上角的 新建项目New project
a36799×577 12.2 KB

项目名称和 ID 随意;
结算账号选择 我的结算账号My Billing Account(带新用户赠金的账号);
组织选择 无组织No organization
点击 创建Create 即可。
a37528×545 21.8 KB


前往导航菜单(侧边栏) → IAM 和管理IAM & Admin → 服务账号Service Accounts
a5482×571 28.1 KB

来到如下界面。
点击上面的 创建服务账号Create service account
a6717×364 20.4 KB

服务账号名称和 ID 随意,然后点击 创建并继续Create and continue
a7588×579 22.6 KB

不小心提前点击完成Done

已经能看到新的服务账号了。
找到右侧 操作Actions 下方的三个点,点击 管理权限Manage permissions 继续配置。
a10758×341 12 KB
a11919×571 41.5 KB


然后给予角色,只是拿来调用 AI 的话,Vertex AI User 这个角色的权限已经足够。
a8540×510 19.2 KB
a9495×366 17.6 KB
然后点击 完成Done

[!danger]- 不要向服务账号给予 Owner 角色!
Owner 角色的权限非常高,可接管整个 GCP 项目,包括支付与结算
若密钥泄露,后果严重!
建议只给予需要的角色,让账号只获得需要的权限。

3.1. 获取服务账号密钥

从第 3 章结尾,创建服务账号后继续。

服务账号的密钥不是简单的一串字符,而是以下三个字段联合,缺一不可:

  • 账户邮箱Client Email
  • 私钥Private Key
  • 项目 IDProject ID

找到右侧 操作Actions 下方的三个点,点击 管理密钥Manage keys 继续配置密钥。
a12758×341 12 KB

点击 添加键Add key,再点击 创建新密钥Create new key,类型选择 JSON。
a13434×511 16.3 KB
a14492×309 8.73 KB

[!failure] 密钥创建功能已停用?
这是因为当前项目属于某个组织下,组织政策里默认禁止了密钥创建。
你可以继续在当前项目下去关闭政策,
也可以去创建一个无组织项目,然后回到第 1 章从启用 API 重新开始。

关闭对应政策

a15583×466 25.2 KB
复制这个:iam.managed.disableServiceAccountKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。


密钥创建完毕,会自动下载一个 JSON 密钥文件。
密钥文件只能下载这一次,丢了需要创建新密钥。
妥善保管,同时避免泄露!
a21801×188 4.62 KB

3.2. 获取一串 API 密钥

从第 3 章结尾,创建服务账号后继续。

如果你的项目属于某组织,则需要关闭一个组织政策,防止 API 密钥创建被阻止。
复制这个:iam.managed.disableServiceAccountApiKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。

前往导航菜单(侧边栏) → API 和服务APIs & Services → 凭证Credentials
a39448×419 18.2 KB

点击上面的 创建凭证Create credentials,选择 API 密钥API key
a40587×297 16.7 KB

密钥名称随意;
先点击 通过服务账号对 API 调用进行身份验证Authenticate API calls through a service account
选择有对应角色/权限的服务账号(比如 Vertex AI User 角色),
然后选择使用 Vertex AI API,
最后点击下面的 创建Create
a41586×554 28.7 KB

成功后熟悉的一串密钥就创建了,通常是 AQ. 开头。
请继续跟随第 4.2. 章。

3.3. 关闭组织政策

点击左上角选择项目/组织,确认属于某个组织;点击弹窗右上角的三个点,点击 组织政策Organization policies
a161216×879 63.9 KB

[!failure] 组织政策显示没有权限查看?↓ 跟随 错误 1.1 再继续

错误 1.1

a22796×753 43.5 KB

项目的 IAM 和组织的 IAM 是互相独立的,说明你在组织里缺少必要角色的权限。
直接在顶部居中的搜索框里输入 Organization details 然后进入。
a23700×568 43.2 KB

a241263×459 19.4 KB
可以看到已经提示缺少权限了,点击右侧的 授予访问权限Grant access
等待两三分钟让更改生效

必要的权限都没有,大概率也会遇到 错误 1.2,建议也跟随。


进入如下画面,在过滤输入框里搜索(或粘贴之前让你复制的),可以看到有一个 强制执行状态Enforcement state 为 有效Active 的政策。
a17v21439×872 72.8 KB

点击进入那个政策,然后点击右上角的 管理政策Manage policy
a18582×559 20.9 KB

[!failure] 管理政策Manage policy 按钮是灰色,无法点击?↓ 跟随 错误 1.2 再继续

错误 1.2

项目的 IAM 和组织的 IAM 是互相独立的。
进入 IAM,注意是组织的 IAM
找到主账号(邮箱是你的),点击右侧的铅笔按钮。
a251218×640 45.8 KB

搜索 Organization Policy Administrator 并给予这个角色。
a26517×389 23.6 KB

点击 保存Save等待两三分钟让更改生效


政策来源Policy source 改为 覆盖父资源的政策Override parent’s policy
添加规则Add a rule,实施Enforcement 选择 关闭Off,点击右下角 完成Done,最后点击 设置政策Set policy
a19549×685 23.7 KB
a20532×564 17.9 KB

成功后即可看到 强制执行状态Enforcement state 变成了 未实施Not enforced
等待两三分钟让更改生效


4. 查看可用模型 & 区域的选择

[!info] 无法拉取模型列表是正常现象
即使配置正确,列表里也拉取不了任何模型,这是正常的,Vertex AI API 不提供这个功能。
你需要手动添加模型。

Vertex AI 也是最快获取 Gemini 新模型的渠道之一。
Gemini 新模型上架后,只需查查它的模型 ID,通常都能在 Vertex AI 里使用。

查看可用模型

前往导航菜单(侧边栏) → Vertex AI → 模型库Model Garden
你能看到有各种各样的模型,不仅限于 Gemini 系列。

别想得太美,别家模型(Claude 等)都不能直接用,需要申请(Google 自家的非 Gemini 系列模型也类似);
且不说能不能申请通过,受新政策影响的账号即使申请成功了,调用别家模型也不会使用赠金(激活/升级账号后也一样)。
赠金用户基本就老实用用 Gemini 系列模型吧。

点击一个模型,可以查看详细信息,模型 ID 就在右侧。
这个页面的模型 ID 写得太完全了,通常添加模型时要取最后的 gemini-* 部分。
a421110×617 48.6 KB
(这一长串模型 ID 的前部分指的是用一串 API 密钥调用时的 URL 路径)

区域Location的选择

大部分情况下选择 us-central1 即可。
如果你要使用预览模型(模型 ID 带 -preview 后缀),需要选择 global,否则会报错找不到模型。

4.1. 使用 - Vertex AI API(服务账号密钥)

从第 3.1. 章结尾,下载 JSON 密钥文件后继续。
如果配置界面中要求填写 JSON,那么只需打开密钥文件,把整个内容复制粘贴进去即可。
否则,你需要提取 账号邮箱、私钥和项目 ID 这些字段。

密钥文件的结构大概如下:

{ "type": "service_account", "project_id": "项目 ID", "private_key_id": "*****", "private_key": "-----BEGIN PRIVATE KEY-----\n非常长的私钥\n-----END PRIVATE KEY-----\n", "client_email": "服务账号邮箱", "client_id": "*****", "auth_uri": "https://accounts.google.com/o/oauth2/auth", "token_uri": "https://oauth2.googleapis.com/token", "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs", "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/*****.iam.gserviceaccount.com", "universe_domain": "googleapis.com" }

账号邮箱对应 client_email
私钥对应 private_key,建议完整地复制私钥,包括前后的 -----BEGIN/END PRIVATE KEY-----
项目 ID 对应 project_id

4.2. 使用 - Vertex AI API(一串 API 密钥)

从第 3.2. 章结尾,获取一串 API 密钥后继续。
这章主要针对没有 Vertex AI 提供商的工具,可以用 Google 提供商 + 自定义 URL 做替代方案。

Vertex AI API 不使用原先的 generativelanguage.googleapis.com
需要更改提供商 URL:
https://{区域?}-aiplatform.googleapis.com/v1/publishers/google

比如使用 us-central1 区域就是:
https://us-central1-aiplatform.googleapis.com/v1/publishers/google

如果是 global 区域,开头的 {区域}- 不用加:
https://aiplatform.googleapis.com/v1/publishers/google

URL 后面不要加上 v1beta,加上会 404!建议检查工具是否会自动处理 URL。

4.3. 使用 - Vertex AI API(Google Cloud SDK - 登录谷歌账号)

首先安装完 Google Cloud SDK 后,
打开控制台,执行 gcloud init
成功后会询问 You must sign in to continue. Would you like to sign in (Y/n)?,输入 Y,会弹出浏览器,登录你的 GCP 谷歌账号。

登录成功后,控制台会显示如下文字:

You are signed in as: [example@example.com]. Pick cloud project to use: [1] 项目 ID [2] 更多项目 ID... [n] Enter a project ID [n] Create a new project Please enter numeric choice or text value (must exactly match list item):

选择一个项目,输入左侧的序号。

成功后会显示这行文字:Your current project has been set to: [项目 ID].

接下来给程序创建默认凭据ADC
执行 gcloud auth application-default login,会再弹出浏览器,再登录一次你的 GCP 谷歌账号。

登录成功会显示这行文字:Credentials saved to file: [your\path\gcloud\application_default_credentials.json].

完成,之后通过官方 GenAI 库还是通过 SDK 调用时,都会找到默认凭据。

常用命令

查看账号(保存的所有账号、当前激活的账号):gcloud auth list
查看配置(当前账号和项目):gcloud config list

登录账号:gcloud auth login
切换当前激活账号:gcloud config set account 账号邮箱

设置当前项目:gcloud config set project 项目ID

登出指定账号:gcloud auth revoke 账号邮箱
登出所有账号:gcloud auth revoke --all

[!warning]- 不想被反薅就不要点 激活/升级
如果你只想使用赠金,用完即停,就不要点击页面右上角或其他任何和账号有关的 激活Activate 或 升级Upgrade 按钮。

其他 1. 查看赠金剩余

前往导航菜单(侧边栏) - 结算Billing
有新用户赠金的结算账号通常叫 我的结算账号My Billing Account
在左上角可以切换查看,查看有新用户赠金的结算账号时右下角会直接显示剩余金额和时间。
从使用到计费会有 2~5 小时的延迟。
a271252×997 73.4 KB

还有通用的方法,对所有结算账号都可用。
点击左侧的 赠金Credits,就会显示当前的赠金。
a281270×631 30.5 KB

其他 2. 切换项目的结算账号

GCP 偶尔会有 5 美元的赠金羊毛(佬友们也会分享),领取后会新建一个结算账号。
左上角打开选择结算账号的窗口,点击 管理结算账号Manage billing accounts
a29407×277 11.6 KB

点击 您的项目Your projects,若找不到项目就检查上面的组织选择是否正确。
然后点击项目右侧 操作Actions 下方的三个点,点击 更改结算信息Change billing
a30834×401 14.1 KB

选择其他结算账号后点击 设置账号Set account 即可。
a31561×291 16 KB

其他 3.1. 查看本月的 Token 消耗量(桌面端 - 快速方便)

前往导航菜单(侧边栏) - Vertex AI → 信息中心Dashboard
进入后下滑页面,即可看到各模型的 Token 消耗和费用。
gemini-3.1-pro-preview 的消耗也算在 3 Pro 里)
a321018×404 32.6 KB

移动端大概率不显示这个信息,不知什么原因(可能是视口宽度不够?)。
如果没有桌面端又想看,或者想看模型调用次数,可以跟随 其他 3.2. 的通用方法。

其他 3.2. 查看 Token 消耗量和模型调用次数(通用)

前往导航菜单(侧边栏) - Monitoring → Metrics Explorer。
右上角选择想查询的时间范围,右侧的 Widget 类型Widget type 选择 Table,点击右上角偏下的 PromQL。
a331017×463 21.2 KB

点击 PromQL 后,左侧变成了命令输入框。
复制粘贴下面的查询命令后点击右上角的 执行查询Run Query 或打开 自动运行Auto-Run
一个输入框只放一条命令。

查询各模型的输入/输出 Token 消耗量

sum by ("model_user_id","type")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/token_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))

结果示例

a34691×574 35.1 KB

查询各模型的调用次数

sum by ("model_user_id")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/model_invocation_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))

结果示例

a35691×341 16.3 KB

其他 4.1. 请求体 safetySetting - 内容过滤设置

请求时,在请求体Request body一同传入,不传的话 threshold 默认都是 OFF

KeysafetySetting
Value为一个对象数组,每个对象通常都由 categorythreshold 组成。

[ { "category": "过滤类型", "threshold": "触发阈值" } ]

过滤类型

以下四个类型在所有 Gemini 渠道都可用:
HARM_CATEGORY_HATE_SPEECH:仇恨内容
HARM_CATEGORY_DANGEROUS_CONTENT:(暴力等)危险内容
HARM_CATEGORY_HARASSMENT:(辱骂、欺凌等)侮辱内容
HARM_CATEGORY_SEXUALLY_EXPLICIT:NSFW 内容

以下五个类型仅在 Vertex AI 渠道可用,其他渠道不支持:
HARM_CATEGORY_JAILBREAK:大模型破限/越狱内容
HARM_CATEGORY_IMAGE_HATE:包含仇恨内容的图片
HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT:包含危险内容的图片
HARM_CATEGORY_IMAGE_HARASSMENT:包含侮辱内容的图片
HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT:包含 NSFW 内容的图片
(以上四个图片相关设置似乎并不作用于 Nano Banana 生图,图片照样会拦截)

触发阈值

BLOCK_LOW_AND_ABOVE:可能性低也触发
BLOCK_MEDIUM_AND_ABOVE:可能性中等也触发
BLOCK_ONLY_HIGH:仅在可能性高时触发
BLOCK_NONE:(尽可能)不触发
OFF:关闭

BLOCK_NONEOFF 不代表 100% 不触发,只是把触发概率降到最低了(即使这样也比 AI Studio 的触发概率低很多)。
BLOCK_NONE 仍会在返回中带上安全评级,OFF 不会。
另外别忘了还有大模型的内部安全对齐。

详细内容可查看 官方文档 。

值的完全体:

[ { "category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "OFF" }, { "category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_HARASSMENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_JAILBREAK", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_HATE", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_HARASSMENT", "threshold": "OFF" }, { "category": "HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT", "threshold": "OFF" } ]

其他 4.2. 请求头 ...Request-Type - 随用随付PayGo类型

请求时,在请求头Request header一同传入,不传的话将使用 标准Standard 类型。

有三种随用随付类型,分别是 灵活Flex、标准Standard 和 优先Priority

灵活 类型用更慢的响应换更低的费用倍率,优先 类型用更高的费用倍率换更快的响应。

KeyX-Vertex-AI-LLM-Shared-Request-Type
Value请看表格:

类型 响应速度 费用倍率
灵活 flex 更慢 0.5x
标准 - 正常 1x
优先 priority 更快 1.8x

详细内容可查看官方文档:灵活、标准、优先 和 费用表

网友解答:
--【壹】--:

image1920×1090 229 KB
为什么这边没办法管理政策?


--【贰】--:

vertex的预览版Gemini疯狂429啊…


--【叁】--:

感谢, 是在
image784×154 6.38 KB
这里面增加缺失的权限即可


--【肆】--:

感谢教程


--【伍】--:

感谢佬的喂饭教程,vertex面板太复杂了


--【陆】--: Nacreon:

iam.managed.disableServiceAccountKeyCreation

我解决了 ==


--【柒】--:

其实还有一个比较简单的方法,是新建一个无组织,就不用折腾IAM了


--【捌】--:

佬 怎么解决的?


--【玖】--:

感谢大佬教程


--【拾】--:

用非预览模型的话,轮询多个区域Location是可以的;
预览模型的话提升不大,因为通常都是用global,在这一个区域里抢。


--【拾壹】--:

呜呜┭┮﹏┭┮太感谢佬了,我之前一段时间搞了GCP后四处找不到教程,你这个写得太好了


--【拾贰】--:

感谢分享!


--【拾叁】--: 大帅哥:

感谢大佬教程

感谢大佬教程。还以为未来的赠金没法用了


--【拾肆】--: Nacreon:

你可能发现了左下角有 获取 API 密钥,不要用它。

完啦佬,就用的这个


--【拾伍】--:

给你自己的账号设置授权


--【拾陆】--:

想请问一下我一个号创建多个项目,使用多个json key来调用vertex能提高并发吗不频繁429吗


--【拾柒】--:

写的很好,前排支持


--【拾捌】--:

感谢教程


--【拾玖】--:

谢谢分享