如何使用 Google Cloud Platform 里的 Gemini (Vertex AI)
- 内容介绍
- 文章标签
- 相关推荐
论坛内关于这方面的教程散落在各处,所以我想给未来的佬友们做一个方便的指引。
本人没怎么写过教程,若有内容遗漏、差错等还请见谅。
[!note]- 这个教程将假设你已经完成注册
账号注册、风控、信用卡和预付费这些东西,变数太多,站内也有这些讨论,所以就不多展开。
这个教程将假设你已经领取到了赠金,并成功进入控制台。
a11202×551 37.7 KB
[!question]- 我的赠金不是 $300?
赠金固定 300 美元,不会给多或给少。
说明你在注册 GCPGoogle Cloud Platform时,地区选择了美国外的地方(或其他原因导致的地区变化)。
比如澳元、港币和新台币,这些货币的符号也会显示为$,但数字跟随当地货币;
日元¥同理。
[!info]- 那个额外的 $1000 赠金是什么?
前往导航菜单(侧边栏) - 结算Billing → 赠金Credits。
除了Free Trial,还有一个 $1000 的Trial credit for GenAI App Builder。
据我所知,这个用途非常窄,基本可以当作不存在。
[!question]- 新政策下,赠金不能再抵扣 Gemini?
来源:免费 Google Cloud 功能和试用优惠 | Google Cloud Free Program | Google Cloud Documentation
2026 年 3 月 2 号开始,佬友们常用的 Google AI Studio 不能再使用赠金抵扣了,GCP 内的 Vertex AI 不受影响。谷歌的新政策堵上了免费赠金用户的主要 AI 使用渠道。
在新政策前,佬友们常使用AI Studio或Generative Language API来创建密钥。
但严格来说,这种方式创建出的密钥,走的是(类似)AI Studio 渠道的付费层级,并不是 Vertex AI 渠道。
新政策收紧了(类似)AI Studio 渠道,除非花真钱,否则从这里创建出来的也是基本上没什么可用的免费层级。
[!danger]- 新号谨慎使用 AI Studio,会被反薅!
2026 年 3 月 2 号后注册的账号受新政策影响,AI Studio 会绕过赠金直接扣真钱!
站内已经有被反薅先例了。
[!note]- 请确认自己使用的工具是否可以直接调用 Vertex AI
快速确认:
你的工具是否有 Vertex AI 提供商,或者 Google 提供商里有 Vertex AI 开关?
→ 有,让我输入服务邮箱、私钥和项目 ID 等字段:可以直接调用 (用服务账号密钥)跟随第 1, 3, 3.1, 4.1 章
→ 有,让我输入 API 密钥:可以直接调用 (用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2 章
→ 要求安装 Google Cloud SDK:可以直接调用 跟随第 1, 4.3 章
→ 上述情况都不符合:继续……你的工具是否会自动处理提供商 URL?比如加上
v1beta后缀。
→ 不会自动处理:可以直接调用 (用 Google 提供商 + 自定义 URL,用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2, 4.2 章
→ 会自动处理,也没有相关设置:大概率无法直接调用 需要转发/中转
Vertex AI 的优缺点
优点:
- GCP 作为 To B面向组织/企业的产品,给模型降智这点很少发生。
- 配额限制非常高,没有每日请求次数上限(硬要说的话,有一个 30000 RPM 的请求限制),但请看缺点 2。
- (NSFW) 本人实测 Vertex AI 渠道在这方面门槛很低,调用时
safetySettings全设为关,被拦截的概率很小。但别忘了还有大模型内部安全对齐,所以破限多少得带点,但不用那么麻烦。(Nano banana 系列模型是例外,生成的图片仍会有额外审查且会拦截)
缺点:
- 赠金只有 300 美元,只有90天,一个账号只有一次。
- 除了固定的配额限制,还采用 共享池 + 动态配额,429 错误通常不是配额达到上限,而是你暂时没抢到算力资源,这也导致请求随时都可能 429(使用赠金的用户优先级很低)。整体上,白天(美国黑天)通常会流畅一些。
- 不稳定的首 Token 时间,有可能马上响应,也有可能要等个好几分钟(和缺点 2 有很大关系)。
- API 调用方式不方便,也不容易分享。
以上缺点基本都能用真钱消费解决,缺点 4 可以采用中转站的方式来分享。
这个教程会带领你使用 Vertex AI。
首先需要启用 API。
1. 启用 Vertex AI API
前往导航菜单(侧边栏) → API 和服务APIs & Services → 库Library
a2896×550 40.7 KB
找到 Vertex AI API,进入后点击启用Enable。
a3967×120 9.15 KB
a4643×242 12.1 KB
成功启用后,对应按钮会变成管理Manage。
成功启用 API 后,可以进入 Vertex AI Studio 在线使用。
如果需要外部调用,跟随第 3 和 4 章创建服务账号并创建密钥即可。
可以在上面的 请确认自己使用的工具…… 里面确认什么密钥适合自己,是可以用熟悉的一串 API 密钥,还是得用服务账号密钥,还是不能直接调用。
如果工具要求安装 Google Cloud SDK,或者在 Python/NodeJS 里通过官方库调用,那你或许直接使用 Google Cloud SDK 登录个人账号即可,无需服务账号(可直接跳到 4.3.)。
2. 使用 - Vertex AI Studio
前往导航菜单(侧边栏) → Vertex AI → Vertex AI Studio。
你能看到熟悉的对话界面,可以直接在这里体验各种谷歌家的模型,比如对话、生图、视频等。
注意这里也会消耗赠金。
你可能发现了左下角有 获取 API 密钥。
那个本质上是 Generative Language API,和 AI Studio 是类似的东西,赠金用户属于免费层级,有严格配额限制,没什么可用的。
(如果你付费花真钱,那么这个会变成付费层级,是可以用的)
3. 创建服务账号
首先确认你的 GCP 是否有组织。
a381355×495 32.5 KB
如果和图中一样,窗口左上角可以切换组织,那么就是有组织的。
GCP 账号注册后可能会自带一个组织 + 项目,也可能只有一个无组织项目。
如果你的 GCP 有组织,我个人推荐创建并使用无组织项目,省事。
如果你仍要使用组织下的项目也是可以的,只是中途会比无组织项目多几个步骤,教程也兼顾了组织下的项目。
创建无组织项目
点击窗口右上角的 新建项目New project。
a36799×577 12.2 KB
项目名称和 ID 随意;
结算账号选择 我的结算账号My Billing Account(带新用户赠金的账号);
组织选择 无组织No organization。
点击 创建Create 即可。
a37528×545 21.8 KB
前往导航菜单(侧边栏) → IAM 和管理IAM & Admin → 服务账号Service Accounts
a5482×571 28.1 KB
来到如下界面。
点击上面的 创建服务账号Create service account。
a6717×364 20.4 KB
服务账号名称和 ID 随意,然后点击 创建并继续Create and continue。
a7588×579 22.6 KB
不小心提前点击完成Done了
已经能看到新的服务账号了。
找到右侧 操作Actions 下方的三个点,点击 管理权限Manage permissions 继续配置。
a10758×341 12 KB
a11919×571 41.5 KB
然后给予角色,只是拿来调用 AI 的话,Vertex AI User 这个角色的权限已经足够。
a8540×510 19.2 KB
a9495×366 17.6 KB
然后点击 完成Done。
[!danger]- 不要向服务账号给予 Owner 角色!
Owner 角色的权限非常高,可接管整个 GCP 项目,包括支付与结算。
若密钥泄露,后果严重!
建议只给予需要的角色,让账号只获得需要的权限。
3.1. 获取服务账号密钥
从第 3 章结尾,创建服务账号后继续。
服务账号的密钥不是简单的一串字符,而是以下三个字段联合,缺一不可:
- 账户邮箱Client Email
- 私钥Private Key
- 项目 IDProject ID
找到右侧 操作Actions 下方的三个点,点击 管理密钥Manage keys 继续配置密钥。
a12758×341 12 KB
点击 添加键Add key,再点击 创建新密钥Create new key,类型选择 JSON。
a13434×511 16.3 KB
a14492×309 8.73 KB
[!failure] 密钥创建功能已停用?
这是因为当前项目属于某个组织下,组织政策里默认禁止了密钥创建。
你可以继续在当前项目下去关闭政策,
也可以去创建一个无组织项目,然后回到第 1 章从启用 API 重新开始。
关闭对应政策
a15583×466 25.2 KB
复制这个:iam.managed.disableServiceAccountKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。
密钥创建完毕,会自动下载一个 JSON 密钥文件。
密钥文件只能下载这一次,丢了需要创建新密钥。
妥善保管,同时避免泄露!
a21801×188 4.62 KB
3.2. 获取一串 API 密钥
从第 3 章结尾,创建服务账号后继续。
如果你的项目属于某组织,则需要关闭一个组织政策,防止 API 密钥创建被阻止。
复制这个:iam.managed.disableServiceAccountApiKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。
前往导航菜单(侧边栏) → API 和服务APIs & Services → 凭证Credentials。
a39448×419 18.2 KB
点击上面的 创建凭证Create credentials,选择 API 密钥API key
a40587×297 16.7 KB
密钥名称随意;
先点击 通过服务账号对 API 调用进行身份验证Authenticate API calls through a service account,
选择有对应角色/权限的服务账号(比如 Vertex AI User 角色),
然后选择使用 Vertex AI API,
最后点击下面的 创建Create。
a41586×554 28.7 KB
成功后熟悉的一串密钥就创建了,通常是 AQ. 开头。
请继续跟随第 4.2. 章。
3.3. 关闭组织政策
点击左上角选择项目/组织,确认属于某个组织;点击弹窗右上角的三个点,点击 组织政策Organization policies
a161216×879 63.9 KB
[!failure] 组织政策显示没有权限查看?↓ 跟随 错误 1.1 再继续
错误 1.1
a22796×753 43.5 KB
项目的 IAM 和组织的 IAM 是互相独立的,说明你在组织里缺少必要角色的权限。
直接在顶部居中的搜索框里输入 Organization details 然后进入。
a23700×568 43.2 KB
a241263×459 19.4 KB
可以看到已经提示缺少权限了,点击右侧的 授予访问权限Grant access。
等待两三分钟让更改生效。
必要的权限都没有,大概率也会遇到 错误 1.2,建议也跟随。
进入如下画面,在过滤输入框里搜索(或粘贴之前让你复制的),可以看到有一个 强制执行状态Enforcement state 为 有效Active 的政策。
a17v21439×872 72.8 KB
点击进入那个政策,然后点击右上角的 管理政策Manage policy。
a18582×559 20.9 KB
[!failure] 管理政策Manage policy 按钮是灰色,无法点击?↓ 跟随 错误 1.2 再继续
错误 1.2
项目的 IAM 和组织的 IAM 是互相独立的。
进入 IAM,注意是组织的 IAM。
找到主账号(邮箱是你的),点击右侧的铅笔按钮。
a251218×640 45.8 KB
搜索 Organization Policy Administrator 并给予这个角色。
a26517×389 23.6 KB
点击 保存Save,等待两三分钟让更改生效。
政策来源Policy source 改为 覆盖父资源的政策Override parent’s policy。
添加规则Add a rule,实施Enforcement 选择 关闭Off,点击右下角 完成Done,最后点击 设置政策Set policy。
a19549×685 23.7 KB
a20532×564 17.9 KB
成功后即可看到 强制执行状态Enforcement state 变成了 未实施Not enforced。
等待两三分钟让更改生效。
4. 查看可用模型 & 区域的选择
[!info] 无法拉取模型列表是正常现象
即使配置正确,列表里也拉取不了任何模型,这是正常的,Vertex AI API 不提供这个功能。
你需要手动添加模型。
Vertex AI 也是最快获取 Gemini 新模型的渠道之一。
Gemini 新模型上架后,只需查查它的模型 ID,通常都能在 Vertex AI 里使用。
查看可用模型
前往导航菜单(侧边栏) → Vertex AI → 模型库Model Garden
你能看到有各种各样的模型,不仅限于 Gemini 系列。
别想得太美,别家模型(Claude 等)都不能直接用,需要申请(Google 自家的非 Gemini 系列模型也类似);
且不说能不能申请通过,受新政策影响的账号即使申请成功了,调用别家模型也不会使用赠金(激活/升级账号后也一样)。
赠金用户基本就老实用用 Gemini 系列模型吧。
点击一个模型,可以查看详细信息,模型 ID 就在右侧。
这个页面的模型 ID 写得太完全了,通常添加模型时要取最后的 gemini-* 部分。
a421110×617 48.6 KB
(这一长串模型 ID 的前部分指的是用一串 API 密钥调用时的 URL 路径)
区域Location的选择
大部分情况下选择 us-central1 即可。
如果你要使用预览模型(模型 ID 带 -preview 后缀),需要选择 global,否则会报错找不到模型。
4.1. 使用 - Vertex AI API(服务账号密钥)
从第 3.1. 章结尾,下载 JSON 密钥文件后继续。
如果配置界面中要求填写 JSON,那么只需打开密钥文件,把整个内容复制粘贴进去即可。
否则,你需要提取 账号邮箱、私钥和项目 ID 这些字段。
密钥文件的结构大概如下:
{
"type": "service_account",
"project_id": "项目 ID",
"private_key_id": "*****",
"private_key": "-----BEGIN PRIVATE KEY-----\n非常长的私钥\n-----END PRIVATE KEY-----\n",
"client_email": "服务账号邮箱",
"client_id": "*****",
"auth_uri": "https://accounts.google.com/o/oauth2/auth",
"token_uri": "https://oauth2.googleapis.com/token",
"auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
"client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/*****.iam.gserviceaccount.com",
"universe_domain": "googleapis.com"
}
账号邮箱对应 client_email;
私钥对应 private_key,建议完整地复制私钥,包括前后的 -----BEGIN/END PRIVATE KEY-----;
项目 ID 对应 project_id;
4.2. 使用 - Vertex AI API(一串 API 密钥)
从第 3.2. 章结尾,获取一串 API 密钥后继续。
这章主要针对没有 Vertex AI 提供商的工具,可以用 Google 提供商 + 自定义 URL 做替代方案。
Vertex AI API 不使用原先的 generativelanguage.googleapis.com,
需要更改提供商 URL:
→ https://{区域?}-aiplatform.googleapis.com/v1/publishers/google
比如使用 us-central1 区域就是:
→ https://us-central1-aiplatform.googleapis.com/v1/publishers/google
如果是 global 区域,开头的 {区域}- 不用加:
→ https://aiplatform.googleapis.com/v1/publishers/google
URL 后面不要加上 v1beta,加上会 404!建议检查工具是否会自动处理 URL。
4.3. 使用 - Vertex AI API(Google Cloud SDK - 登录谷歌账号)
首先安装完 Google Cloud SDK 后,
打开控制台,执行 gcloud init,
成功后会询问 You must sign in to continue. Would you like to sign in (Y/n)?,输入 Y,会弹出浏览器,登录你的 GCP 谷歌账号。
登录成功后,控制台会显示如下文字:
You are signed in as: [example@example.com].
Pick cloud project to use:
[1] 项目 ID
[2] 更多项目 ID...
[n] Enter a project ID
[n] Create a new project
Please enter numeric choice or text value (must exactly match list item):
选择一个项目,输入左侧的序号。
成功后会显示这行文字:Your current project has been set to: [项目 ID].
接下来给程序创建默认凭据ADC。
执行 gcloud auth application-default login,会再弹出浏览器,再登录一次你的 GCP 谷歌账号。
登录成功会显示这行文字:Credentials saved to file: [your\path\gcloud\application_default_credentials.json].
完成,之后通过官方 GenAI 库还是通过 SDK 调用时,都会找到默认凭据。
常用命令
查看账号(保存的所有账号、当前激活的账号):gcloud auth list
查看配置(当前账号和项目):gcloud config list
登录账号:gcloud auth login
切换当前激活账号:gcloud config set account 账号邮箱
设置当前项目:gcloud config set project 项目ID
登出指定账号:gcloud auth revoke 账号邮箱
登出所有账号:gcloud auth revoke --all
[!warning]- 不想被反薅就不要点 激活/升级
如果你只想使用赠金,用完即停,就不要点击页面右上角或其他任何和账号有关的 激活Activate 或 升级Upgrade 按钮。
其他 1. 查看赠金剩余
前往导航菜单(侧边栏) - 结算Billing。
有新用户赠金的结算账号通常叫 我的结算账号My Billing Account。
在左上角可以切换查看,查看有新用户赠金的结算账号时右下角会直接显示剩余金额和时间。
从使用到计费会有 2~5 小时的延迟。
a271252×997 73.4 KB
还有通用的方法,对所有结算账号都可用。
点击左侧的 赠金Credits,就会显示当前的赠金。
a281270×631 30.5 KB
其他 2. 切换项目的结算账号
GCP 偶尔会有 5 美元的赠金羊毛(佬友们也会分享),领取后会新建一个结算账号。
左上角打开选择结算账号的窗口,点击 管理结算账号Manage billing accounts。
a29407×277 11.6 KB
点击 您的项目Your projects,若找不到项目就检查上面的组织选择是否正确。
然后点击项目右侧 操作Actions 下方的三个点,点击 更改结算信息Change billing。
a30834×401 14.1 KB
选择其他结算账号后点击 设置账号Set account 即可。
a31561×291 16 KB
其他 3.1. 查看本月的 Token 消耗量(桌面端 - 快速方便)
前往导航菜单(侧边栏) - Vertex AI → 信息中心Dashboard。
进入后下滑页面,即可看到各模型的 Token 消耗和费用。
(gemini-3.1-pro-preview 的消耗也算在 3 Pro 里)
a321018×404 32.6 KB
移动端大概率不显示这个信息,不知什么原因(可能是视口宽度不够?)。
如果没有桌面端又想看,或者想看模型调用次数,可以跟随 其他 3.2. 的通用方法。
其他 3.2. 查看 Token 消耗量和模型调用次数(通用)
前往导航菜单(侧边栏) - Monitoring → Metrics Explorer。
右上角选择想查询的时间范围,右侧的 Widget 类型Widget type 选择 Table,点击右上角偏下的 PromQL。
a331017×463 21.2 KB
点击 PromQL 后,左侧变成了命令输入框。
复制粘贴下面的查询命令后点击右上角的 执行查询Run Query 或打开 自动运行Auto-Run。
一个输入框只放一条命令。
查询各模型的输入/输出 Token 消耗量
sum by ("model_user_id","type")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/token_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))
结果示例
a34691×574 35.1 KB
查询各模型的调用次数
sum by ("model_user_id")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/model_invocation_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))
结果示例
a35691×341 16.3 KB
其他 4.1. 请求体 safetySetting - 内容过滤设置
请求时,在请求体Request body一同传入,不传的话 threshold 默认都是 OFF。
键Key为 safetySetting;
值Value为一个对象数组,每个对象通常都由 category 和 threshold 组成。
[
{
"category": "过滤类型",
"threshold": "触发阈值"
}
]
过滤类型
以下四个类型在所有 Gemini 渠道都可用:
HARM_CATEGORY_HATE_SPEECH:仇恨内容
HARM_CATEGORY_DANGEROUS_CONTENT:(暴力等)危险内容
HARM_CATEGORY_HARASSMENT:(辱骂、欺凌等)侮辱内容
HARM_CATEGORY_SEXUALLY_EXPLICIT:NSFW 内容
以下五个类型仅在 Vertex AI 渠道可用,其他渠道不支持:
HARM_CATEGORY_JAILBREAK:大模型破限/越狱内容
HARM_CATEGORY_IMAGE_HATE:包含仇恨内容的图片
HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT:包含危险内容的图片
HARM_CATEGORY_IMAGE_HARASSMENT:包含侮辱内容的图片
HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT:包含 NSFW 内容的图片
(以上四个图片相关设置似乎并不作用于 Nano Banana 生图,图片照样会拦截)
触发阈值
BLOCK_LOW_AND_ABOVE:可能性低也触发
BLOCK_MEDIUM_AND_ABOVE:可能性中等也触发
BLOCK_ONLY_HIGH:仅在可能性高时触发
BLOCK_NONE:(尽可能)不触发
OFF:关闭
BLOCK_NONE 和 OFF 不代表 100% 不触发,只是把触发概率降到最低了(即使这样也比 AI Studio 的触发概率低很多)。
BLOCK_NONE 仍会在返回中带上安全评级,OFF 不会。
另外别忘了还有大模型的内部安全对齐。
详细内容可查看 官方文档 。
值的完全体:
[
{
"category": "HARM_CATEGORY_HATE_SPEECH",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_HARASSMENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_JAILBREAK",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_HATE",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_HARASSMENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT",
"threshold": "OFF"
}
]
其他 4.2. 请求头 ...Request-Type - 随用随付PayGo类型
请求时,在请求头Request header一同传入,不传的话将使用 标准Standard 类型。
有三种随用随付类型,分别是 灵活Flex、标准Standard 和 优先Priority。
灵活 类型用更慢的响应换更低的费用倍率,优先 类型用更高的费用倍率换更快的响应。
键Key为 X-Vertex-AI-LLM-Shared-Request-Type;
值Value请看表格:
| 类型 | 值 | 响应速度 | 费用倍率 |
|---|---|---|---|
| 灵活 | flex | 更慢 | 0.5x |
| 标准 | - | 正常 | 1x |
| 优先 | priority | 更快 | 1.8x |
详细内容可查看官方文档:灵活、标准、优先 和 费用表
--【壹】--:
image1920×1090 229 KB
为什么这边没办法管理政策?
--【贰】--:
vertex的预览版Gemini疯狂429啊…
--【叁】--:
感谢, 是在
image784×154 6.38 KB
这里面增加缺失的权限即可
--【肆】--:
感谢教程
--【伍】--:
感谢佬的喂饭教程,vertex面板太复杂了
--【陆】--: Nacreon:
iam.managed.disableServiceAccountKeyCreation
我解决了 ==
--【柒】--:
其实还有一个比较简单的方法,是新建一个无组织,就不用折腾IAM了
--【捌】--:
佬 怎么解决的?
--【玖】--:
感谢大佬教程
--【拾】--:
用非预览模型的话,轮询多个区域Location是可以的;
预览模型的话提升不大,因为通常都是用global,在这一个区域里抢。
--【拾壹】--:
呜呜┭┮﹏┭┮太感谢佬了,我之前一段时间搞了GCP后四处找不到教程,你这个写得太好了
--【拾贰】--:
感谢分享!
--【拾叁】--: 大帅哥:
感谢大佬教程
感谢大佬教程。还以为未来的赠金没法用了
--【拾肆】--: Nacreon:
你可能发现了左下角有
获取 API 密钥,不要用它。
完啦佬,就用的这个
--【拾伍】--:
给你自己的账号设置授权
--【拾陆】--:
想请问一下我一个号创建多个项目,使用多个json key来调用vertex能提高并发吗不频繁429吗
--【拾柒】--:
写的很好,前排支持
--【拾捌】--:
感谢教程
--【拾玖】--:
谢谢分享
论坛内关于这方面的教程散落在各处,所以我想给未来的佬友们做一个方便的指引。
本人没怎么写过教程,若有内容遗漏、差错等还请见谅。
[!note]- 这个教程将假设你已经完成注册
账号注册、风控、信用卡和预付费这些东西,变数太多,站内也有这些讨论,所以就不多展开。
这个教程将假设你已经领取到了赠金,并成功进入控制台。
a11202×551 37.7 KB
[!question]- 我的赠金不是 $300?
赠金固定 300 美元,不会给多或给少。
说明你在注册 GCPGoogle Cloud Platform时,地区选择了美国外的地方(或其他原因导致的地区变化)。
比如澳元、港币和新台币,这些货币的符号也会显示为$,但数字跟随当地货币;
日元¥同理。
[!info]- 那个额外的 $1000 赠金是什么?
前往导航菜单(侧边栏) - 结算Billing → 赠金Credits。
除了Free Trial,还有一个 $1000 的Trial credit for GenAI App Builder。
据我所知,这个用途非常窄,基本可以当作不存在。
[!question]- 新政策下,赠金不能再抵扣 Gemini?
来源:免费 Google Cloud 功能和试用优惠 | Google Cloud Free Program | Google Cloud Documentation
2026 年 3 月 2 号开始,佬友们常用的 Google AI Studio 不能再使用赠金抵扣了,GCP 内的 Vertex AI 不受影响。谷歌的新政策堵上了免费赠金用户的主要 AI 使用渠道。
在新政策前,佬友们常使用AI Studio或Generative Language API来创建密钥。
但严格来说,这种方式创建出的密钥,走的是(类似)AI Studio 渠道的付费层级,并不是 Vertex AI 渠道。
新政策收紧了(类似)AI Studio 渠道,除非花真钱,否则从这里创建出来的也是基本上没什么可用的免费层级。
[!danger]- 新号谨慎使用 AI Studio,会被反薅!
2026 年 3 月 2 号后注册的账号受新政策影响,AI Studio 会绕过赠金直接扣真钱!
站内已经有被反薅先例了。
[!note]- 请确认自己使用的工具是否可以直接调用 Vertex AI
快速确认:
你的工具是否有 Vertex AI 提供商,或者 Google 提供商里有 Vertex AI 开关?
→ 有,让我输入服务邮箱、私钥和项目 ID 等字段:可以直接调用 (用服务账号密钥)跟随第 1, 3, 3.1, 4.1 章
→ 有,让我输入 API 密钥:可以直接调用 (用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2 章
→ 要求安装 Google Cloud SDK:可以直接调用 跟随第 1, 4.3 章
→ 上述情况都不符合:继续……你的工具是否会自动处理提供商 URL?比如加上
v1beta后缀。
→ 不会自动处理:可以直接调用 (用 Google 提供商 + 自定义 URL,用服务账号创建一串 API 密钥)跟随第 1, 3, 3.2, 4.2 章
→ 会自动处理,也没有相关设置:大概率无法直接调用 需要转发/中转
Vertex AI 的优缺点
优点:
- GCP 作为 To B面向组织/企业的产品,给模型降智这点很少发生。
- 配额限制非常高,没有每日请求次数上限(硬要说的话,有一个 30000 RPM 的请求限制),但请看缺点 2。
- (NSFW) 本人实测 Vertex AI 渠道在这方面门槛很低,调用时
safetySettings全设为关,被拦截的概率很小。但别忘了还有大模型内部安全对齐,所以破限多少得带点,但不用那么麻烦。(Nano banana 系列模型是例外,生成的图片仍会有额外审查且会拦截)
缺点:
- 赠金只有 300 美元,只有90天,一个账号只有一次。
- 除了固定的配额限制,还采用 共享池 + 动态配额,429 错误通常不是配额达到上限,而是你暂时没抢到算力资源,这也导致请求随时都可能 429(使用赠金的用户优先级很低)。整体上,白天(美国黑天)通常会流畅一些。
- 不稳定的首 Token 时间,有可能马上响应,也有可能要等个好几分钟(和缺点 2 有很大关系)。
- API 调用方式不方便,也不容易分享。
以上缺点基本都能用真钱消费解决,缺点 4 可以采用中转站的方式来分享。
这个教程会带领你使用 Vertex AI。
首先需要启用 API。
1. 启用 Vertex AI API
前往导航菜单(侧边栏) → API 和服务APIs & Services → 库Library
a2896×550 40.7 KB
找到 Vertex AI API,进入后点击启用Enable。
a3967×120 9.15 KB
a4643×242 12.1 KB
成功启用后,对应按钮会变成管理Manage。
成功启用 API 后,可以进入 Vertex AI Studio 在线使用。
如果需要外部调用,跟随第 3 和 4 章创建服务账号并创建密钥即可。
可以在上面的 请确认自己使用的工具…… 里面确认什么密钥适合自己,是可以用熟悉的一串 API 密钥,还是得用服务账号密钥,还是不能直接调用。
如果工具要求安装 Google Cloud SDK,或者在 Python/NodeJS 里通过官方库调用,那你或许直接使用 Google Cloud SDK 登录个人账号即可,无需服务账号(可直接跳到 4.3.)。
2. 使用 - Vertex AI Studio
前往导航菜单(侧边栏) → Vertex AI → Vertex AI Studio。
你能看到熟悉的对话界面,可以直接在这里体验各种谷歌家的模型,比如对话、生图、视频等。
注意这里也会消耗赠金。
你可能发现了左下角有 获取 API 密钥。
那个本质上是 Generative Language API,和 AI Studio 是类似的东西,赠金用户属于免费层级,有严格配额限制,没什么可用的。
(如果你付费花真钱,那么这个会变成付费层级,是可以用的)
3. 创建服务账号
首先确认你的 GCP 是否有组织。
a381355×495 32.5 KB
如果和图中一样,窗口左上角可以切换组织,那么就是有组织的。
GCP 账号注册后可能会自带一个组织 + 项目,也可能只有一个无组织项目。
如果你的 GCP 有组织,我个人推荐创建并使用无组织项目,省事。
如果你仍要使用组织下的项目也是可以的,只是中途会比无组织项目多几个步骤,教程也兼顾了组织下的项目。
创建无组织项目
点击窗口右上角的 新建项目New project。
a36799×577 12.2 KB
项目名称和 ID 随意;
结算账号选择 我的结算账号My Billing Account(带新用户赠金的账号);
组织选择 无组织No organization。
点击 创建Create 即可。
a37528×545 21.8 KB
前往导航菜单(侧边栏) → IAM 和管理IAM & Admin → 服务账号Service Accounts
a5482×571 28.1 KB
来到如下界面。
点击上面的 创建服务账号Create service account。
a6717×364 20.4 KB
服务账号名称和 ID 随意,然后点击 创建并继续Create and continue。
a7588×579 22.6 KB
不小心提前点击完成Done了
已经能看到新的服务账号了。
找到右侧 操作Actions 下方的三个点,点击 管理权限Manage permissions 继续配置。
a10758×341 12 KB
a11919×571 41.5 KB
然后给予角色,只是拿来调用 AI 的话,Vertex AI User 这个角色的权限已经足够。
a8540×510 19.2 KB
a9495×366 17.6 KB
然后点击 完成Done。
[!danger]- 不要向服务账号给予 Owner 角色!
Owner 角色的权限非常高,可接管整个 GCP 项目,包括支付与结算。
若密钥泄露,后果严重!
建议只给予需要的角色,让账号只获得需要的权限。
3.1. 获取服务账号密钥
从第 3 章结尾,创建服务账号后继续。
服务账号的密钥不是简单的一串字符,而是以下三个字段联合,缺一不可:
- 账户邮箱Client Email
- 私钥Private Key
- 项目 IDProject ID
找到右侧 操作Actions 下方的三个点,点击 管理密钥Manage keys 继续配置密钥。
a12758×341 12 KB
点击 添加键Add key,再点击 创建新密钥Create new key,类型选择 JSON。
a13434×511 16.3 KB
a14492×309 8.73 KB
[!failure] 密钥创建功能已停用?
这是因为当前项目属于某个组织下,组织政策里默认禁止了密钥创建。
你可以继续在当前项目下去关闭政策,
也可以去创建一个无组织项目,然后回到第 1 章从启用 API 重新开始。
关闭对应政策
a15583×466 25.2 KB
复制这个:iam.managed.disableServiceAccountKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。
密钥创建完毕,会自动下载一个 JSON 密钥文件。
密钥文件只能下载这一次,丢了需要创建新密钥。
妥善保管,同时避免泄露!
a21801×188 4.62 KB
3.2. 获取一串 API 密钥
从第 3 章结尾,创建服务账号后继续。
如果你的项目属于某组织,则需要关闭一个组织政策,防止 API 密钥创建被阻止。
复制这个:iam.managed.disableServiceAccountApiKeyCreation
然后跟随第 3.3. 章,关闭对应组织政策后再继续。
前往导航菜单(侧边栏) → API 和服务APIs & Services → 凭证Credentials。
a39448×419 18.2 KB
点击上面的 创建凭证Create credentials,选择 API 密钥API key
a40587×297 16.7 KB
密钥名称随意;
先点击 通过服务账号对 API 调用进行身份验证Authenticate API calls through a service account,
选择有对应角色/权限的服务账号(比如 Vertex AI User 角色),
然后选择使用 Vertex AI API,
最后点击下面的 创建Create。
a41586×554 28.7 KB
成功后熟悉的一串密钥就创建了,通常是 AQ. 开头。
请继续跟随第 4.2. 章。
3.3. 关闭组织政策
点击左上角选择项目/组织,确认属于某个组织;点击弹窗右上角的三个点,点击 组织政策Organization policies
a161216×879 63.9 KB
[!failure] 组织政策显示没有权限查看?↓ 跟随 错误 1.1 再继续
错误 1.1
a22796×753 43.5 KB
项目的 IAM 和组织的 IAM 是互相独立的,说明你在组织里缺少必要角色的权限。
直接在顶部居中的搜索框里输入 Organization details 然后进入。
a23700×568 43.2 KB
a241263×459 19.4 KB
可以看到已经提示缺少权限了,点击右侧的 授予访问权限Grant access。
等待两三分钟让更改生效。
必要的权限都没有,大概率也会遇到 错误 1.2,建议也跟随。
进入如下画面,在过滤输入框里搜索(或粘贴之前让你复制的),可以看到有一个 强制执行状态Enforcement state 为 有效Active 的政策。
a17v21439×872 72.8 KB
点击进入那个政策,然后点击右上角的 管理政策Manage policy。
a18582×559 20.9 KB
[!failure] 管理政策Manage policy 按钮是灰色,无法点击?↓ 跟随 错误 1.2 再继续
错误 1.2
项目的 IAM 和组织的 IAM 是互相独立的。
进入 IAM,注意是组织的 IAM。
找到主账号(邮箱是你的),点击右侧的铅笔按钮。
a251218×640 45.8 KB
搜索 Organization Policy Administrator 并给予这个角色。
a26517×389 23.6 KB
点击 保存Save,等待两三分钟让更改生效。
政策来源Policy source 改为 覆盖父资源的政策Override parent’s policy。
添加规则Add a rule,实施Enforcement 选择 关闭Off,点击右下角 完成Done,最后点击 设置政策Set policy。
a19549×685 23.7 KB
a20532×564 17.9 KB
成功后即可看到 强制执行状态Enforcement state 变成了 未实施Not enforced。
等待两三分钟让更改生效。
4. 查看可用模型 & 区域的选择
[!info] 无法拉取模型列表是正常现象
即使配置正确,列表里也拉取不了任何模型,这是正常的,Vertex AI API 不提供这个功能。
你需要手动添加模型。
Vertex AI 也是最快获取 Gemini 新模型的渠道之一。
Gemini 新模型上架后,只需查查它的模型 ID,通常都能在 Vertex AI 里使用。
查看可用模型
前往导航菜单(侧边栏) → Vertex AI → 模型库Model Garden
你能看到有各种各样的模型,不仅限于 Gemini 系列。
别想得太美,别家模型(Claude 等)都不能直接用,需要申请(Google 自家的非 Gemini 系列模型也类似);
且不说能不能申请通过,受新政策影响的账号即使申请成功了,调用别家模型也不会使用赠金(激活/升级账号后也一样)。
赠金用户基本就老实用用 Gemini 系列模型吧。
点击一个模型,可以查看详细信息,模型 ID 就在右侧。
这个页面的模型 ID 写得太完全了,通常添加模型时要取最后的 gemini-* 部分。
a421110×617 48.6 KB
(这一长串模型 ID 的前部分指的是用一串 API 密钥调用时的 URL 路径)
区域Location的选择
大部分情况下选择 us-central1 即可。
如果你要使用预览模型(模型 ID 带 -preview 后缀),需要选择 global,否则会报错找不到模型。
4.1. 使用 - Vertex AI API(服务账号密钥)
从第 3.1. 章结尾,下载 JSON 密钥文件后继续。
如果配置界面中要求填写 JSON,那么只需打开密钥文件,把整个内容复制粘贴进去即可。
否则,你需要提取 账号邮箱、私钥和项目 ID 这些字段。
密钥文件的结构大概如下:
{
"type": "service_account",
"project_id": "项目 ID",
"private_key_id": "*****",
"private_key": "-----BEGIN PRIVATE KEY-----\n非常长的私钥\n-----END PRIVATE KEY-----\n",
"client_email": "服务账号邮箱",
"client_id": "*****",
"auth_uri": "https://accounts.google.com/o/oauth2/auth",
"token_uri": "https://oauth2.googleapis.com/token",
"auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
"client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/*****.iam.gserviceaccount.com",
"universe_domain": "googleapis.com"
}
账号邮箱对应 client_email;
私钥对应 private_key,建议完整地复制私钥,包括前后的 -----BEGIN/END PRIVATE KEY-----;
项目 ID 对应 project_id;
4.2. 使用 - Vertex AI API(一串 API 密钥)
从第 3.2. 章结尾,获取一串 API 密钥后继续。
这章主要针对没有 Vertex AI 提供商的工具,可以用 Google 提供商 + 自定义 URL 做替代方案。
Vertex AI API 不使用原先的 generativelanguage.googleapis.com,
需要更改提供商 URL:
→ https://{区域?}-aiplatform.googleapis.com/v1/publishers/google
比如使用 us-central1 区域就是:
→ https://us-central1-aiplatform.googleapis.com/v1/publishers/google
如果是 global 区域,开头的 {区域}- 不用加:
→ https://aiplatform.googleapis.com/v1/publishers/google
URL 后面不要加上 v1beta,加上会 404!建议检查工具是否会自动处理 URL。
4.3. 使用 - Vertex AI API(Google Cloud SDK - 登录谷歌账号)
首先安装完 Google Cloud SDK 后,
打开控制台,执行 gcloud init,
成功后会询问 You must sign in to continue. Would you like to sign in (Y/n)?,输入 Y,会弹出浏览器,登录你的 GCP 谷歌账号。
登录成功后,控制台会显示如下文字:
You are signed in as: [example@example.com].
Pick cloud project to use:
[1] 项目 ID
[2] 更多项目 ID...
[n] Enter a project ID
[n] Create a new project
Please enter numeric choice or text value (must exactly match list item):
选择一个项目,输入左侧的序号。
成功后会显示这行文字:Your current project has been set to: [项目 ID].
接下来给程序创建默认凭据ADC。
执行 gcloud auth application-default login,会再弹出浏览器,再登录一次你的 GCP 谷歌账号。
登录成功会显示这行文字:Credentials saved to file: [your\path\gcloud\application_default_credentials.json].
完成,之后通过官方 GenAI 库还是通过 SDK 调用时,都会找到默认凭据。
常用命令
查看账号(保存的所有账号、当前激活的账号):gcloud auth list
查看配置(当前账号和项目):gcloud config list
登录账号:gcloud auth login
切换当前激活账号:gcloud config set account 账号邮箱
设置当前项目:gcloud config set project 项目ID
登出指定账号:gcloud auth revoke 账号邮箱
登出所有账号:gcloud auth revoke --all
[!warning]- 不想被反薅就不要点 激活/升级
如果你只想使用赠金,用完即停,就不要点击页面右上角或其他任何和账号有关的 激活Activate 或 升级Upgrade 按钮。
其他 1. 查看赠金剩余
前往导航菜单(侧边栏) - 结算Billing。
有新用户赠金的结算账号通常叫 我的结算账号My Billing Account。
在左上角可以切换查看,查看有新用户赠金的结算账号时右下角会直接显示剩余金额和时间。
从使用到计费会有 2~5 小时的延迟。
a271252×997 73.4 KB
还有通用的方法,对所有结算账号都可用。
点击左侧的 赠金Credits,就会显示当前的赠金。
a281270×631 30.5 KB
其他 2. 切换项目的结算账号
GCP 偶尔会有 5 美元的赠金羊毛(佬友们也会分享),领取后会新建一个结算账号。
左上角打开选择结算账号的窗口,点击 管理结算账号Manage billing accounts。
a29407×277 11.6 KB
点击 您的项目Your projects,若找不到项目就检查上面的组织选择是否正确。
然后点击项目右侧 操作Actions 下方的三个点,点击 更改结算信息Change billing。
a30834×401 14.1 KB
选择其他结算账号后点击 设置账号Set account 即可。
a31561×291 16 KB
其他 3.1. 查看本月的 Token 消耗量(桌面端 - 快速方便)
前往导航菜单(侧边栏) - Vertex AI → 信息中心Dashboard。
进入后下滑页面,即可看到各模型的 Token 消耗和费用。
(gemini-3.1-pro-preview 的消耗也算在 3 Pro 里)
a321018×404 32.6 KB
移动端大概率不显示这个信息,不知什么原因(可能是视口宽度不够?)。
如果没有桌面端又想看,或者想看模型调用次数,可以跟随 其他 3.2. 的通用方法。
其他 3.2. 查看 Token 消耗量和模型调用次数(通用)
前往导航菜单(侧边栏) - Monitoring → Metrics Explorer。
右上角选择想查询的时间范围,右侧的 Widget 类型Widget type 选择 Table,点击右上角偏下的 PromQL。
a331017×463 21.2 KB
点击 PromQL 后,左侧变成了命令输入框。
复制粘贴下面的查询命令后点击右上角的 执行查询Run Query 或打开 自动运行Auto-Run。
一个输入框只放一条命令。
查询各模型的输入/输出 Token 消耗量
sum by ("model_user_id","type")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/token_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))
结果示例
a34691×574 35.1 KB
查询各模型的调用次数
sum by ("model_user_id")(increase({"__name__"="aiplatform.googleapis.com/publisher/online_serving/model_invocation_count","monitored_resource"="aiplatform.googleapis.com/PublisherModel"}[${__interval}]))
结果示例
a35691×341 16.3 KB
其他 4.1. 请求体 safetySetting - 内容过滤设置
请求时,在请求体Request body一同传入,不传的话 threshold 默认都是 OFF。
键Key为 safetySetting;
值Value为一个对象数组,每个对象通常都由 category 和 threshold 组成。
[
{
"category": "过滤类型",
"threshold": "触发阈值"
}
]
过滤类型
以下四个类型在所有 Gemini 渠道都可用:
HARM_CATEGORY_HATE_SPEECH:仇恨内容
HARM_CATEGORY_DANGEROUS_CONTENT:(暴力等)危险内容
HARM_CATEGORY_HARASSMENT:(辱骂、欺凌等)侮辱内容
HARM_CATEGORY_SEXUALLY_EXPLICIT:NSFW 内容
以下五个类型仅在 Vertex AI 渠道可用,其他渠道不支持:
HARM_CATEGORY_JAILBREAK:大模型破限/越狱内容
HARM_CATEGORY_IMAGE_HATE:包含仇恨内容的图片
HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT:包含危险内容的图片
HARM_CATEGORY_IMAGE_HARASSMENT:包含侮辱内容的图片
HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT:包含 NSFW 内容的图片
(以上四个图片相关设置似乎并不作用于 Nano Banana 生图,图片照样会拦截)
触发阈值
BLOCK_LOW_AND_ABOVE:可能性低也触发
BLOCK_MEDIUM_AND_ABOVE:可能性中等也触发
BLOCK_ONLY_HIGH:仅在可能性高时触发
BLOCK_NONE:(尽可能)不触发
OFF:关闭
BLOCK_NONE 和 OFF 不代表 100% 不触发,只是把触发概率降到最低了(即使这样也比 AI Studio 的触发概率低很多)。
BLOCK_NONE 仍会在返回中带上安全评级,OFF 不会。
另外别忘了还有大模型的内部安全对齐。
详细内容可查看 官方文档 。
值的完全体:
[
{
"category": "HARM_CATEGORY_HATE_SPEECH",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_HARASSMENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_JAILBREAK",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_HATE",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_DANGEROUS_CONTENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_HARASSMENT",
"threshold": "OFF"
},
{
"category": "HARM_CATEGORY_IMAGE_SEXUALLY_EXPLICIT",
"threshold": "OFF"
}
]
其他 4.2. 请求头 ...Request-Type - 随用随付PayGo类型
请求时,在请求头Request header一同传入,不传的话将使用 标准Standard 类型。
有三种随用随付类型,分别是 灵活Flex、标准Standard 和 优先Priority。
灵活 类型用更慢的响应换更低的费用倍率,优先 类型用更高的费用倍率换更快的响应。
键Key为 X-Vertex-AI-LLM-Shared-Request-Type;
值Value请看表格:
| 类型 | 值 | 响应速度 | 费用倍率 |
|---|---|---|---|
| 灵活 | flex | 更慢 | 0.5x |
| 标准 | - | 正常 | 1x |
| 优先 | priority | 更快 | 1.8x |
详细内容可查看官方文档:灵活、标准、优先 和 费用表
--【壹】--:
image1920×1090 229 KB
为什么这边没办法管理政策?
--【贰】--:
vertex的预览版Gemini疯狂429啊…
--【叁】--:
感谢, 是在
image784×154 6.38 KB
这里面增加缺失的权限即可
--【肆】--:
感谢教程
--【伍】--:
感谢佬的喂饭教程,vertex面板太复杂了
--【陆】--: Nacreon:
iam.managed.disableServiceAccountKeyCreation
我解决了 ==
--【柒】--:
其实还有一个比较简单的方法,是新建一个无组织,就不用折腾IAM了
--【捌】--:
佬 怎么解决的?
--【玖】--:
感谢大佬教程
--【拾】--:
用非预览模型的话,轮询多个区域Location是可以的;
预览模型的话提升不大,因为通常都是用global,在这一个区域里抢。
--【拾壹】--:
呜呜┭┮﹏┭┮太感谢佬了,我之前一段时间搞了GCP后四处找不到教程,你这个写得太好了
--【拾贰】--:
感谢分享!
--【拾叁】--: 大帅哥:
感谢大佬教程
感谢大佬教程。还以为未来的赠金没法用了
--【拾肆】--: Nacreon:
你可能发现了左下角有
获取 API 密钥,不要用它。
完啦佬,就用的这个
--【拾伍】--:
给你自己的账号设置授权
--【拾陆】--:
想请问一下我一个号创建多个项目,使用多个json key来调用vertex能提高并发吗不频繁429吗
--【拾柒】--:
写的很好,前排支持
--【拾捌】--:
感谢教程
--【拾玖】--:
谢谢分享

