别再说跑分了, 模型是否要实际用上才知道好坏? (吹捧GLMm2.7)
- 内容介绍
- 文章标签
- 相关推荐
真心, 自己觉得GLM 4.7, mini max m2.7 都是又平又好的model. 早几天 mindmanager winwrap, 老美model 想了一晚都想不好, 每次都runtime error. 但gemini think, GLM 4.7 do, 两天就完成了, 只有2次runtime error. 这是我入手GLM 老lite 1+3+12月的原因.
然后是GLM 不够用在openclaw, 买了mini max new starter. 试了一下, m2.7 效果一样好. 本来想上 pro, 但starter 已经有剩. m2.7 细model, 小MoE, quota 是 GLM 10倍.
高低配, 我觉得是最优解, 又平.又是中国的model.
真心, 没买平区的 claude pro, supergrok 了. 就chatgpt edu 未过期, gemini 跟 gdrive 所以才还在.
网友解答:--【壹】--:
那些winwrap 就幾個.mmbas,
唯有人手upload.
要用IDE 就copilot.
他送过200刀api, 用过幾天gemini cli.
--【贰】--:
你點解这樣說?
--【叁】--:
三月中才开始, 我feb12 就已經買GLM 老lite 了.
而且現在只有 gemini web + ios app.
notebooklm web 也不行.
--【肆】--:
适合自己就是最好的
--【伍】--:
馬圣: 別太大声~
--【陆】--:
生成式模型本来就不能看benchmark啊…
--【柒】--:
以后有机会试试,但係 agentic 同 coding 能力又会有唔同,gpt 同 opus 係两个能力都好,opus 4.6 都出嚟一段时间了,仲係比较好,比 gpt 讲嘢好听 D,但係太贵封号太狠无奈都係用 gpt。
--【捌】--:
确实,所以性价比还是对我们穷鬼太重要了
--【玖】--:
opus 4.6一出,
我問了一下如何 data 321,
opus 4.6 寫了我一個word file,
就50% quota 沒了.
cladeu 那一夽, 不行.
--【拾】--:
係唔係吖,老实讲我都没用过国产 model,最多用一下 openrouter 嘅免费 model,以前都係用 Claude 嘅 model 多,后嚟 Claude 一直收紧政策封号所以最近都係用 gpt 5.4,D 人话 GLM 很伦慢我就唔係好想用,但係听你咁讲我又想试一下 m2.7,如果之后altman 收紧我就去试一下 m2.7,主要我係养虾用,唔知呢 D 国产 model 嘅 agentic 能力点,屎过头就懒得用了,如果国产 model 有小米手机咁嘅水平,我都用国产手机,因为明知苹果手机太贵稳笨,前提係起码要有 80% 嘅水准至得。
--【拾壹】--:
Gemini从老美模型变成老中模型了
--【拾贰】--:
我是去aianalystics 先看跑分, 再試.
这樣說吧:
跑分不好的, 我不試了.
跑分差不多的, 要試才知好坏.
--【拾叁】--:
香港可以用 Gemini 吧?
--【拾肆】--:
你是在反重力里面用 gemini think出计划吗?
--【拾伍】--:
能讓你用, 不代表是你的.
另外, grok…狗也不用.
--【拾陆】--:
gemini web,
copilot gemini.
因為gemini 封得很緊. api/cli 我也不易用上.
--【拾柒】--:
之前对中国model 信心是一半一半,
現在不同了.
--【拾捌】--:
适合自己的就是最好的,在我项目中qwen3.6p无论是在速度上还是质量都超过gemin3.1p,3.1只有在40k范围内能明显超过qwen3.6p,超过40k直接拉大胯(全都仅限前端)
真心, 自己觉得GLM 4.7, mini max m2.7 都是又平又好的model. 早几天 mindmanager winwrap, 老美model 想了一晚都想不好, 每次都runtime error. 但gemini think, GLM 4.7 do, 两天就完成了, 只有2次runtime error. 这是我入手GLM 老lite 1+3+12月的原因.
然后是GLM 不够用在openclaw, 买了mini max new starter. 试了一下, m2.7 效果一样好. 本来想上 pro, 但starter 已经有剩. m2.7 细model, 小MoE, quota 是 GLM 10倍.
高低配, 我觉得是最优解, 又平.又是中国的model.
真心, 没买平区的 claude pro, supergrok 了. 就chatgpt edu 未过期, gemini 跟 gdrive 所以才还在.
网友解答:--【壹】--:
那些winwrap 就幾個.mmbas,
唯有人手upload.
要用IDE 就copilot.
他送过200刀api, 用过幾天gemini cli.
--【贰】--:
你點解这樣說?
--【叁】--:
三月中才开始, 我feb12 就已經買GLM 老lite 了.
而且現在只有 gemini web + ios app.
notebooklm web 也不行.
--【肆】--:
适合自己就是最好的
--【伍】--:
馬圣: 別太大声~
--【陆】--:
生成式模型本来就不能看benchmark啊…
--【柒】--:
以后有机会试试,但係 agentic 同 coding 能力又会有唔同,gpt 同 opus 係两个能力都好,opus 4.6 都出嚟一段时间了,仲係比较好,比 gpt 讲嘢好听 D,但係太贵封号太狠无奈都係用 gpt。
--【捌】--:
确实,所以性价比还是对我们穷鬼太重要了
--【玖】--:
opus 4.6一出,
我問了一下如何 data 321,
opus 4.6 寫了我一個word file,
就50% quota 沒了.
cladeu 那一夽, 不行.
--【拾】--:
係唔係吖,老实讲我都没用过国产 model,最多用一下 openrouter 嘅免费 model,以前都係用 Claude 嘅 model 多,后嚟 Claude 一直收紧政策封号所以最近都係用 gpt 5.4,D 人话 GLM 很伦慢我就唔係好想用,但係听你咁讲我又想试一下 m2.7,如果之后altman 收紧我就去试一下 m2.7,主要我係养虾用,唔知呢 D 国产 model 嘅 agentic 能力点,屎过头就懒得用了,如果国产 model 有小米手机咁嘅水平,我都用国产手机,因为明知苹果手机太贵稳笨,前提係起码要有 80% 嘅水准至得。
--【拾壹】--:
Gemini从老美模型变成老中模型了
--【拾贰】--:
我是去aianalystics 先看跑分, 再試.
这樣說吧:
跑分不好的, 我不試了.
跑分差不多的, 要試才知好坏.
--【拾叁】--:
香港可以用 Gemini 吧?
--【拾肆】--:
你是在反重力里面用 gemini think出计划吗?
--【拾伍】--:
能讓你用, 不代表是你的.
另外, grok…狗也不用.
--【拾陆】--:
gemini web,
copilot gemini.
因為gemini 封得很緊. api/cli 我也不易用上.
--【拾柒】--:
之前对中国model 信心是一半一半,
現在不同了.
--【拾捌】--:
适合自己的就是最好的,在我项目中qwen3.6p无论是在速度上还是质量都超过gemin3.1p,3.1只有在40k范围内能明显超过qwen3.6p,超过40k直接拉大胯(全都仅限前端)

