kimi要发新模型吗?(内测试用中,不确定是否新模型)

2026-04-11 12:001阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image1527×395 28.9 KB
今天上控制台突然发现kimi可以申请内测功能,难道是新模型测试吗

网友解答:
--【壹】--:

image1331×744 43.8 KB
思考深度貌似更深了,之前用kimi时没有单段思考这么久,不知道是不是错觉


--【贰】--:

所以这效果咋样,可能是新模型嘛。反正我还没感觉到明显的差距。不能内测啥也没测吧


--【叁】--:

其实我觉得不要用agent测才有意义,claude code 这些agent,都能去浏览器跑验证了,结果就是这样还是拿不到100分。gpt5.4是写了一遍没跑验证的


--【肆】--:

image1854×532 49.3 KB
应该有进步,我用trae里面的kimi2.5,那个72分,测着玩的,也算是有点复杂度又没那么难的,比天气卡片稍微有意义一点


--【伍】--:

image1487×459 21.7 KB
image924×341 20.4 KB
尝尝鲜


--【陆】--:

image1920×869 16.4 KB
spreadsheet.7z (4.6 KB)写完了,你去试试吧。上传不了html,压缩成7z的


--【柒】--:

emm好吧,感谢佬


--【捌】--:

image2412×1196 396 KB


--【玖】--:

佬想看你测glm5.1


--【拾】--:

申请了。等待批准中。


--【拾壹】--:

如果用claude code搭配测的话应该会好点。


--【拾贰】--:

image1267×529 25.8 KB
在opencode中问的,但是其实这样问的都不准确,都是看各个ai cli的系统提示词的。


--【拾叁】--:

等一段时间,本来想用claude code搭配测试的,但是claude code响应变慢了,只能用opencode了


--【拾肆】--:

佬,能帮忙问问这个模型的知识库截止时间和自我认知吗,之前K2.5就是清晰地知道自己的名字叫K2.5的(即使没有系统提示词)


--【拾伍】--:

希望在我订阅期间可以出k3,然后让我回心转意再继续订阅kimi,不然kimi2.5让我实在不想订阅下一个月


--【拾陆】--:

题目:单文件实现高性能、安全计算的响应式电子表格 请在一个单文件 HTML 中(包含内部的 CSS 和 JS),使用纯原生 JavaScript 实现一个 100x100(10000个单元格) 的响应式电子表格。请严格满足以下要求,禁止使用任何第三方库: 1. 界面与大规模渲染(性能测试点): 渲染一个包含表头(列标 A-CV,行标 1-100)的网格。 性能要求:禁止为 10000 个单元格单独绑定事件,必须使用**事件委托(Event Delegation)**处理点击和输入。修改单个单元格时,禁止全量重新渲染 DOM,只能精确更新受影响的单元格节点。 2. 数据、公式与安全(编译原理测试点): 支持纯数字和公式(以 = 开头)。 支持基本加减乘除(如 =A1+B2*2)。 新增范围聚合函数:支持 SUM(start:end) 和 AVG(start:end),例如 =SUM(A1:B3),要求能正确展开二维范围内的所有单元格依赖。 极度严格的安全要求:绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。 你必须实现一个微型的词法分析器/解析器(如调度场算法 Shunting-yard 或简单的 AST 解析)来计算数学表达式。 3. 核心算法要求(图论与健壮性): 级联响应式更新:实现精准的依赖追踪。A1 更新时,只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。 循环依赖检测:精准检测 A 依赖 B,B 依赖 A(或更深层环)。发现循环依赖时,相关单元格显示 !CYCLE 并中止计算,绝对不能引发调用栈溢出(Stack Overflow)。 错误传播:如果 A1 出现错误(如 !CYCLE 或解析错误 !ERR),依赖 A1 的 C1 也应显示 !ERR。 请确保 UI 简洁可用(建议给表格加上基础边框和高亮),代码结构清晰,严格遵守“禁止 eval”和“防死循环”的底线。


--【拾柒】--:

可以测测这道题,你把代码贴回来给我,我让codex去打分,目前gpt5.4 100分,gemini3.1 87分,deepseek 76分


--【拾捌】--:

现在等k3和等d4一样让我很急


--【拾玖】--:

佬咋知道不可能是K2.6呢

问题描述:

image1527×395 28.9 KB
今天上控制台突然发现kimi可以申请内测功能,难道是新模型测试吗

网友解答:
--【壹】--:

image1331×744 43.8 KB
思考深度貌似更深了,之前用kimi时没有单段思考这么久,不知道是不是错觉


--【贰】--:

所以这效果咋样,可能是新模型嘛。反正我还没感觉到明显的差距。不能内测啥也没测吧


--【叁】--:

其实我觉得不要用agent测才有意义,claude code 这些agent,都能去浏览器跑验证了,结果就是这样还是拿不到100分。gpt5.4是写了一遍没跑验证的


--【肆】--:

image1854×532 49.3 KB
应该有进步,我用trae里面的kimi2.5,那个72分,测着玩的,也算是有点复杂度又没那么难的,比天气卡片稍微有意义一点


--【伍】--:

image1487×459 21.7 KB
image924×341 20.4 KB
尝尝鲜


--【陆】--:

image1920×869 16.4 KB
spreadsheet.7z (4.6 KB)写完了,你去试试吧。上传不了html,压缩成7z的


--【柒】--:

emm好吧,感谢佬


--【捌】--:

image2412×1196 396 KB


--【玖】--:

佬想看你测glm5.1


--【拾】--:

申请了。等待批准中。


--【拾壹】--:

如果用claude code搭配测的话应该会好点。


--【拾贰】--:

image1267×529 25.8 KB
在opencode中问的,但是其实这样问的都不准确,都是看各个ai cli的系统提示词的。


--【拾叁】--:

等一段时间,本来想用claude code搭配测试的,但是claude code响应变慢了,只能用opencode了


--【拾肆】--:

佬,能帮忙问问这个模型的知识库截止时间和自我认知吗,之前K2.5就是清晰地知道自己的名字叫K2.5的(即使没有系统提示词)


--【拾伍】--:

希望在我订阅期间可以出k3,然后让我回心转意再继续订阅kimi,不然kimi2.5让我实在不想订阅下一个月


--【拾陆】--:

题目:单文件实现高性能、安全计算的响应式电子表格 请在一个单文件 HTML 中(包含内部的 CSS 和 JS),使用纯原生 JavaScript 实现一个 100x100(10000个单元格) 的响应式电子表格。请严格满足以下要求,禁止使用任何第三方库: 1. 界面与大规模渲染(性能测试点): 渲染一个包含表头(列标 A-CV,行标 1-100)的网格。 性能要求:禁止为 10000 个单元格单独绑定事件,必须使用**事件委托(Event Delegation)**处理点击和输入。修改单个单元格时,禁止全量重新渲染 DOM,只能精确更新受影响的单元格节点。 2. 数据、公式与安全(编译原理测试点): 支持纯数字和公式(以 = 开头)。 支持基本加减乘除(如 =A1+B2*2)。 新增范围聚合函数:支持 SUM(start:end) 和 AVG(start:end),例如 =SUM(A1:B3),要求能正确展开二维范围内的所有单元格依赖。 极度严格的安全要求:绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。 你必须实现一个微型的词法分析器/解析器(如调度场算法 Shunting-yard 或简单的 AST 解析)来计算数学表达式。 3. 核心算法要求(图论与健壮性): 级联响应式更新:实现精准的依赖追踪。A1 更新时,只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。 循环依赖检测:精准检测 A 依赖 B,B 依赖 A(或更深层环)。发现循环依赖时,相关单元格显示 !CYCLE 并中止计算,绝对不能引发调用栈溢出(Stack Overflow)。 错误传播:如果 A1 出现错误(如 !CYCLE 或解析错误 !ERR),依赖 A1 的 C1 也应显示 !ERR。 请确保 UI 简洁可用(建议给表格加上基础边框和高亮),代码结构清晰,严格遵守“禁止 eval”和“防死循环”的底线。


--【拾柒】--:

可以测测这道题,你把代码贴回来给我,我让codex去打分,目前gpt5.4 100分,gemini3.1 87分,deepseek 76分


--【拾捌】--:

现在等k3和等d4一样让我很急


--【拾玖】--:

佬咋知道不可能是K2.6呢