不止天气卡片,deepseek-v4-proflash cc实战测试
- 内容介绍
- 文章标签
- 相关推荐
前言
备受期待的DeepSeek V4终于发布了,相信很多人都想要看到这个模型在Coding任务中的实际表现。按传统来说,我们应该跑一个天气卡片,但是我一直觉得只有天气卡片完全反映不出来模型真正的能力,于是我决定来点创新的实战测试。
为保证本测试接近实际使用场景,测试全程使用Claude Code v2.1.86,官方正价API,模型映射配置如下所示:
图片862×234 16 KB
[!NOTE]
本次测试中DeepSeek V4所编写的源码可在 Raven95676/ds_v4_test: DeepSeek V4 Test - Codeberg.org 获取。真实环境测试仅保留Diff文件。由于时间以及精力还有财力限制,测试可能片面,欢迎各位补充测试用例。
综上,让我们开始测试吧!
希望测完了我不会变成负翁
独立项目从零生成测试
很多情况下,我们有了灵感都会让AI来开荒。我们首先来测试AI从零生成的能力。
天气卡片
首先是我们最为经典的天气卡片。
Prompt:
请编写一个单文件的HTML,实现一个现代化的天气卡片应用。所有的CSS和JS必须内联在这个HTML文件中,不允许引入外部的UI组件库。界面设计要求具备毛玻璃效果,包含天气图标、温度、地点、湿度、风速等元素,排版要求高水准的美感。
前言
备受期待的DeepSeek V4终于发布了,相信很多人都想要看到这个模型在Coding任务中的实际表现。按传统来说,我们应该跑一个天气卡片,但是我一直觉得只有天气卡片完全反映不出来模型真正的能力,于是我决定来点创新的实战测试。
为保证本测试接近实际使用场景,测试全程使用Claude Code v2.1.86,官方正价API,模型映射配置如下所示:
图片862×234 16 KB
[!NOTE]
本次测试中DeepSeek V4所编写的源码可在 Raven95676/ds_v4_test: DeepSeek V4 Test - Codeberg.org 获取。真实环境测试仅保留Diff文件。由于时间以及精力还有财力限制,测试可能片面,欢迎各位补充测试用例。
综上,让我们开始测试吧!
希望测完了我不会变成负翁
独立项目从零生成测试
很多情况下,我们有了灵感都会让AI来开荒。我们首先来测试AI从零生成的能力。
天气卡片
首先是我们最为经典的天气卡片。
Prompt:
请编写一个单文件的HTML,实现一个现代化的天气卡片应用。所有的CSS和JS必须内联在这个HTML文件中,不允许引入外部的UI组件库。界面设计要求具备毛玻璃效果,包含天气图标、温度、地点、湿度、风速等元素,排版要求高水准的美感。

