DeepSeek V3-0324很不错,这是一些提示词和使用建议

原创 花生 花叔 2025-03-26 13:04

原文地址: https://mp.weixin.qq.com/s/TMwB-6_A5uA8tAEPUYyaDw

互动数据

  • 阅读:13974
  • 点赞:124
  • 转发:684
  • 喜欢:40
  • 留言:16

一、结论&建议

这两天DeepSeek又发布了一个编程能力更强的V3模型,自媒体圈肯定是又被各种震惊。估计大家也是不可避免的都关注到了,所以我这里给大家提供一些更真实的结论和建议。

1、实测下DeepSeek V3-0324相比此前的版本确实在前端设计能力上取得了很大的进步,设计审美和生成长代码的能力都增强了许多;

2、整体编程能力大致在Claude 3.5到Claude 3.7之间

3、目前Cursor中的DeepSeek V3还不是最新版本,但预计很快会接入,不需要花很多时间整自己的API接入方式,价值不大

4、现在使用DeepSeek V3-0324最方便的方式就是DeepSeek官网,可以在一些简单的,只需要少数几个代码文件的任务场景下使用,比如生成app原型,生成简单的html网页等。

二、DeepSeek V3-0324模型跑分

按DeepSeek官方发布的说法是:

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

可以看出从跑分来说,DeepSeek V3-0324确实开始明显领先了,甚至在评估代码能力的LiveCodeBench上超过了Claude 3.7,不过我在之前的文章中:https://t.zsxq.com/Jpher 就和大家提过,现实世界软件工程要解决的问题和编程竞赛类的跑分是不同的,我们真正该关注的两个评测集其实是SWE-Lancer和SWE-Bench Verified,只有这两个集合的评估才真正代表模型的编程能力。可惜这次V3的发布没有这个数据。

三、实际的测试

这两天DeepSeek的编程能力测试很多,有一个小球在六边形里滚动的,那个其实价值一般,还是让模型解决难题。我觉得更有价值的还是让模型能前端页面和完成后端的开发。所以我还是拿了之前尝试过对模型能力要求比较高的app原型测试的提示词,并做了些调整,去要求deepseek一次性生成全部html代码。

我想开发一个类似拼多多的电商平台app,现在需要输出高保真的原型图,请通过以下方式帮我完成所有界面的原型设计,并确保这些原型界面可以直接用于开发:

这个提示词获得了1400多行的代码,但是因为生成的代码文件过长,deepseek在生成时中断过一次,但点击「继续生成」就解决了。

获得的实际效果如下:

另外,我还尝试了个网站的生成,效果也还可以,大致都是属于Claude 3.5到Claude 3.7之间的水平。

注:文章转载自我的知识星球「AI编程:从入门到精通」,如果你希望和1200+人一起用AI编程享受创造的快乐,可以点击「阅读原文」了解。