DeepSeek V3深夜低调升级网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级,网友实测可媲美Claude 3.5/3.7 Sonnet

他还称，DeepSeek-V3-0324 在编写代码方面确实很棒！早期测试显示，它是所有开源选择中最好的非推理模型，甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站，只见该模型一口气写了 800 多行代码，中途一次都没卡壳，生成的网站布局也非常完美。这位网友还把提示语放出来了...

...进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet - 知乎

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。这位网友还把提示语放出来了,简单...

...代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet__凤凰网

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。这位网友还把提示语放出来了,简单...

DeepSeek V3深夜低调升级,网友实测可媲美Claude 3.5/3.7 Sonnet

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。这位网友还把提示语放出来了,简单...

...代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet_https...

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。

DeepSeek-V3深夜惊爆上新!V3开源升级接近Claude3.7水平,必须重视!

DeepSeek-V3-0324编程与数学能力大幅提升【基准测试提升显著】根据国外开源评测平台kcores-llm-arena的最新测试数据，V3-0324的代码能力达到了328.3分，超过了普通版的Claude 3.7 Sonnet（322.3分），接近思维链版本的334.8分。这一成绩意味着，新版V3已成为目前编程能力最强的开源模型之一。【Web前端开发能力优化...

...代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet - 掘金

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

就代码能力来看，DeepSeek-V3-0324同样能够与Claude 3.5 Sonnet一决高下。另外，在Aider的多语言基准测试中，DeepSeek-V3-0324拿下55%成绩，较前代版本显著提升，成为仅次于Sonnet 3.7的非推理类模型第二名。其表现已可媲美R1和o3-mini等具备推理能力的模型。网友「karminski-牙医」还带来了全网最速的代码实测，...

...代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet-51CTO...

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。

Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet - 知乎

据Reddit网友爆料,v3已在API和网页上发布,一些榜单跑分也新鲜出炉。在Aider多语言编程测试排行榜中,Deepseek-v3一举超越Claude 3.5 Sonnet,排在第1位的o1之后。 (相比Deepseek-v2.5,完成率从17.8%大幅上涨至48.4%。) 且在LiveBench测评中,它是当前最强开源LLM,并在非推理模型中仅次于gemini-exp-1206,排在第二...

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...

其表现已可媲美R1和o3-mini等具备推理能力的模型。网友「karminski-牙医」还带来了全网最速的代码实测,新模型直接干翻了DeepSeek R1,与Claude 3.7相匹敌。在KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude 3.5 Sonnet。

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

与Claude 3.5 Sonnet对比实测来了一水发自凹非寺量子位 | 公众号 QbitAI 国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。单项上,在困难提示、编程、数学,写作等方面全面超越Claude 3.5 Sonnet。

DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!-腾讯云开发者...

备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破,其在aider多语言编程测评中的表现,甚至超越了Claude3.5Sonnet V2等竞争对手,引发了业界广泛关注。据了解,Deepseek V3相比之前的版本,在性能上实现了质的飞跃。Deepseek V2.5在aider测评中的成功率仅为17%,而V3则暴增至48%,这充...

昔日编程王者升级!Claude 3.7 Sonnet 实测对比 O3 Mini、DeepSeek...

34 Claude 3.7 Sonnet 核心升级:三大功能亮点解析 00:00:44 升级亮点一:创新快思考+深思考模式详解 00:00:55 升级亮点二:编程能力飞跃与 Claude Code 代码神器 00:01:15 升级亮点三:企业应用友好与 API Token 灵活控制 00:01:31 巅峰对决:Claude 3.7 Sonnet 对比 O3 Mini, Grok 3, DeepSeek R1 00:01:...

如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

在软件工程SWE-bench Verified基准上，DeepSeek-V3略显逊色，Claude 3.5 Sonnet以50.8分碾压所有模型。

DeepSeek v3 推理调用工具能力横向实测,对比 openai gpt-4o 与...

DeepSeek V3 实测:与 Claude 3.5 Sonnet、o1 Pro 代码能力对比 1647 0 04:42 App Xpert AI 长期记忆的记忆类型: 用户档案,问答, 自定义 5311 0 00:16 App DeepSeek V3低调开源编程能力超过闭源Claude Sonnet 3.5 3298 0 04:01 App Deepseek V3性能比肩顶尖模型:解读与使用 15.1万 164 04:51 App 还在...

王炸!DeepSeek-V3-0324悄然发布 ,免费商用,消费级电脑也能跑!

DeepSeek 悄然发布了其最新的大型语言模型 DeepSeek-V3-0324,在人工智能行业内引发了强烈反响。这款容量高达641GB的模型悄然出现在 AI 模型库 Hugging Face 上,几乎没有任何事先宣传,延续了该公司低调但极具影响力的发布风格。性能飞跃,媲美 Claude Sonnet3.5 ...

DeepSeek,上新!

其中，模型前端代码能力的提升是用户感知最明显的部分，有海外AI博主称，DeepSeek终于能在代码领域和Anthropic的Claude3.5/3.7Sonnet相媲美，还有专业用户在体验后认为，V3-0324的提升幅度大约相当于Sonnet3.5到Sonnet3.6的提升。例如，有海外博主提到，其让新的DeepSeekV3-0324创建一个市场网站，仅用一个提示，它...

网友热评Deepseek新版V3:编程堪比最强AI,期待更强R2!_手机新浪网

根据社区测试和分析,此次更新虽然不是全新一代模型,仅属于“小版本升级”,但其编程能力已达到与Claude 3.7 Sonnet相当的水平,在某些测试场景中甚至表现更佳。有网友表示,新版V3较上一代来说,相当于Sonnet 3.6之于Sonnet 3.5的飞跃。还有网友指出,新版V3模型的编码能力完全超预期,堪称目前最强大的免费AI模型。

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...

其表现已可媲美R1和o3-mini等具备推理能力的模型。网友「karminski-牙医」还带来了全网最速的代码实测,新模型直接干翻了DeepSeek R1,与Claude 3.7相匹敌。在KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude 3.5 Sonnet。

DeepSeek V3深夜低调升级 网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级网友实测可媲美Claude 3.5/3.7 Sonnet