DeepSeek-V3.1正式发布
DeepSeek-V3.1正式发布 北京商报讯(记者 魏蔚)8月21日,DeepSeek正式发布了新一代大语言模型DeepSeek-V3.1,本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;更
DeepSeek-V3.1正式发布,混合推理架构加持,针对下一代国产芯片设计
DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。与...
DeepSeek发布新模型V3.1,价格涨了但Agent能力提升了
8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代。在X上,DeepSeek将V3.1称为“我们迈向智能体时代的第一步”(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强...
DeepSeek | 深度求索
深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需...
尽管 V3.1带来重要改进,但用户更期待的下一代大模型 DeepSeek-R2 仍未明确发布时间。此前市场传闻 R2将于 8月15日至30日 发布,但接近 DeepSeek 的知情人士表示,该消息不属实,官方目前无具体发布计划。DeepSeek 的更新节奏显示,R2发布前可能会先推出 V4模型。不过,官方一贯保持低调,强调“做完了就会发布...
DeepSeek V3.1 Base突袭上线,击败Claude 4编程爆表,全网在蹲R2和...
DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。 就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有: ...
如何评价2025年8月19日DeepSeek新发布的V3.1模型?性能上有哪些...
起码在更新。静待R2,V4。参考 ^https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base ...
DeepSeek-V3.1正式发布,叫板OpenAI,适配下一代国产芯片_手机新浪网
凤凰网科技讯 8月21日,DeepSeek正式发布V3.1版本,并将其称为“迈向 Agent 时代的第一步”。与以往的大模型迭代不同,它最大的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。
DeepSeek V3.1发布,AI算力竞赛再升级,产业链核心玩家加速布局...
币界网消息——近日,中国 AI 初创公司DeepSeek正式上线其V3.1 模型版本,引发业界广泛关注。作为DeepSeek迭代升级的重要里程碑,V3.1版本在语义理解、多模态数据处理和实时推理能力上实现显著提升,为用户提供更智能、更精准的搜索体验。 官方数据显示,V3.1在大规模文本、图像及视频数据处理效率上提升约30%,在复杂上下文...
DeepSeek更新!速览DeepSeek V3.1新特性 - 知乎
速览DeepSeek V3.1新特性 前言 又是在毫无征兆的情况下,距离DeepSeek-V3-0324模型发布近半年之后,全新一代的DeepSeek-V3.1正式上线。 自从今年1月底DeepSeek-R1模型发布以来,DeepSeek就一直以小幅更新的方式低调更新着模型,先是在今年三月份更新了DeepSeek_V3_0324模型,然后又在五月底更新了DeepSeek-R1-0528模型...
DeepSeek-V3.1发布_手机新浪网
人民财讯8月21日电,据DeepSeek消息,其正式发布DeepSeek-V3.1。此次升级包含以下主要变化:1、混合推理架构:一个模型同时支持思考模式与非思考模式;2、更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;3、更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
如何评价 DeepSeek 于 2025 年 8 月 19 日更新的 V3.1 版本? - 知乎
在 2025 年 8 月 19日,DeepSeek 悄然在Hugging Face上发布了DeepSeek-V3.1,尽管缺少官方 Model ...
DeepSeek-V3.1正式发布,上下文均扩展为128K_手机新浪网
8月21日,据DeepSeek官方公众号消息,DeepSeek-V3.1正式发布,本次升级包含以下主要变化: 混合推理架构:一个模型同时支持思考模式与非思考模式; 更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案; 更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大...
【DeepSeek V3.1 发布】 DeepSeek 全面升级至 V3.1:上下文拓展到...
【DeepSeek V3.1 发布】 DeepSeek 全面升级至 V3.1:上下文拓展到 128k,一次能“记住”一本 400 页的书;参数量 6850 亿,支持多种精度格式,以 Safetensors 开源,推理效率更高。在代码基准上,性能追平甚至超越部分顶级闭源模型,但成本低一个量级。 可以说这次V3.1 是“稳健升级”,让#DeepSeek#保持行业存在感,...
如何评价 DeepSeek 于 2025 年 8 月 19 日更新的 V3.1 版本? - 知乎
就在几个小时前,DeepSeekAI宣布官方的聊天模型从DeepSeek-V3升级到了DeepSeek-V3.1,上下文拓展至128K...
DeepSeek V3.1 Base模型重磅发布:128K上下文支持编程能力大幅提升...
据悉,DeepSeek官方近日悄然上线了全新的V3.1版本,该模型拥有685B参数,支持多种精度格式,上下文长度拓展到128k。虽然还未公布模型卡,但DeepSeek V3.1已在Hugging Face趋势榜上排名第四。 在编程能力方面,DeepSeek V3.1在Aider Polyglot多语言编程测试中获得71.6%的高分,击败了Claude 4 Opus和DeepSeek R1,成本仅1美元...
DeepSeek-V3.1正式发布,官方称是迈向Agent时代的第一步-手机金融界
凤凰网科技讯 8月21日,DeepSeek今日正式发布了其新一代大语言模型DeepSeek-V3.1。此次更新的核心亮点是引入了创新的混合推理架构,使得单个模型能同时支持常规的快速响应模式与用于复杂任务的“深度思考”模式。目前,该公司的官方App与网页端服务已完成升级,用户可通过新增的“深度思考”按钮进行两种模式的切换。
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k...
IT之家 8 月 19 日消息,DeepSeek 官方刚刚发布通知:线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。 上下文容量大提升,这意味着 DeepSeek 能一次性记住和处理更长的文本内容,对长文档分析、代码库理解、长对话保持一致性都更有帮助。 IT之家提醒...
DeepSeek V3.1发布:上下文长度拓展至128k_ZAKER新闻
8月 19 日晚间,DeepSeek 官方群发布通知,DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k,用户可通过官方网页、移动 APP 及小程序进行测试体验,API 接口调用方式保持不变。截至发稿时,DeepSeek 官方 API 文档及社交媒体账号均未正式公布此次模型更新信息。
官宣V3.1后,DeepSeek最新透露:是针对即将发布的下一代国产芯片...
8月21日,DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。 DeepSeek官微在置顶留言里说,UE8M0FP8是针对即将发布的下一代国产芯片设计。