刚刚,DeepSeek扔出大杀器,梁文锋署名!暴力优化AI架构
【新智元导读】2026新年第一天,DeepSeek发表了梁文锋署名的重磅新论文,提出了一种名为「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升。重磅!刚刚,DeepSeek送上2026年新年第一个王炸。这次的创新是,mHC(流形约束超连接)新架构。标题:mHC:Man
DeepSeek又放大招!梁文锋署名新论文引关注
DeepSeek近日发布论文,阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写,提出了名为“流形约束超连接”(mHC)的框架。作者称,该框架旨在提升可扩展性,同时降低训练先进人工智能系统的算力和能源需求。DeepSeek下一代旗舰系统R2预计将在2月份春节前后问世。1月1日消息,DeepSeek发布了一篇新论文...
梁文锋和DeepSeek想做啥,用开源打破AI垄断
更关键的是,梁文锋坚持开源策略,将这些成果公之于众。DeepSeek-R1的发布,让企业和开发者能直接使用具备“思维链”能力的推理模型,无需从零训练。这种开放姿态,正在推动中国乃至全球AI生态的普惠化。外界对此反应不一。有研究者称赞DeepSeek“在架构创新上走在世界前列”,也有观点质疑“开源模型的实际落地能力仍弱...
DeepSeek新年炸场!梁文锋署名论文发布
DeepSeek提出的mHC相当于给水管加了“智能调节阀”,能确保水流的稳定,运行的时候更省资源。在论文中,DeepSeek表示,mHC为未来研究开辟了多个前景广阔的路径。研究团队希望mHC能重新激发学界对宏观架构设计的兴趣。通过深化对拓扑结构如何影响优化与表征学习的理解,mHC或将有助于突破当前限制,并可能为下一代基础架构...
梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基”
DeepSeek的解决方案是将连接权重矩阵约束在一个特定的数学空间上,双随机矩阵(Doubly Stochastic Matrix)。它核心是这样:所有元素非负,每一行的元素加起来等于1,每一列的元素加起来也等于1。为什么这个约束有效?因为当信号通过这样的矩阵变换时,输出实际上是输入各分量的凸组合,可以理解为一种“加权平均”。根据...
DeepSeek震惊硅谷,梁文锋以29万美元成本,改写全球AI格局
这种把自家核武器图纸公开送人的行为,梁文锋解释得特实在:“你要是找商业理由,那是绝对找不到的,因为这事儿怎么算都亏。”但他看的显然不是眼前这点钱。他想做的,是凭一己之力,把被硅谷巨头用“算力霸权”锁死的AI技术大门,给全世界重新撞开。你看他那个DeepSeek-V3的架构设计,叫“混合专家MoE”,说...
DeepSeek创始人梁文锋的独家采访
梁文锋:我们的计算资源和团队成员的使用没有限制。如果有人有想法,他们可以随时调用我们的训练集群,无需审批。此外,由于我们没有严格的层级架构或部门壁垒,只要彼此感兴趣,团队成员可以自由协作。安永:这种宽松的管理方式依赖于招聘极具驱动力的人才。据说 DeepSeek 擅长通过非传统标准识别卓越人才。梁文锋:我们的...
李想谈与DeepSeek梁文锋聊完后印象最深的两点 - 知乎
但 DeepSeek 开源,整个的加速了九个月的时间,所以给我们带来巨大的收益和帮助。这是我们受到了那么大的帮助,我们在想我们能对社会做点什么贡献,所以我们就把这个操作系统也开源了,没有大家想的那么复杂,就完全我自己内心,包括谢炎的内心,就是 DeepSeek 给我们带来那么大的帮助,我们应该给这个社会贡献点什么?
DeepSeek流量下滑2500万,他却慢悠悠练内功,这半年梁文锋干啥了
DeepSeek走得慢,但没放松脚下的每一步。它不是不做Agent,不是不用微信,不是不迭代,而是没把这些当做自己唯一的舞台。正如梁文锋所说:“我们希望建立一个生态系统,让行业直接使用我们的技术和成果。”这听起来不像硅谷式的“创业神话”,而更像一句科研人的“情书”。但这世界需要的,可能恰恰就是不焦虑、...
DeepSeek创始人梁文锋人生经历,要想改变世界,要先活成自己的光
1985年出生于广东湛江的DeepSeek创始人梁文锋,2002年17岁考入浙江大学电子信息工程专业,2007年22岁就读浙江大学信息与通信工程专业研究生,主做机器视觉研究,2008年开始积累市场行情数据、金融市场等相关数据以及宏观经济等数据,2010年开始从事全自动量化交易和AI算法研究,顶峰时管理资金超千亿规模,2023年5
DeepSeek又又又出新模型,梁文锋带头干谷歌_哔哩哔哩_bilibili
这是DeepSeek当前性能最强大的模型,在推理、智能体等多领域基准测试中斩获全球开源模型第一的表现。尤其是长思考增强版DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备较强的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。整体论文由梁文锋署名。
DeepSeek梁文锋凭什么提高我们的认知 - 百度知道
技术哲学导向:DeepSeek将“认知多样性指数”作为核心指标,远超用户时长等传统数据。其模型在解析《庄子》时,能识别36重隐喻维度,展现了对文化深度的挖掘能力。这种设计迫使用户跳出浅层阅读,进入多层次思考。二、底层技术突破:为深度交互提供硬件支撑梁文锋的“认知革命”离不开技术硬实力的支撑。其...
为什么是梁文锋做出了DeepSeek?-CSDN博客
为什么是梁文锋做出了DeepSeek? 作者丨高允毅 来源丨AI科技评论 这是2025年开年最火的科技明星,短短几天时间,梁文锋从小到大的种种过往都被展现在世人眼前,包括他来不及装修的新房以及在房子里睡觉用的帐篷,都成为了他独特个性的象征。 独特个性固然为人津津乐道,但并不是成功的关键,这个籍籍无名的大学生,在...
Deepseek量化大变革梁文锋如何颠覆AI与投资认知
坦白说,最让人佩服的,还是他的跨界速度,比如2023年,他刚创办DeepSeek,半年后,DeepSeek-R1模型发布,性能媲美GPT-4o,训练成本却只有十分之一,这背后其实凝结了他在超算、算法、数据调优上的很多创新。讲量化投资,其实是在用一个算法模型跟市场人性做博弈,你会发现,梁文锋构建的系统特别讲究分层结构,底层...
梁文锋团队新论文揭秘DeepSeek:聪明 AI 是怎样“省钱又变强”的...
一个小故事告诉你 DeepSeek AI 大模型都在研究什么 想象一下,DeepSeek 团队就像一群超级厉害的厨师,他们想做一道全世界最美味、最复杂的“AI 大餐”。 他们遇到的难题: “高级厨具”(就是很贵的电脑芯片,GPU)数量有限: 不像有些大餐厅,可以随便买最顶级的厨具。做这道大餐特别费“食材”和“时间”(就是计算...
广东85后登场,美股和比特币 “集体破防”
因此,梁文锋开始被大众所熟知。随着梁文锋的DeepSeek持续火爆,美股的科技股受到暴击,上周五AI芯片巨头英伟达暴跌3%。我写稿时,美股盘前交易,芯片相关的科技巨头英伟达、台积电双双暴跌7.5%,光刻机巨头ASML暴跌8.5%。为何梁文锋横空出世,把美股科技股给干翻了呢?这要从梁文锋和DeepSeek说起。1985年,梁文锋出生于...
deepseek流量下降,周鸿祎:梁文锋一门心思做agi,根本没有想做一个app
一、评价背景与核心指向1. 事件关联:该评价与DeepSeek近期流量表现相关,周鸿祎认为流量下滑根源并非技术本身,而是产品落地节奏问题。2. 战略分歧:周鸿祎指出梁文锋团队“一门心思做AGI”,即侧重通用人工智能技术研发,未将技术转化为面向C端用户的APP产品,导致流量缺乏直接载体。二、行业视角下的逻辑合理...
DeepSeek 创始人梁文锋访谈实录 - 知乎
看完这位DeepSeek创始人的访谈,忍不住想说:这是我最近看过的最"清爽"的AI创业者谈话录了!首先必须说,梁先生是真耿直。在当下AI创业圈"卷规模"、"卷融资"、"卷应用"的氛围里,人家直接甩出一句"我们要做的不是生成式AI,而是AGI",这话说得是真有种😂 但细品还真有道理,毕竟现在的大模型圈,确实有点"卷...
Deepseek一夜成名,改变世界?梁文锋访谈透露了什么不为人知的秘密?
希望Deepseek的团队保持这样的热爱和好奇心,千万不要闭源Deepseek,千万不要对金钱抱以极大的热情。 梁文锋说对于未来,有三个方向,一个是数学和代码,一个是多模态,第三个是自然语言本身。 Deepseek说到底会成为AI语言模型上的一个分工体系,并不是想做一整套AI语言模型系统。