梁文锋和DeepSeek想做啥

刚刚,DeepSeek扔出大杀器,梁文锋署名!暴力优化AI架构

【新智元导读】2026新年第一天，DeepSeek发表了梁文锋署名的重磅新论文，提出了一种名为「mHC（流形约束超连接）」的新架构，在27B参数模型上，仅增加约6.7%的训练时间开销，即可实现显著性能提升。重磅！刚刚，DeepSeek送上2026年新年第一个王炸。这次的创新是，mHC（流形约束超连接）新架构。标题：mHC：Man

DeepSeek又放大招!梁文锋署名新论文引关注

DeepSeek近日发布论文，阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写，提出了名为“流形约束超连接”(mHC)的框架。作者称，该框架旨在提升可扩展性，同时降低训练先进人工智能系统的算力和能源需求。DeepSeek下一代旗舰系统R2预计将在2月份春节前后问世。1月1日消息，DeepSeek发布了一篇新论文...

梁文锋和DeepSeek想做啥,用开源打破AI垄断

更关键的是，梁文锋坚持开源策略，将这些成果公之于众。DeepSeek-R1的发布，让企业和开发者能直接使用具备“思维链”能力的推理模型，无需从零训练。这种开放姿态，正在推动中国乃至全球AI生态的普惠化。外界对此反应不一。有研究者称赞DeepSeek“在架构创新上走在世界前列”，也有观点质疑“开源模型的实际落地能力仍弱...

DeepSeek新年炸场!梁文锋署名论文发布

DeepSeek提出的mHC相当于给水管加了“智能调节阀”，能确保水流的稳定，运行的时候更省资源。在论文中，DeepSeek表示，mHC为未来研究开辟了多个前景广阔的路径。研究团队希望mHC能重新激发学界对宏观架构设计的兴趣。通过深化对拓扑结构如何影响优化与表征学习的理解，mHC或将有助于突破当前限制，并可能为下一代基础架构...

梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基”

DeepSeek的解决方案是将连接权重矩阵约束在一个特定的数学空间上，双随机矩阵（Doubly Stochastic Matrix）。它核心是这样：所有元素非负，每一行的元素加起来等于1，每一列的元素加起来也等于1。为什么这个约束有效？因为当信号通过这样的矩阵变换时，输出实际上是输入各分量的凸组合，可以理解为一种“加权平均”。根据...

DeepSeek震惊硅谷,梁文锋以29万美元成本,改写全球AI格局

这种把自家核武器图纸公开送人的行为，梁文锋解释得特实在：“你要是找商业理由，那是绝对找不到的，因为这事儿怎么算都亏。”但他看的显然不是眼前这点钱。他想做的，是凭一己之力，把被硅谷巨头用“算力霸权”锁死的AI技术大门，给全世界重新撞开。你看他那个DeepSeek-V3的架构设计，叫“混合专家MoE”，说...

DeepSeek创始人梁文锋的独家采访

梁文锋：我们的计算资源和团队成员的使用没有限制。如果有人有想法，他们可以随时调用我们的训练集群，无需审批。此外，由于我们没有严格的层级架构或部门壁垒，只要彼此感兴趣，团队成员可以自由协作。安永：这种宽松的管理方式依赖于招聘极具驱动力的人才。据说 DeepSeek 擅长通过非传统标准识别卓越人才。梁文锋：我们的...

李想谈与DeepSeek梁文锋聊完后印象最深的两点 - 知乎

但 DeepSeek 开源,整个的加速了九个月的时间,所以给我们带来巨大的收益和帮助。这是我们受到了那么大的帮助,我们在想我们能对社会做点什么贡献,所以我们就把这个操作系统也开源了,没有大家想的那么复杂,就完全我自己内心,包括谢炎的内心,就是 DeepSeek 给我们带来那么大的帮助,我们应该给这个社会贡献点什么?

DeepSeek流量下滑2500万,他却慢悠悠练内功,这半年梁文锋干啥了

DeepSeek走得慢，但没放松脚下的每一步。它不是不做Agent，不是不用微信，不是不迭代，而是没把这些当做自己唯一的舞台。正如梁文锋所说：“我们希望建立一个生态系统，让行业直接使用我们的技术和成果。”这听起来不像硅谷式的“创业神话”，而更像一句科研人的“情书”。但这世界需要的，可能恰恰就是不焦虑、...

DeepSeek创始人梁文锋人生经历,要想改变世界,要先活成自己的光

1985年出生于广东湛江的DeepSeek创始人梁文锋，2002年17岁考入浙江大学电子信息工程专业，2007年22岁就读浙江大学信息与通信工程专业研究生，主做机器视觉研究，2008年开始积累市场行情数据、金融市场等相关数据以及宏观经济等数据，2010年开始从事全自动量化交易和AI算法研究，顶峰时管理资金超千亿规模，2023年5

DeepSeek又又又出新模型,梁文锋带头干谷歌_哔哩哔哩_bilibili

这是DeepSeek当前性能最强大的模型,在推理、智能体等多领域基准测试中斩获全球开源模型第一的表现。尤其是长思考增强版DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备较强的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。整体论文由梁文锋署名。

DeepSeek梁文锋凭什么提高我们的认知 - 百度知道

技术哲学导向：DeepSeek将“认知多样性指数”作为核心指标，远超用户时长等传统数据。其模型在解析《庄子》时，能识别36重隐喻维度，展现了对文化深度的挖掘能力。这种设计迫使用户跳出浅层阅读，进入多层次思考。二、底层技术突破：为深度交互提供硬件支撑梁文锋的“认知革命”离不开技术硬实力的支撑。其...

为什么是梁文锋做出了DeepSeek?-CSDN博客

为什么是梁文锋做出了DeepSeek? 作者丨高允毅来源丨AI科技评论这是2025年开年最火的科技明星,短短几天时间,梁文锋从小到大的种种过往都被展现在世人眼前,包括他来不及装修的新房以及在房子里睡觉用的帐篷,都成为了他独特个性的象征。独特个性固然为人津津乐道,但并不是成功的关键,这个籍籍无名的大学生,在...

Deepseek量化大变革梁文锋如何颠覆AI与投资认知

坦白说，最让人佩服的，还是他的跨界速度，比如2023年，他刚创办DeepSeek，半年后，DeepSeek-R1模型发布，性能媲美GPT-4o，训练成本却只有十分之一，这背后其实凝结了他在超算、算法、数据调优上的很多创新。讲量化投资，其实是在用一个算法模型跟市场人性做博弈，你会发现，梁文锋构建的系统特别讲究分层结构，底层...

梁文锋团队新论文揭秘DeepSeek:聪明 AI 是怎样“省钱又变强”的...

一个小故事告诉你 DeepSeek AI 大模型都在研究什么想象一下,DeepSeek 团队就像一群超级厉害的厨师,他们想做一道全世界最美味、最复杂的“AI 大餐”。他们遇到的难题: “高级厨具”(就是很贵的电脑芯片,GPU)数量有限: 不像有些大餐厅,可以随便买最顶级的厨具。做这道大餐特别费“食材”和“时间”(就是计算...

广东85后登场,美股和比特币 “集体破防”

因此，梁文锋开始被大众所熟知。随着梁文锋的DeepSeek持续火爆，美股的科技股受到暴击，上周五AI芯片巨头英伟达暴跌3%。我写稿时，美股盘前交易，芯片相关的科技巨头英伟达、台积电双双暴跌7.5%，光刻机巨头ASML暴跌8.5%。为何梁文锋横空出世，把美股科技股给干翻了呢？这要从梁文锋和DeepSeek说起。1985年，梁文锋出生于...

deepseek流量下降,周鸿祎:梁文锋一门心思做agi,根本没有想做一个app

一、评价背景与核心指向1. 事件关联：该评价与DeepSeek近期流量表现相关，周鸿祎认为流量下滑根源并非技术本身，而是产品落地节奏问题。2. 战略分歧：周鸿祎指出梁文锋团队“一门心思做AGI”，即侧重通用人工智能技术研发，未将技术转化为面向C端用户的APP产品，导致流量缺乏直接载体。二、行业视角下的逻辑合理...

DeepSeek 创始人梁文锋访谈实录 - 知乎

看完这位DeepSeek创始人的访谈,忍不住想说:这是我最近看过的最"清爽"的AI创业者谈话录了!首先必须说,梁先生是真耿直。在当下AI创业圈"卷规模"、"卷融资"、"卷应用"的氛围里,人家直接甩出一句"我们要做的不是生成式AI,而是AGI",这话说得是真有种😂 但细品还真有道理,毕竟现在的大模型圈,确实有点"卷...

Deepseek一夜成名,改变世界?梁文锋访谈透露了什么不为人知的秘密?

希望Deepseek的团队保持这样的热爱和好奇心,千万不要闭源Deepseek,千万不要对金钱抱以极大的热情。梁文锋说对于未来,有三个方向,一个是数学和代码,一个是多模态,第三个是自然语言本身。 Deepseek说到底会成为AI语言模型上的一个分工体系,并不是想做一整套AI语言模型系统。