梁文锋和杨植麟再“撞车”
在2月的两篇“撞车”论文中,梁文锋和杨植麟都在作者行列,两家公司都关注Transformer架构最核心的注意力机制,即如何让模型更好地处理长上下文。作为中国大模型领域最受瞩目的创业者,两人也正在面临不同的挑战。对于梁文锋而言,在R1模型推出三个多月后,外界对DeepSeek“魔法”的痴迷程度正在下降,阿里巴巴的开源模型...
杨植麟和梁文锋,论文撞车了 - 知乎
梁文锋,杨植麟。 2月18日,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,让它能更高效的处理更长的上下文。而更有趣的是,两家公司的技术派明星创始人的名字出现在各自的论文和技术报告里。 DeepSeek 发布的论文,标题名为:《Native Sparse ...
杨植麟跟梁文锋,论文撞车! Kimi、DeepSeek又撞新成果,创始人都亲自...
和NSA类似,MoBA也是一个稀疏注意力框架,旨在提高长文本处理效率。MoBA上下文长度最大可扩展到10M,而NSA最长是64k(刚刚,DeepSeek发新成果!梁文锋亲自参与,实习生挑大梁,显著加速AI训练推理)。值得关注的是,DeepSeek创始人梁文锋是NSA论文共同作者之一,MoBA论文的共同作者中也出现了月之暗面联合创始人杨植麟、周昕宇的名字。
中国AI竞争的尽头是:清华系VS浙大系?
眼下,不少清华系跟浙大系的AI创业者正在AI领域短兵相接。 这两天,梁文锋和杨植麟论文「撞车」——前者发论文关注原生稀疏注意力(NSA),后者提出块注意力混合(MoBA)新方法,二者都直指算法优化,引起业内热议。 更早之前,1月21日左右,DeepSeek跟月之暗面几乎同步(前后相隔仅2小时)发布了比肩OpenAI o1的新模型,分别...
#杨植麟梁文锋论文撞车#据硅星人Pro,2... 来自财视科技 - 微博
【#杨植麟梁文锋论文撞车#】据硅星人Pro,2月18日,马斯克发布了他用20万张卡训出的Grok3,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,让它能更高效地处理更长的上下文。而更有趣的是,梁文锋,杨植麟的名字出现在各自的论文和技术报告里。
#杨植麟梁文锋论文撞车# 据硅星人Pro,... 来自知视频 - 微博
【#杨植麟梁文锋论文撞车#】据硅星人Pro,2月18日,马斯克发布了他用20万张卡训出的Grok 3,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,让它能更高效地处理更长的上下文。而更有趣的是,梁文锋,杨植麟的名字出现在各自的论文和技术报告里...
杨植麟和梁文锋,论文撞车了 #财经 #经济 #DeepSeek_凤凰网视频...
杨植麟和梁文锋,论文撞车了 #财经 #经济 #DeepSeek 林毅夫:对中国经济发展前景抱有信心 被判无期的越南女首富张美兰获减刑 亚币纷纷走强至近月新高 金价创历史新高 申万宏源理财研究首席分析师:中国新茶饮上市热潮,市场波动影响有限 90艘巨轮出港,阿根廷倒向中国,抢走美国大量订单,米莱开始行动 粤语报道|恒指曾跌...
杨植麟和梁文锋,论文撞车了_科创最前线会客厅_免费在线阅读收听下载...
梁文锋,杨植麟。 2月18日,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”—— 都是挑战Transformer架构最核心的注意力机制,让它能更高效的处理更长的上下文。 而更有趣的是,两家公司的技术派明星创始人的名字出现在各自的论文和技术报告里。 DeepSeek 发布的论文,标题名为:《Native Spars...
中国AI竞争的尽头是「清华系VS浙大系」?-电子头条-EEWORLD电子工程世界
这两天,梁文锋和杨植麟论文「撞车 」——前者发论文关注原生稀疏注意力 ( NSA ) , 后者提出块注意力混合 ( MoBA ) 新方法,二者都直指算法优化,引起业内热议。 更早之前, 1 月 21 日左右, DeepSeek 跟月之暗面几乎同步 (前后相隔仅 2 小时) 发布了比肩 OpenAI o1 的新模型,分别是 DeepSeek-R1 和 Kim...
DeepSeek加码开源 清华浙大缘何成中国AI关键力量
近日,梁文锋和月之暗面创始人杨植麟论文“撞车”更是引发热议。前者发论文关注原生稀疏注意力(NSA),后者提出块注意力混合(MoBA)新方法,二者都直指算法优化。 据介绍,清华依托“姚班”、“智班”等顶级实验室,聚焦通用人工智能底层技术突破,以计算机系、自动化系、交叉信息研究院为三大支柱,重点攻关大语言模型、强化...
#杨植麟梁文锋论文撞车#据硅星人Pro,2... 来自IT时代网 - 微博
【#杨植麟梁文锋论文撞车#】据硅星人Pro,2月18日,马斯克发布了他用20万张卡训出的Grok3,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,让它能更高效地处理更长的上下文。而更有趣的是,梁文锋,杨植麟的名字出现在各自的论文和技术报告里。
#杨植麟梁文锋论文撞车#据硅星人Pro,2... 来自逐浪官博 - 微博
【#杨植麟梁文锋论文撞车#】据硅星人Pro,2月18日,马斯克发布了他用20万张卡训出的Grok3,DeepSeek和月之暗面几乎同时发布了他们各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,让它能更高效地处理更长的上下文。而更有趣的是,梁文锋,杨植麟的名字出现在各自的论文和技术报告里。
杨植麟和梁文锋,论文撞车了|毕业论文_网易视频
2025-02-19 16:56:44凤凰网财经河北 0:00/0:00 速度 洗脑循环 Error: Hls is not supported. 视频加载失败 凤凰网财经 9224粉丝离用户最近的财经媒体! 00:23新疆维吾尔自治区常务副主席:真诚欢迎大家前来新疆投资考察 00:57刘纪鹏谈特朗普加征关税:想让美国制造业强大起来 ...
杨植麟和梁文锋,论文撞车了 #财经 #经济 #deepseek - 抖音
杨植麟和梁文锋,论文撞车了 #财经 #经济 #deepseek - 凤凰网财经于20250219发布在抖音,已经收获了1079.5万个喜欢,来抖音,记录美好生活!
杨植麟和梁文锋论文“撞车”-梁文峰参与Deepseek NSA论文发表...
杨植麟和梁文锋论文“撞车”deepseek model lifecycle. University of Washington Abstract Wangding Zeng Trainable Sparse Attention Native Sparse Atten - 龙哥搞算法于20250219发布在抖音,已经收获了9549个喜欢,来抖音,记录美好生活!
梁文锋、杨植麟论文“撞车”,直指算法优化,挑战ChatGPT核心机制...
元冷菱 [辽宁大连] 2025-02-19 22:08:34 梁文锋比马斯克更懂AI吗? 顶[2] 踩[0] 回复 收藏 分享 复制 上一页 1 2 下一页 最新跟贴(跟贴16条有83人参与) 火星网友 2025-02-21 15:12:03 讲人话,所谓的算法优化,就是在别人全局最优的基础上,加粗数据粒度,加大滤网孔径,减少滤网层次,只追求局部速度...
梁文锋、杨植麟同一天发论文“秀肌肉”,主题居然撞上了!-腾讯云...
2月 18 日,DeepSeek 和月之暗面(Moonshot AI)几乎在同一时间发布了各自最新的研究成果,巧合的是,两篇论文的主题高度一致——都聚焦于改进 Transformer 架构中最核心的注意力机制,旨在提升其处理长上下文的能力并降低计算成本。由此可见,大家都在争相研究如何让 AI 更好地处理长文本,这不仅说明了行业对高效处理长...
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布|注意力_新浪...
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚!DeepSeek 梁文锋亲自挂名,公开新注意力架构 NSA》。 但其实就在同一天,月之暗面也发布了一篇主题类似的论文,并且同样巧合的是,月之暗面创始人兼 CEO杨植麟也是该...
【撞车DeepSeek NSA Kimi杨植麟署名的新注意力架构MoBA发布】《科创...
【撞车DeepSeek NSA Kimi杨植麟署名的新注意力架构MoBA发布】《科创板日报》19日讯,2月18日,DeepSeek发布了一篇新论文,提出了一种改进版的注意力机制NSA,有创始人兼CEO梁文锋亲自参与。同一天,月之暗面发布了一篇主题类似的论文,月之暗面创始人兼CEO杨植麟也是该论文的署名作者之一。这篇论文提出了一种名为MoBA的...
36氪_让一部分人先看到未来
最具争议的捞女,被曝年入9亿15小时前 79 元的限量 " 剩菜盲盒 " 遭疯抢,这又是什么离谱操作?15小时前 第一批DeepSeek开发者,已经开始逃离了8小时前 杨植麟跟梁文锋,论文撞车12小时前 OpenAI 放开成人内容?体验新版 GPT-4o 后,我想再次感谢 DeepSeek12小时前 品牌专题...