杨植麟摸着DeepSeek过河

此前，Kimi在海外知名度有限，但K2的爆火已经带来实在的回报：全球开发者圈子里开始关注起Kimi，有人开始研究CEO杨植麟的过往经历。开发者们喜欢这个充满朋克文化的团队——Kimi团队成员在小红书、推特展示公司里以传奇乐队命名的会议室，也会在Twitter坦承“现在K2还不完美，infra还有很多不足，正在加班加点修复

梁文锋等来及时雨

R1发布近半年来,动作寥寥的DeepSeek,不可避免陷入不进则退的现实困境之中。在国内其他大模型玩家卯足劲头追平乃至超过DeepSeek模型性能之际,梁文锋只是带领团队出着一些小招式,如DeepSeek V3模型完成小版本升级,上线新版本DeepSeek-V3-0324,随后又更新了以DeepSeek-V3为基础模型微调而来的DeepSeek-Prover-V2——一...

杨植麟摸着DeepSeek过河

开源价值：DeepSeek证明了开源模型的价值，以及底层模型能力在竞争中的核心地位。Kimi借鉴DeepSeek的开源策略，通过K2模型吸引开发者社区。性价比优势：DeepSeek以低成本高性能的模型打破市场格局，迫使其他厂商（如Kimi）在性价比上展开竞争。Kimi的战略调整技术追赶：Kimi在DeepSeek崛起后，意识到C端应用的局限性，转而...

...万亿参数开源大模型,停止投流的杨植麟不想输|AI_新浪财经_新浪网

摸着DeepSeek过河,杨植麟不想下牌桌根据月之暗面目前发布的技术博客,Kimi K2性能的进步主要得益于三个方面的技术探索。一是在预训练的算法创新。月之暗面透露,Kimi K2预训练阶段创新性地使用了Muon优化器,从而在15.5T token数据集上实现了万亿参数模型的稳定高效训练。这抛弃了传统模型大规模使用的Adam优化器,K...

Kimi和DeepSeek又又又杠上了?

现在杭州城里就有DeepSeek和通义千问两家盯着，北京还有Kimi在憋大招，这场面像极了当年团购网站的＂百团大战＂。王坚有句话说得在理：＂先别管大模型能做什么，摸着石头过河才是正经。＂只是不知道最后摸到对岸的，会是现在牌桌上的哪几位？反正吃瓜群众已经准备好小板凳了。

site:pnptecn,科技创新推动绿色能源发展进程-今日发布

摸着DeepSeek过河的一众国产大模型玩家,纷纷在模型性价比上完成了抢跑。对比国外的OpenAI,尽管各家也都在推出各类平替模型,但OpenAI的总调用量依然保持稳定的秘诀,主要在于其在基础模型能力上依然保持着行业头部的水平,始终领先着竞争对手将近一代的差距。相比之下,DeepSeek爆火出圈的R1,也只是做到了比肩o1的水平,而...

梁文锋、杨植麟论文“撞车”,直指算法优化,挑战ChatGPT核心机制...

梁文锋、杨植麟论文“撞车”，直指算法优化，挑战ChatGPT核心机制！风投公司RAI Digital联合创始人：AI无需读完整本书，将更快、更高效梁文锋图片来源：视觉中国北京时间2月18日，在马斯克还在庆祝Grok 3模型正式发布的时候，DeepSeek官方在社交平台X上发布了一篇纯技术论文，主要是关于原生稀疏注意力（Native Sparse ...

...万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手...

Kimi K2的发布,是杨植麟在给月之暗面调整方向后,交出的一份重要答卷。 DeepSeek出现证明了开源的价值以及底层模型能力依然是竞争的基石,它甚至会“摧毁”在模型单一能力上优化并用在c端产品里然后快速推广的竞争策略。之后Kimi开始在技术上全线转向预训练,并步步紧跟DeepSeek。2025年2月,两家几乎同时发表论文,挑战...

对话杨植麟:真正伟大的公司需要人文底蕴,而不仅是技术和产品|中国...

无论是大厂还是创业公司，未来都还有机会。DeepSeek的奇迹本身就是最好的说明：大模型不存在忠诚度，用户随时会用脚投票，选择更好用更智能的AI产品。杨植麟幸运之处在于，为月之暗面搭建了一个价值观接近、结构稳定的200人左右的技术人才组织。这构成了公司核心价值，保证了其还能提供持续的创新能力。在杨植麟看来，...

杨植麟 - 百度百科

杨植麟，男，出生于1992年，广东汕头人，大模型企业月之暗面（Moonshot AI）创始人，清华大学助理教授，2019年度北京智源青年科学家，上海期智研究院PI。杨植麟本科毕业于清华大学计算机系，博士毕业于卡内基梅隆大学计算机学院。曾效力于全球顶级人工智能机构Facebook AI Research, Google Brain；于ICLR、NIPS、ICML、...

杨植麟和闫俊杰首次“撞车”,MiniMax视频模型价格一年超万元

据笔者了解，月之暗面也在考虑IPO上市或其他资本化事宜。早前有报道指出，杨植麟已在内部定下通用AI模型目标，减少投流而把更多资源转向AI模型技术能力迭代。很显然，大家都想对标DeepSeek。笔者了解到，近期智谱也将推出新技术产品，依然瞄准DeepSeek。六小虎抢大模型第一股，今年上半年A股IPO融资增长14% 2023年上半年，百川

Kimi杨植麟该为“重投放”反思吗?

“没有人提杨植麟了，Kimi花了这么多钱买用户也买不过豆包，到头来都敌不过界面简陋、功能单一的DeepSeek。还是应该把精力和资源集中在做出更好的基础模型才是王道。”这番话，来自Kimi大股东阿里旗下某智能协作产品负责人。算是近期关于杨植麟与Kimi讨论的代表性声音。肉眼可见，DeepSeek的爆发，给了C端市场上的AI...

DeepSeek越强,Kimi越慌? 被DeepSeek吊打的Kimi,还有多少人在用?去年...

曾经烧钱换增长的逻辑,开始崩盘。杨植麟的困局,比所有人预想的都来得更快。今年以来,Kimi似乎要在基础模型和垂直应用上搞点事情,这被外界视为要硬刚DeepSeek,冲出困局。这一次,Kimi能赢吗? 为何烧钱大法不灵了? 2024年,Kimi的广告投放堪称疯狂。

梁文锋、杨植麟论文 “撞车”,DeepSeek走红,月之暗面尴尬

在AI领域，技术创新与突破一直是各大厂商与研究机构竞相追逐的焦点。近日，两位技术大佬——DeepSeek的梁文锋与月之暗面的杨植麟，因各自发表的论文“撞车”而引发业界广泛关注。与此同时，DeepSeek的迅速崛起更是让月之暗面陷入了尴尬境地，甚至有消息称月之暗面已大幅降低广告投放。论文“撞车”：技术路线的殊途同归...

DeepSeek梁文锋和Kimi杨植麟 - 知乎

继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。 4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证明专用模型。 Prover-V2的参数规模进一步扩展到671B(6710亿规模参数),相较于前一代V1.5版本的7B规模增加了近百倍,这让其在数学测试集上的效率和正确率更高,比如,该模型...

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA-CSDN博客

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA 鱼羊雷刚发自纽凹非寺量子位 | 公众号 QbitAI 172天过去,Kimi在深夜低调给出了DeepSeek冲击波后的回应。全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。

Kimi和DeepSeek又又又撞车?

“Kimi作为闭源模型，想要去证明自己的能力，打榜是一个很重要的途径，这也是为什么之前杨植麟会带队上场”，多位行业人士对凤凰网科技表示，“早就听说Kimi回归基模了”。而入局垂类赛道，同样不失为一种提升模型能力，减少幻觉的有效手段之一。在新的对垒格局下，Kimi仍在努力留在牌桌上。再度撞车DeepSeek 颇为巧合...

杨植麟翻身,还要靠OpenAI DeepSeek生态已然形成,步入重投放歧路的Ki...

著名投资人朱啸虎在访谈中曾提到,DeepSeek爆火之后,即便是如豆包等大厂,也不好追赶,用户心智一旦形成,再进行市场教育,难度太大。 Kimi未来还能够翻盘吗?从公司发展路径上来看,并非没有可能。作为曾经对OpenAI技术跟随最快的公司,Kimi在去年做出了Kimi探索版、k0-math等多个跟随OpenAI技术的模型,而杨植麟本人也在采访...

撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布

但其实就在同一天，月之暗面也发布了一篇主题类似的论文，并且同样巧合的是，月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。并且不同于 DeepSeek 只发布了一篇论文，月之暗面还发布了相关代码。且这些代码已有一年的实际部署验证，有效性和稳健性都有保证。这篇论文提出了一种名为 MoBA 的注意力机制，...

被DeepSeek吓坏?杨植麟的KIMI 决定不烧钱了

因为杨植麟之前在循环智能干过，后来离职重新创业，原来的股东觉得他没有得到豁免，伤害了股东利益。杨植麟自然予以否认，但这个争议至今还没有结局。过去，KIMI最引人注目的头衔。就是最早支持长本文和清华学霸团队出品。但如今长文本能力已经被minimax反超，清华学霸也不如浙大学霸的DeepSeek出圈。毕竟都是AI时代的创业...