杨植麟摸着DeepSeek过河
此前,Kimi在海外知名度有限,但K2的爆火已经带来实在的回报:全球开发者圈子里开始关注起Kimi,有人开始研究CEO杨植麟的过往经历。开发者们喜欢这个充满朋克文化的团队——Kimi团队成员在小红书、推特展示公司里以传奇乐队命名的会议室,也会在Twitter坦承“现在K2还不完美,infra还有很多不足,正在加班加点修复
梁文锋等来及时雨
R1发布近半年来,动作寥寥的DeepSeek,不可避免陷入不进则退的现实困境之中。 在国内其他大模型玩家卯足劲头追平乃至超过DeepSeek模型性能之际,梁文锋只是带领团队出着一些小招式,如DeepSeek V3模型完成小版本升级,上线新版本DeepSeek-V3-0324,随后又更新了以DeepSeek-V3为基础模型微调而来的DeepSeek-Prover-V2——一...
杨植麟摸着DeepSeek过河
开源价值:DeepSeek证明了开源模型的价值,以及底层模型能力在竞争中的核心地位。Kimi借鉴DeepSeek的开源策略,通过K2模型吸引开发者社区。性价比优势:DeepSeek以低成本高性能的模型打破市场格局,迫使其他厂商(如Kimi)在性价比上展开竞争。Kimi的战略调整 技术追赶:Kimi在DeepSeek崛起后,意识到C端应用的局限性,转而...
...万亿参数开源大模型,停止投流的杨植麟不想输|AI_新浪财经_新浪网
摸着DeepSeek过河,杨植麟不想下牌桌 根据月之暗面目前发布的技术博客,Kimi K2性能的进步主要得益于三个方面的技术探索。 一是在预训练的算法创新。月之暗面透露,Kimi K2预训练阶段创新性地使用了Muon优化器,从而在15.5T token数据集上实现了万亿参数模型的稳定高效训练。 这抛弃了传统模型大规模使用的Adam优化器,K...
Kimi和DeepSeek又又又杠上了?
现在杭州城里就有DeepSeek和通义千问两家盯着,北京还有Kimi在憋大招,这场面像极了当年团购网站的"百团大战"。王坚有句话说得在理:"先别管大模型能做什么,摸着石头过河才是正经。"只是不知道最后摸到对岸的,会是现在牌桌上的哪几位?反正吃瓜群众已经准备好小板凳了。
site:pnptecn,科技创新推动绿色能源发展进程-今日发布
摸着DeepSeek过河的一众国产大模型玩家,纷纷在模型性价比上完成了抢跑。对比国外的OpenAI,尽管各家也都在推出各类平替模型,但OpenAI的总调用量依然保持稳定的秘诀,主要在于其在基础模型能力上依然保持着行业头部的水平,始终领先着竞争对手将近一代的差距。 相比之下,DeepSeek爆火出圈的R1,也只是做到了比肩o1的水平,而...
梁文锋、杨植麟论文“撞车”,直指算法优化,挑战ChatGPT核心机制...
梁文锋、杨植麟论文“撞车”,直指算法优化,挑战ChatGPT核心机制!风投公司RAI Digital联合创始人:AI无需读完整本书,将更快、更高效 梁文锋 图片来源:视觉中国 北京时间2月18日,在马斯克还在庆祝Grok 3模型正式发布的时候,DeepSeek官方在社交平台X上发布了一篇纯技术论文,主要是关于原生稀疏注意力(Native Sparse ...
...万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手...
Kimi K2的发布,是杨植麟在给月之暗面调整方向后,交出的一份重要答卷。 DeepSeek出现证明了开源的价值以及底层模型能力依然是竞争的基石,它甚至会“摧毁”在模型单一能力上优化并用在c端产品里然后快速推广的竞争策略。 之后Kimi开始在技术上全线转向预训练,并步步紧跟DeepSeek。2025年2月,两家几乎同时发表论文,挑战...
对话杨植麟:真正伟大的公司需要人文底蕴,而不仅是技术和产品|中国...
无论是大厂还是创业公司,未来都还有机会。DeepSeek的奇迹本身就是最好的说明:大模型不存在忠诚度,用户随时会用脚投票,选择更好用更智能的AI产品。杨植麟幸运之处在于,为月之暗面搭建了一个价值观接近、结构稳定的200人左右的技术人才组织。这构成了公司核心价值,保证了其还能提供持续的创新能力。在杨植麟看来,...
杨植麟 - 百度百科
杨植麟,男,出生于1992年 ,广东汕头人,大模型企业月之暗面(Moonshot AI)创始人 ,清华大学助理教授,2019年度北京智源青年科学家,上海期智研究院PI。杨植麟本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾效力于全球顶级人工智能机构Facebook AI Research, Google Brain;于ICLR、NIPS、ICML、...
杨植麟和闫俊杰首次“撞车”,MiniMax视频模型价格一年超万元
据笔者了解,月之暗面也在考虑IPO上市或其他资本化事宜。早前有报道指出,杨植麟已在内部定下通用AI模型目标,减少投流而把更多资源转向AI模型技术能力迭代。很显然,大家都想对标DeepSeek。笔者了解到,近期智谱也将推出新技术产品,依然瞄准DeepSeek。六小虎抢大模型第一股,今年上半年A股IPO融资增长14% 2023年上半年,百川
Kimi杨植麟该为“重投放”反思吗?
“没有人提杨植麟了,Kimi花了这么多钱买用户也买不过豆包,到头来都敌不过界面简陋、功能单一的DeepSeek。还是应该把精力和资源集中在做出更好的基础模型才是王道。”这番话,来自Kimi大股东阿里旗下某智能协作产品负责人。算是近期关于杨植麟与Kimi讨论的代表性声音。肉眼可见,DeepSeek的爆发,给了C端市场上的AI...
DeepSeek越强,Kimi越慌? 被DeepSeek吊打的Kimi,还有多少人在用?去年...
曾经烧钱换增长的逻辑,开始崩盘。杨植麟的困局,比所有人预想的都来得更快。 今年以来,Kimi似乎要在基础模型和垂直应用上搞点事情,这被外界视为要硬刚DeepSeek,冲出困局。 这一次,Kimi能赢吗? 为何烧钱大法不灵了? 2024年,Kimi的广告投放堪称疯狂。
梁文锋、杨植麟论文 “撞车”,DeepSeek走红,月之暗面尴尬
在AI领域,技术创新与突破一直是各大厂商与研究机构竞相追逐的焦点。近日,两位技术大佬——DeepSeek的梁文锋与月之暗面的杨植麟,因各自发表的论文“撞车”而引发业界广泛关注。与此同时,DeepSeek的迅速崛起更是让月之暗面陷入了尴尬境地,甚至有消息称月之暗面已大幅降低广告投放。论文“撞车”:技术路线的殊途同归...
DeepSeek梁文锋和Kimi杨植麟 - 知乎
继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。 4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证明专用模型。 Prover-V2的参数规模进一步扩展到671B(6710亿规模参数),相较于前一代V1.5版本的7B规模增加了近百倍,这让其在数学测试集上的效率和正确率更高,比如,该模型...
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA-CSDN博客
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA 鱼羊 雷刚 发自 纽凹非寺 量子位 | 公众号 QbitAI 172天过去,Kimi在深夜低调给出了DeepSeek冲击波后的回应。 全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。
Kimi和DeepSeek又又又撞车?
“Kimi作为闭源模型,想要去证明自己的能力,打榜是一个很重要的途径,这也是为什么之前杨植麟会带队上场”,多位行业人士对凤凰网科技表示,“早就听说Kimi回归基模了”。而入局垂类赛道,同样不失为一种提升模型能力,减少幻觉的有效手段之一。在新的对垒格局下,Kimi仍在努力留在牌桌上。再度撞车DeepSeek 颇为巧合...
杨植麟翻身,还要靠OpenAI DeepSeek生态已然形成,步入重投放歧路的Ki...
著名投资人朱啸虎在访谈中曾提到,DeepSeek爆火之后,即便是如豆包等大厂,也不好追赶,用户心智一旦形成,再进行市场教育,难度太大。 Kimi未来还能够翻盘吗?从公司发展路径上来看,并非没有可能。作为曾经对OpenAI技术跟随最快的公司,Kimi在去年做出了Kimi探索版、k0-math等多个跟随OpenAI技术的模型,而杨植麟本人也在采访...
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布
但其实就在同一天,月之暗面也发布了一篇主题类似的论文,并且同样巧合的是,月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。并且不同于 DeepSeek 只发布了一篇论文,月之暗面还发布了相关代码。且这些代码已有一年的实际部署验证,有效性和稳健性都有保证。这篇论文提出了一种名为 MoBA 的注意力机制,...
被DeepSeek吓坏?杨植麟的KIMI 决定不烧钱了
因为杨植麟之前在循环智能干过,后来离职重新创业,原来的股东觉得他没有得到豁免,伤害了股东利益。杨植麟自然予以否认,但这个争议至今还没有结局。过去,KIMI最引人注目的头衔。就是最早支持长本文和清华学霸团队出品。但如今长文本能力已经被minimax反超,清华学霸也不如浙大学霸的DeepSeek出圈。毕竟都是AI时代的创业...