蚂蚁自研2900亿大模型用国产AI芯片训练，计算成本508万元低于DeepSeek｜钛媒体AGI

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于Deep...

3月24日消息，钛媒体AGI获悉，近日，蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队，利用AI Infra技术，开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus，前者参数规模168亿，Plus基座模型参数规模高达2900亿，相比之下，AI行业估计GPT-4.5参数量1.8万亿，DeepSeek-R1参数规模达6710亿。同时，论文...

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek...

随着DeepSeek引发 AI 算力优化热潮,蚂蚁集团全面发力 AI 技术,基于中国AI芯片进行Infra,实现了模型技术突破。 3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模...

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于Deep...

3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。同时,论文显示,蚂蚁团...

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于Deep...

3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。同时,论文显示,蚂蚁团...

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于Deep...

随着DeepSeek引发 AI 算力优化热潮,蚂蚁集团全面发力 AI 技术,基于中国AI芯片进行Infra,实现了模型技术突破。 3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模...

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于Deep...

随着DeepSeek引发 AI 算力优化热潮,蚂蚁集团全面发力 AI 技术,基于中国AI芯片进行Infra,实现了模型技术突破。 3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模...

蚂蚁自研2900亿大模型用国产AI芯片完成高效训练

蚂蚁自研2900亿大模型用国产AI芯片完成高效训练据证券时报，近日，蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示，蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），前者参数规模为168亿（激活参数27.5亿），Plus基座模型参数规模高达2900亿（激活参数288亿），...

蚂蚁集团,AI重大突破!

蚂蚁集团使用国产AI芯片训练大模型，成本可进一步降低。近日，蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示，蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），前者参数规模为168亿（激活参数27.5亿），Plus基座模型参数规模高达2900亿（激活参数288亿），两者...

蚂蚁集团,AI重大突破!_凤凰网

蚂蚁集团使用国产AI芯片训练大模型,成本可进一步降低。近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业...

...独角兽,唯一AI算力芯片供应,A股仅此一家!_DeepSeek_训练_模型

国产大模型DeepSeek以超低成本媲美OpenAI大模型! 一、成本比较 DeepSeek-R1的预训练费用仅为557.6万美元,这一数字相较于OpenAI GPT-4o模型的高昂训练成本显得尤为突出。据估计,GPT-4o模型的训练成本可能高达数千万美元至1亿美元不等。DeepSeek之所以能够实现如此低的训练成本,主要得益于其创新的训练方法和对硬件资...

2900亿背后:软银豪赌、DeepSeek崛起,AI格局巨变!

说起这事，还真得佩服孙正义的眼光和魄力。但OpenAI如此吸金，真的是高枕无忧了么，国产AI力量DeepSeek可不答应。这款开源模型，训练成本只有OpenAI的不到十分之一，但效果却能跟它硬碰硬，丝毫不落下风，牛不牛？你可以想下，为什么他可以如此的强悍？想当初，DeepSeek刚出来的时候，OpenAI的大当家奥特曼还有点...

腾讯、华为等接入DeepSeek每月亏损超4亿,MaaS模型即服务将要被...

IDC中国研究经理程荫对钛媒体AGI表示,一方面,DeepSeek通过算法优化和高效训练,降低 AI 技术门槛,支持中小企业在云平台微调,降低算力门槛,推动 MaaS 模式变革,云厂商服务转型,既降成本又增强模型灵活性;另一方面,未来开源和商业大模型将差异化竞争,企业和个人用户选择时考量因素众多,所以现在判断谁会被取代还太早,但对中...

国产AI大模型DeepSeek冲破封锁全球刷屏,成本仅为GPT的1/20|deepseek...

其训练费用相比GPT-4o等大模型要少得多。Open AI CEO山姆·奥特曼曾表示,GPT-4o的训练成本大约1亿美元,未来训练大模型的成本将高于10亿美元。尚未完成训练的GPT-5大模型,为时约半年的一轮训练就消耗了大约5亿美元。消息一出,引发了海外AI圈热议。Open AI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在...

中国国产大模型颠覆外媒认知,Deepseek火了,英伟达的天塌了

美国在AI的固有认知下，一直沿袭着堆算力堆GPU的路子在发展AI大模型。与此同时，不断在AI领域卡中国的脖子，中国企业越来越难获得高性能AI芯片。只能使用价格高昂、性能低下的阉割版AI芯片，在这种固有认知下，认为这不但极大推高了中国人工智能企业的成本，还会让中美两国相关企业的差距越拉越大。但如今，DeepSeek-...

国产AI强势突围?DeepSeek引发算力变局,ASIC芯片崭露头角

低成本是AI推理爆发的必要前提，而通用GPU芯片却成为AI发展的“黄金枷锁”。英伟达的H100和A100堪称大模型训练的“王者”芯片，就连B200、H200也备受科技巨头青睐。《金融时报》援引Omdia数据显示，2024年，英伟达Hopper架构芯片的主要客户包括微软、Meta、Tesla/xAI等，微软的订单量更是高达50万张。然而，作为通用GPU领域...

DeepSeek让硅谷恐惧!中国AI震惊世界

这些年人工智能领域的竞争其实都是换汤不换药，各大公司拼命争夺算力资源，所以掌握算力硬件的英伟达成了大赢家。DeepSeek大幅降低大模型训练成本以前大家一直认为算力是限制模型发展的关键因素，训练大型语言模型简直就是个烧钱的游戏。听说OpenAI为了训练GPT-4，投入的成本高达10亿美元。这么高的成本让AI行业变成了有钱...

国产AI大模型:DeepSeek产业链全解析!_ai大模型产业链-CSDN博客

去年12月底,DeepSeek发布的DeepSeek-V3开源基础模型性能,与GPT-4o和ClaudeSonnet3.5等顶尖模型相近,但训练成本极低。整个训练在2048块英伟达H800GPU集群上完成,仅花费约557.6万美元,不到其他顶尖模型训练成本的十分之一。 1月20日,DeepSeek发布DeepSeek-R1模型,并同步开源模型权重。该模型在后训练阶段大规模应用了...

转自Wind:《蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元...

转自Wind:《蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek》,链接: 全部讨论诚觉世事皆可原谅t 5分钟前链接点不开啊明月下凡 37分钟前 @但斌你认为片仔癀怎么样,业务模式简单,壁垒也很高,国家背书,绝密配方,海外销量也很好

中国AI黑马1/8成本碾压硅谷!Deepseek掀翻英伟达"算力王座",天真的...

"我们可能正在见证英伟达帝国的黄昏。"——2024年3月,Meta首席AI科学家杨立昆(Yann LeCun)在内部会议上的发言截图突然疯传网络。事件的导火索,正是中国AI公司深度求索(Deepseek)的最新战绩:其开源的DeepSeek-V3模型在斯坦福大学组织的基准测试中,以1/8的训练成本完胜Meta耗资2.3亿美元打造的Llama 4。当《华尔街日报...

DeepSeek打响第一枪,现在轮到国产芯片跟上了|万有AI力

这意味着大模型训练不一定需要使用大量英伟达GPU。DeepSeek的技术报告也引起了一些讨论，例如大模型团队对芯片硬件算力的深度挖掘，或提供了一条低成本、可绕开芯片算力限制的路线。DeepSeek使用了诸多方法挖掘了既有芯片的潜在算力。惊叹过后，AI业界和学界的分析趋于冷静。DeepSeek对既有芯片潜在算力的挖掘到什么样的...