从数十亿到几百万，vivo副总裁揭开DeepSeek如何终结大模型“军备赛”

DeepSeek的崛起如何改变军事AI领域的格局与影响?

一、DeepSeek的技术优势与军事AI变革DeepSeek，这家中国人工智能领域的佼佼者，其自主研发的大模型DeepSeek-R1在众多国际评测中脱颖而出，展现了令人瞩目的技术实力。这一突破性成就标志着中国在人工智能领域迈出了坚实的一步。DeepSeek不仅以其低成本、高效能及开源特性为军事AI的发展注入了新动力，更在多个方面带来了深远

DeepSeek梁文锋:从10万人民币到千亿美金,他凭啥打破行业桎梏...

2023年5月,幻方量化推出了DeepSeek,2024年底,DeepSeek凭借V3模型引起轰动。据2024年底发布的DeepSeek V3技术报告显示,DeepSeek-V3仅使用了2048块英伟达H800 GPU,耗费了557.6万美元就完成了训练,相比同等规模的模型(如GPT-4、GPT-4o、Llama 3.1),相比之下,Open AI和谷歌训练同等规模的AI模型所花费的费用要高出约...

100款产品接入VS巨头围剿:DeepSeek离“中国版安卓”还有多远? - 知...

由于DeepSeek已开源,以华为云、天翼云、联通云、移动云等为代表的政务云纷纷争先恐后地接入DeepSeek模型。剁椒Spicy体验后发现,云服务平台提供的DeepSeek模型,响应速度和稳定性确实优于DeepSeek官网,几乎没有遇到“服务器繁忙,请稍后再试”的现象。值得注意的是,目前不光缺乏自研大模型的政务云对DeepSeek持开放态度,阿...

DeepSeek:中国AI如何以“丁元英式”战略撕裂万亿资本泡沫

1.DeepSeek的“技术降维打击”DeepSeek通过混合专家模型（MoE）、强化学习优化和8位浮点计算等创新，仅用2048颗英伟达H800GPU（成本约560万美元）便训练出性能对标GPT-4o的模型，效率提升高达40-50倍。这种“以小搏大”的技术路径，直接挑战了OpenAI等企业依赖数万颗高端GPU和数十亿美元投入的资本密集型模式。正如《...

对话vivo OS 产品副总裁:AI 不会产生新的需求,通往远方是马车还是...

当 DeepSeek 出来之后，对于千亿大模型一下就把大家拉齐了，因为 DeepSeek 做了很了不起的事情是完全开源的，而且可以让我们满血部署。vivo 的蓝心小 v 中有深度思考的模式，其实它是一个满血版的 DeepSeek。这就让我们觉得可以一下拿到很好的大模型。对于我们这种自己做模型的公司有什么好处呢？就是辅助我们的...

(转载)DeepSeek的终局剖析,大模型赛道机遇与挑战 - 知乎

在大模型技术飞速发展的浪潮中,DeepSeek以其独特的技术路径和发展策略,迅速在市场中占据了一席之地,吸引了众多关注的目光。然而,深入剖析其发展态势,从行业影响、落地困境、发展疲软迹象、与Qwen3的竞争对比…

万字深度解析:DeepSeek-V3为何成为大模型时代的"速度之王"?引言...

在AI军备竞赛白热化的2024年,DeepSeek-V3以惊人的推理速度震撼业界:相比前代模型推理速度提升3倍,训练成本降低70%。这背后是十余项革命性技术的叠加创新,本文将为您揭开这艘"AI超跑"的性能密码。 DeepSeek-V3的技术路径证明:计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作,恰似人脑神经网络的模...

强大且廉价!DeepSeek崛起,重塑大模型格局?

“花小钱，办大事”的DeepSeek，首先引发的是硅谷大厂的担心：一旦这种模式大规模推广，以往靠“堆算力”提高模型精度的“军备竞赛”将可能被证伪，进而带崩一众大厂的股价，不可等闲视之！随着大模型的竞争越来越卷，去年OpenAI、Meta、Google以及马斯克的xAI，各大AI巨头都开始打造自己的万卡（GPU）集群，万卡集群似乎...

DeepSeek“朋友圈”的B面:抢入口争流量开打算力战

“自供血、对外租赁，云厂商有自己的业务闭环”。联想控股副总裁于浩告诉「硅基研究室」。其次，在战略层，借自有云业务，BAT和字节跳动借DeepSeek可以达成两大意图：一是通过DeepSeek这一超级流量入口，与自身产品协同，短期承接DeepSeek的流量。二是有助于鞭策内部团队，在对比中提升自身模型能力。前者更像是移动互联...

观察|人工智能大爆发,手机厂商如何找准自己的定位,端侧会是突破口...

他谈及DeepSeek大模型出来后对vivo这类既要做模型训练又要做优化的公司来说是极大的帮助和提升。 “各家都在卷千亿参数的大模型,耗资巨大,对很多公司都是很大的压力。当DeepSeek出来之后,一下子把千亿大模型参数拉齐了,现在vivo也用DeepSeek来辅助蒸馏学习自己的模型。”周围表示。

...文:互联网江湖作者:刘致呈刚刚,vivo宣布有大动作。在博鳌亚洲论坛...

DeepSeek时代,家庭机器人这个新赛道里,需要vivo来做领头羊的角色。作为最擅长用成熟产品打开市场的巨头之一,vivo下场的能量,足以撬动整个行业,此番躬身入局,受益的将是整个机器人赛道。 vivo“追本溯源”,科技的原点是“大写的人” “科技的高度,终须回归人的尺度。”vivo执行副总裁胡柏山说。 vivo做手机,做

大模型专家解读Deepseek

二是对大模型技术理解到位，进行全面系统的优化。在大模型常规三要素（算法、算力、数据）之外，从更多细节全方位优化，如在算力方面，从软件算法层面进行实时感知和调度，不仅用于推理层面还横向应用到训练层面，甚至对底层的ASIC块进行调度。Q：DeepSeek作为一个几百人的小规模公司，为什么能完成大模型研发这样复杂的...

DeepSeek引爆外资加仓潮:中国AI技术突破如何重塑全球资本格局

低成本AI模型打破海外芯片垄断 DeepSeek的开源大语言模型正在改写全球AI竞赛规则。标普全球评级指出，其算法优化将企业开发AI的成本从"数十亿美元军备竞赛"降至普惠水平，更关键的是证明了低阶芯片同样能训练优质模型。这一突破直接冲击了英伟达高阶芯片的垄断地位，知乎因接入DeepSeek的R1模型单日股价暴涨14%，直观展现...

DeepSeek杀疯了!国产AI大模型如何重构未来技术版图?【导读】当...

国产AI大模型如何重构未来技术版图? 【导读】当ChatGPT还在为每月10亿访问量沾沾自喜时,中国AI军团已悄然完成弯道超车。2025年开年,DeepSeek以雷霆之势横扫中美应用商店双榜,这场技术革命背后,究竟藏着怎样的破局密码? 一、现象级爆发:当技术突破遇见市场痛点...

Deep Seek爆火后,AI军备竞赛2.0要来了吗?_澎湃号·湃客_澎湃新闻...

毕竟除DeepSeek-V3外,在两个月内研发、基础计算能力投资不到600万美元的DeepSeek-R1同样可以和那些花费数亿、数十亿美元所研发的模型“掰掰手腕”。再一次用实力证明了“足够精巧的算法”可以实现性能与成本的平衡,让人工智能模型的开发成本不再以“亿”为单位。

全球打响AI军备赛

因为DeepSeek-R1的模型在各项能力上追平OpenAI o1，但总训练成本仅为557.6万美元；而GPT-4o模型训练成本约为1亿美元。于是世界开始真正意识到，中国在AI大模型领域的爆发性潜质——即使在资源极其受限的情况下，中国也能通过调整大模型基础结构，创造自己的大模型。随后，多个国家展现出“恐慌”的一面：澳大利亚国库...

DeepSeek赋能潮起如何理解其创新价值

中国电信股份有限公司杭州分公司云计算运营中心副经理王少龙2月初发现,集团在北京、上海的“万卡池”迅速销售一空。 “近期国内企业大量租用先进算力,部署DeepSeek大模型,以此训练自己的行业小模型。”他说。一时间,几乎国内所有主流云厂商都全面接入DeepSeek,以响应公...

DeepSeek爆火28天,国内大模型同行都在干什么?

与DeepSeek不构成直接竞品关系的手机品牌，更是无所顾虑地在自家AI助手中提供DeepSeek模型选项。八大手机品牌华为、荣耀、OPPO、vivo、魅族、努比亚、红魔、联想摩托罗拉，均已宣布将AI助手接入DeepSeek-R1。小米也在2月14日被曝对小米澎湃OS2的超级小爱说“打开深度思考”能使用DeepSeek-R1，而后该功能暂时下线。 ...

...仅用了一年时间。DeepSeek R1的开源,几乎拉齐了中美大... - 雪 ...

但一个显而易见的现实是,大多数量化私募目前并没有足以支撑做大模型的算力。大模型的算力门槛相当之高。幻方是全国为数不多万卡集群的公司,2021年,幻方对「萤火2号」AI集群投入10亿,搭载了1万张A100显卡。2024年,DeepSeek V3官方报告训练大模型使用了2048块H800 GPU集群。中存算董事长陈巍测算,幻方实际的卡数...