DeepSeek问世后自研大模型还有必要吗

李开复:中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动三家...

当被问及在开源模式占据优势的当下，中国市场未来会跑出多少个AI大模型时，李开复坦言，未来中国大模型市场大概率会收拢至三家，DeepSeek、阿里巴巴和字节跳动，这三家公司的大模型会随着时间不断迭代进化，而在这三家公司中，他认为DeepSeek目前势头最强，这也是零一万物基于DeepSeek推出新产品的原因。“的确可能还有第...

DeepSeek+?深度求索 AI 赋能的客户体验管理新范式

讲到这里,你或许会困惑,在DeepSeek以"类人思维"刷新大模型认知的当下,自研大模型还有必要么?能不能直接使用DeepSeek这样的通用大模型来提升客户体验管理系统(CEM)的性能? 我们可以从以下四个方面来回应这些问题,数阔云听CEM未直接采用DeepSeek等通用大模型提升性能,而选择自研领域大模型,主要基于以下四方面原因: 领域...

DeepSeek这么好用,为什么手机厂商还要自研大模型?

也正因如此,手机厂商引入DeepSeek等通用大模型的同时,也仍有必要推进自研。一方面是出于保护用户隐私的考虑,承载健康监测、支付验证等敏感数据,另一方面还是成本压力。努比亚技术专家提到,尽管算力成本已经大幅降低,但现阶段需要借助云端算力,鉴于手机用户规模之大,跑起来同样是一笔不菲的数字,自研端侧模型能够承接部分高...

大模型的“挑战”是否已被DeepSeek解决?

综上所述，这些挑战正推动DeepSeek及整个国产大模型领域不断自我验证。未来，国内或许会涌现第二个“DeepSeek”。从现实角度看，DeepSeek的成功更多是必然，而非偶然。“开源时代”是否即将到来？相比于技术竞争，DeepSeek的崛起再次引发了全球科技界对开源与闭源模式的激烈讨论。Meta首席科学家杨立昆在社交平台上表示，...

...来了,人工智能时代商业银行加速“变形”_模型_DeepSeek_姚辉亚

财联社3月14日讯(记者郭子硕,罗克关)DeepSeek爆火之后,银行对大模型的应用正加速从技术探索转向场景落地,其对组织模式、人才储备等方面的影响也在显现。近日,微众银行宣布要从数字银行迈向AI原生银行,成为国内首家宣布向AI原生银行转型的商业银行。微众银行数字金融发展部负责人姚辉亚向财联社记者表示,所谓商业银行AI...

DeepSeek大模型专家交流

在应用或最终效果相对差不多情况下，对等算力DeepSeek训练模型最少需要15000到18000张H800。DeepSeek工程层面的巧思和低精度训练有较大影响，目前很多公司在预训阶段投重兵，后阶段投入相对较少，而DeepSeek可能在后学习阶段投入更多。单一一次模型训练成本不能说明太多问题，之前的科研投入后续可能也不会停。推理方面，...

DeepSeek来了,算力还重要吗?上海市政协委员:算力依旧是重要战略资源

自ChatGPT引发新一波人工智能热潮以来,全球人工智能产业一度形成了“堆算力”的路径依赖。然而,随着中国人工智能企业DeepSeek发布开源模型,通过优化算法降低算力需求,达到与ChatGPT比肩的性能。这也提出了新问题:推动人工智能产业发展,是否依旧有必要大规模投资算力?

...deepseek众生平权的时代里软件公司还有必要研究大模型吗?_财富...

1.做Ai智能体根本不要自研大模型,只要调用api即可,manus和新开普的智能体都是调用阿里和deepseek的api,或者本地部署deepseek调用,参见图1。 2.公司里做Ai智能体与大模型的是两个完全不同的团队。两个团队有一个共同点是都需要显卡。下面开始说大模型。

是否有必要部署本地DeepSeek大模型? - 知乎

对于普通打工人来说,部署本地DeepSeek大模型通常是不必要的。以下是对这一观点的详细分析: 一、成本与门槛硬件成本:本地部署需要购买高性能的服务器、显卡等硬件设备,这些设备的成本通常非常高,远远超出普通打工人的承受范围。软件授权与维护:除了硬件成本外,还需要考虑软件授权费用以及后续的维护费用。这些费用同样...

当我问deepseek:“现在考新传还有必要吗”

再综合来看,我们可以把deepseek回答内容分成两大部分,一个是它思考的过程,另一个是对提问者的回应内容。除了deepseek,没有任何一家AI会展示它的思考过程,因为这涉及到大模型的训练方法。简单来说就是核心技术。但deepseek的特殊之处就在于,它是开源一个开...

...超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家...

今天也是一个绝佳的时机来和您一起讨论,因为零一万物刚刚对外发布了“万智企业大模型一站式平台”,首发能帮助企业更广泛地部署、应用 DeepSeek 模型的解决方案。能不能请您详细介绍一下这项业务? 1 2 3 李开复:当 DeepSeek 问世的时候,中国迎来了自己的“ChatGPT 时刻”,我们可以称之为“DeepSeek 时刻”。在...

大厂拥抱DeepSeek 自家大模型去哪了 - 智能助手

各大互联网平台之所以愿意开放接入DeepSeek,很大程度上是由于其开源的属性和广泛的适用性。DeepSeek的开源策略降低了企业自研大模型的门槛和成本,使得更多企业能够享受到大模型带来的红利。大厂对自家大模型的态度:这并不意味着大厂们会完全放弃自家的大模型。实际上,大厂们在拥抱DeepSeek的同时,也在继续投入自研大...

DeepseekV3:开源大模型的“新里程碑”还是“过度宣传”?_腾讯新闻

结语:理性看待DeepseekV3的“革命性”标签 DeepseekV3的问世无疑为开源大模型生态注入了新的活力。其在STEM领域的突出表现和开源许可的灵活性为我们又提供了一个更新的选择。然而,要全面超越GPT-4o或其他专有模型,DeepseekV3仍需在逻辑推理、语言理解和多任务平衡等方面进一步提升。

李开复:中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动三家主要公...

他同时预测,中国市场最终可能只剩下DeepSeek(深度求索)、阿里巴巴和字节跳动三家主要的AI(人工智能)模型公司,其中DeepSeek目前势头最强。 “在多数市场中,大部分最后将以寡头局面收场。第一名赚了很多钱,第二名收支平衡,后头几名多半不能算是成功。在大模型的赛道中,由于底层模型很难直接转化为商业模式,所以情况...

DeepSeek冲击之下,大模型六小强如何「回应」?|百川|模态|kimi|云计算...

六小强中,没有任何一家站出来,正面表达对DeepSeek的看法。但这不代表它们没有行动——毕竟比起高谈阔论,落地的实际行动更值得用来证明。注:以下均为六小强1月20日(含)后的动态零一万物 DeepSeek-R1问世之前,创始人李开复博士已公开表示,零一万物将不再追求训练超级大模型。

全栈击穿,DeepSeek海啸来袭,对国内AI行业带来哪些冲击?

近日字节跳动CEO梁汝波在全员会上表示，2024年9月OpenAI发布长链思考模型o1模型成为行业热点后，字节意识到技术重大变化，但跟进速度不够，如果当时及时关注到，有机会更早实现。他表示，与创业公司相比，字节跳动在对待大模型新机会时的敏感度明显不足。月之暗面：多模态推理模型 k1.5同步推出 1月20日，与DeepSeek ...

破壁者DeepSeek:普通人也能用,证明大模型≠大投入

“以前如果说OpenAI是‘大力出奇迹’，那么DeepSeek就是‘巧力也可以出奇迹’。”快思慢想研究院院长田丰告诉南方+记者，自ChatGPT问世以来，在人工智能科研领域，全世界普遍遵循着大语言模型中的第一性原理：尺度定律。简言之，算力越强，大模型越强。但是自去年年中以来，当技术迭代到ChatGPT4之后，由算力堆积的...

...算力行情转向业绩驱动大模型还有很长的路要走_DeepSeek_公司...

“互联网平台公司的价值,相对来说,跟DeepSeek的推出关系没那么大,他们本身也是按照前述的路径在走。不过DeepSeek问世后,拉低了大模型应用的门槛,使得各方参与者无需像海外公司此前的路径一样,需要非常多的投资才能参与。开源带来技术的平权和扩散,使得受益面变宽,不再是只有前期砸钱多的公司受益,可能前期砸钱少...

DeepSeek引发算力怀疑论,英伟达股价大跌超10%,大模型不再需要堆...

国产“大模型之光”DeepSeek正在AI圈引发巨大的冲击波,并在华尔街引发震动。 1月27日美股盘前,英伟达、ASML、台积电、博通等多家芯片股大跌。开盘后,依然延续走低态势,截止发稿,英伟达、台积电、博通等均跌超10%,其中英伟达跌超12%,相当于市值跌去超过4000亿美元。