盘古负责人遭炮轰:使用英伟达芯片,剽窃同事技术,套壳外部模型|...
华为规定大模型必须用自家昇腾芯片训练,王云鹤却偷偷用英伟达芯片——就像规定必须用国产面粉做馒头,他偏要用进口面粉,蒸出来还喊“纯国产馒头”。 真正的盘古团队熬了两年,把昇腾芯片的坑全踩平了,结果他坐享其成,用英伟达跑出来的结果邀功。有AI工程师爆料:“昇腾训练要调一堆参数,英伟达现成的框架能用,他这是躺赢还抢功。” 学
华为盘古风暴升级:吹哨人再发《讨贼檄文》,实锤细节公开
讽刺二重奏:在别人还在调试昇腾芯片、踩坑 MindSpore 的时候,王云鹤的团队早已在用别人训练好的模型,准备直接去开发布会了。更大的冲击则是人才流失。据指控文透露,因不满王的“套壳行为”,已有超过 40 人先后离职,包括数位核心预训练成员、数名 17/18 级干部。有人说,这可能是华为有史以来最严重的一次 ...
大瓜!华子员工曝盘古大模型套壳造假_华为_诺亚_苏州
同时鉴于tokenizer的一些失败和换词表的经验,这个模型的词表也更换为了王云鹤的小模型实验室7B模型所使用的词表。后面这个13B模型进行了扩增续训,变成了第二代38B dense模型(在几个月内这个模型都是主要的盘古中档位模型),曾经具有一定的竞争力。但是,由于更大的135B模型架构落后,且更换词表模型损伤巨大(后续分析...
盘古大模型被指抄袭?华为回应后,又有员工爆料
诺亚方舟实验室负责人王云鹤在内网补充回应:“盘古大模型并非从零起步,但使用的Llama和Qwen组件均为开源,不存在抄袭。” 实测数据显示,盘古 Pro MoE 在昇腾 800I A2 平台上实现 1528 tokens/s 的推理吞吐,较通义千问在阿里云 GPU 集群上的性能高出约 3...
华为盘古大模型风波:抄袭争议与开源生态的审视
华为还强调,盘古模型训练基于昇腾芯片,与 Qwen 使用的训练硬件平台不同,进一步佐证了其独立开发的立场。诺亚方舟实验室负责人王云鹤在内网补充回应:“盘古大模型并非从零起步,但使用的 Llama 和 Qwen 组件均为开源,不存在抄袭。” 实测数据显示,盘古 Pro MoE 在昇腾 800I A2 平台上实现 1528 tokens/s 的...
华为盘古大模型风波:内部员工揭露研发过程中的套壳与续训问题...
这位员工还透露,王云鹤及其小模型实验室在盘古大模型的开发过程中扮演了重要角色,但他们的做法往往缺乏透明度,甚至存在直接套壳其他模型的情况。这些行为不仅损害了团队的利益,也让认真做事的同事们感到心寒和失望。 信中最后,这位员工以生命、人格和荣誉发誓,所写内容均为真实。他表示,自己不怕被公司追责或威胁,只希...
“盘古”风波最新进展:又曝讨王缴文
盘古大模型近日接连被爆料有套壳等嫌疑,这一风波持续至今,短短十天内,竟然犹如连续剧,一集更比一集热闹,最新的剧情更是升级到了火药味十足的层面。最新爆料直指诺亚实验室主任王云鹤本人,一则《讨贼王云鹤缴文》开始在社交平台流传。“王云鹤,1991年生于黑龙江,2018年博士毕业进入华为,”爆料人称,“经历不...
华为盘古疑现套壳续训!水印遭洗
所以我决定把我在这里看到的、听到的一些事情(有些是同事告诉我的)说出来,特别是关于盘古大模型的一些“传奇故事”:华为其实主要是用昇腾芯片来训练大模型的。小模型实验室以前也用过英伟达的卡,不过后来都转到昇腾上了。以前我真的很佩服华为“打造世界第二选择”的决心,我自己对华为也有很深的感情。我们陪...
盘古大模型风波:华为的声明与未解的信任危机
日前,一篇自称来自华为诺亚方舟实验室前/现员工的匿名长文在国内外技术社区(如知乎、GitHub、Reddit)广泛流传。该文核心指控包括:“套壳抄袭”:指控盘古Pro MoE并非官方宣称的“全新自研”,而是以阿里通义千问(Qwen)的开源模型权重作为初始化起点进行“续训”(Continual Pre-training),再通过技术手段“洗掉”...
...| 盘古大模型近日接连被爆料有套壳等嫌疑,这一风波持续至今,短...
1 人赞同了该想法 “盘古”风波最新进展:又曝讨王缴文 | 盘古大模型近日接连被爆料有套壳等嫌疑,这一风波持续至今,短短十天内,竟然犹如连续剧,一集更比一集热闹,最新的剧情更是升级到了火药味十足的层面。 最新爆料直指诺亚实验室主任王云鹤本人,一则《讨贼王云鹤缴文》开始在社交平台流传。 “王云鹤,1991年生于黑龙江,2018年博士
华为盘古大模型事件的“三重门”_财富号_东方财富网
7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种“模型指纹”技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。
华为盘古大模型事件的“三重门”|盘古_新浪财经_新浪网
7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种“模型指纹”技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。
华为盘古大模型事件的“三重门”_财经频道_证券之星
7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种“模型指纹”技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。
...核查王云鹤团队的管理行为,比如是否违规使用英伟达芯片、是否...
华子又碰上讨贼檄文小作文了,显然是此前盘古大模型抄袭阿里争议的延续,只是又升一级。华子的法务团队是否该出动了,过去249+2的光荣战绩,还是很骄人的,宜将剩勇,一而再再而三,继续发痒光大的,如果真能问心无愧,就是重拳出击,法律维权。另外把自己箱底技术完全透明,明人不做暗事,脱光了干。邀请第三方权威头部机...
华为盘古大模型事件的“三重门”_财经频道_证券之星
7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种“模型指纹”技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。
华为盘古团队回应开源代码争议,称严格遵循开源要求,回应了哪些...
2025年7月5日下午,华为盘古大模型团队通过官方渠道(如“昇腾CANN”微信公众号)发布正式声明,回应了...
盘古大模型研发过程中的技术困境和管理问题热议-CSDN博客
"套壳"指控涉及专业判断,需第三方技术审计。 总结 该文档呈现了华为大模型研发中技术理想与商业现实的尖锐冲突,反映了在国产化替代(昇腾芯片)压力下可能滋生的学术不端行为,以及高压交付文化对科研创新的侵蚀。若指控属实,将对华为AI战略的公信力构成重大挑战。
盘古大模型负责人王云鹤遭长文炮轰:使用英伟达芯片,剽窃同事技术...
这篇2500多字的长文中,作者指控王云鹤在短短7年内从普通研究员升至实验室主任,却缺乏相应资历,并利用职权窃取其他团队(如唐睿明、尚利峰团队)的技术成果,通过“套壳”外部模型(如阿里千问、DeepSeek)伪装成自研成果,剽窃盘古团队技术成果并大肆宣传以邀功。 作者在文章中还爆出了大量细节:王云鹤被指急功近利,违...
AI周报|华为盘古团队否认开源模型抄袭;英伟达市值逼近4万亿美元
”一位AI应用从业者对第一财经记者分析说,去年此时业界讨论开源闭源路线之争时,业界都还在发力底层大模型,究竟哪种模式更好还没得到真正、充分验证。但很快DeepSeek、阿里已经用事实说明了,开源成为推动AI技术进步和产业发展的重要力量。这场集体开源行动背后,既是对AI进入应用为王时代的回应,也暗含了各家加速...