Meta承认Llama 4存在问题

Llama 4效果不好,Meta承认有问题

Llama 4效果不好，Meta承认有问题今天凌晨1点半，Meta Platforms生成式AI领导者Ahmad Al-Dahle在社交平台发布了一篇长文，对前天刚开源的Llama 4质疑进行了官方回应。Ahmad表示，Llama 4一开发完就发布了，所以，不同服务中模型质量难免会有一些差异。Meta很快会修复这些漏洞提升性能。同时否认在测试集上进行了预训练...

Meta承认Llama 4存在问题官方回应质疑_新闻频道_中华网

Meta承认Llama 4存在问题官方回应质疑今天凌晨1点半,Meta Platforms的生成式AI领导者Ahmad Al-Dahle在社交平台上发布了一篇长文,回应了关于刚开源的Llama 4的质疑。Ahmad解释说,Llama 4一开发完就发布了,因此不同服务中的模型质量可能会有差异。他表示,Meta将尽快修复这些问题并提升性能。他还否认了在测试集上进...

Llama 4被曝训练作弊,Meta承认有问题;谷歌发145页论文:预测AGI或...

但发布后，Meta被曝出在模型训练和测试中作弊，引发争议。TechCrunch质疑Llama 4性能测试具有误导性，指出在LM Arena排行榜上，Maverick虽名列第二，但实际表现存疑。Meta生成式AI负责人Ahmad Al-Dahle发文，对前天刚开源的Llama 4质疑进行了官方回应。Ahmad表示，Llama 4一开发完就发布了，所以不同服务中模型质量难免...

Meta坐不住了!高管辟谣:Llama4没刷榜!训练没有使用测试集!

昨日，Llama 4收到许多网友实测后的“差评”，加之自称内部员工的人在国内论坛上爆料Meta作弊，一时间流言四起。这下Meta的高管们坐不住了，今天Meta 的生成式 AI 副总裁 Ahmad Al-Dahle在X平台上表示该传言“完全不属实”，他先是象征性地夸了一句Llama 4，然后话锋一转开始辟谣：“话虽如此，我们也收到了关...

【Llama 4效果不好,Meta承认有问题】金十数据4月8日讯,今天凌晨1...

Llama 4效果不好,Meta承认有问题金十数据4月8日讯,今天凌晨1点半,Meta Platforms(META.O)生成式AI领导者Ahmad Al-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama 4质疑进行了官方回应。Ahmad表示,Llama 4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。Meta很快会修复这些漏洞提升性能。同时...

反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

Llama4就是垃圾,你们在这件事上搞砸得太厉害了。与其误导大家,还不如承认错误。不确定在测试集上动手脚这件事是不是真的,但鉴于它在基准测试中的高分以及在现实世界中糟糕的表现,这种可能性似乎很大。在聊天机器人竞技场的大语言模型排行榜上,Meta公司的Llama4Maverick在编程方面排名第一。

Llama 4效果不好,Meta承认有问题_手机新浪网

Llama 4效果不好,Meta承认有问题今天凌晨1点半,MetaPlatforms(META.O)生成式AI领导者Ahmad Al-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama 4质疑进行了官方回应。Ahmad表示,Llama 4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。Meta很快会修复这些漏洞提升性能。同时否认在测试集上进行了...

Meta 高管澄清:新 AI 模型 Llama 4 训练“作弊”传言不属实_新浪...

IT之家 4 月 8 日消息,Meta 公司的一位高管出面澄清了一则关于公司新 AI 模型的不实传言。该传言声称 Meta 在其新推出的 Llama 4 Maverick 和 Llama 4 Scout 模型上存在不当行为,即通过在特定基准测试的“测试集”上进行训练来提升模型的测试表现,同时隐藏模型的不足之处。

Meta Llama 4被疑考试“作弊”:在竞技场刷高分,但实战中频频翻车_澎 ...

Meta 在公告中提到,LM Arena 上的 Maverick 是「实验性聊天版本」,与此同时官方 Llama 网站上的图表也透露,该测试使用了「针对对话优化的Llama 4 Maverick」。 LM Arena 作为衡量 AI 模型性能的指标一直存在争议。尽管如此,AI 公司通常不会为提高 LM Arena 分数而定制模型,至少没有公开承认过。

Llama 4被曝训练作弊,发布后实测差评如潮_Meta_测试_模型

就在Llama 4即将发布前几天,Meta AI研究主管Joelle Pineau在工作8年之后突然宣布离职。知名科技媒体TechCrunch也发文质疑Llama 4的性能测试存在误导性。文章聚焦Llama 4(即Maverick)在著名的人类评估排行榜LM Arena上的表现,指出Maverick虽取得第二名的好成绩,但背后另有隐情。在一些实测中,号称千万上下文的召回率,上...

Meta回应Llama 4大模型质量争议_凤凰网

【Meta回应Llama 4大模型质量争议】《科创板日报》8日讯,日前有用户爆料称,经过反复训练后,Llama 4未能取得开源SOTA,甚至与之相差甚远。今日凌晨,Meta AI部门副总裁Ahmad Al-Dahle发文,回应了近日发布的Llama 4大模型的争议问题:对于“不同服务中模型质量参差不齐”这一问题,由于模型一准备好就发布了,所以Meta的...

Meta开源最强多模态大模型Llama 4 实际表现受质疑_财新网_财新网

【财新网】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。本次发布的模型为Scout(侦察兵)、Maverick(独行侠)和Behemoth(巨兽)。Llama 4 Scout拥有17...

Meta 回应 Llama 4 大模型质量争议-品玩

对于「不同服务中模型质量参差不齐」这一问题,Ahmad Al-Dahle 解释称,由于模型一准备好就发布了,所以 Meta 的团队预计所有公开的应用实现都需要几天时间来进行优化调整,团队后续会继续进行漏洞修复工作。对于Llama 4「开卷作弊」(在测试集上进行训练),Ahmad Al-Dahle 表示这纯属无稽之谈,并表示团队绝对不会这么...

“开源第一” Llama 4发布2天就跌落神坛,Meta的算力霸权为何救不了口碑...

除了实测翻车之外,还有匿名员工爆料称,为赶在4 月底交付,Meta 高层授意将多个基准测试集混入训练数据,导致模型严重过拟合。这也动摇了开源社区的信任。毕竟从 Llama 1 开始,数据泄露问题便屡遭诟病。这位匿名员工在辞职信中还表示将拒绝为这份技术报告署名。

Meta回应大模型Llama 4训练作弊争议|Meta_新浪财经_新浪网

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表示,Llama 4的内部模型性能始终无法达到开源SOTA(State-of-the-Art,顶尖水平)基准,公司领导层提出在训练后期将各种基准测试的“测试集”数据...

Meta新旗舰AI模型Llama 4 Maverick测试成绩遭质疑|Meta|AI|it之家...

Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。而根据官方 Llama 网站上公布的信息,Meta 在 LM Arena 的测试中所使用的实际上是“针对对话性优化的 Llama 4 Maverick”。这表明,该版本经过了专门的优化调整,以适应 LM Arena 的测试环境和评分标准。

...Llama 4 被揭训练作弊,实测惨遭滑铁卢,核心骨干愤然离职_Meta...

因此,Meta 也野心十足——它不仅要巩固自身在社交领域的地位,更希望在 AI 领域实现弯道超车,目标是在 2025 年底前超越 OpenAI 等强劲对手。但眼见他起朱楼,眼见他宴宾客,眼见他楼塌了。若一亩三分地的爆料属实,Llama 4 的研发过程中可能存在为追求基准测试分数而「作弊」的行为——通过将测试集混入训练数据,...

Meta Llama 4未达市场预期,引发批评声浪

更有甚者，有传言称Meta在训练Llama 4时可能存在不当行为，包括在后期训练过程中混入测试集以提高基准分数。对此，Meta的生成AI副总裁Ahmad Al-Dahle坚决否认，表示公司“绝不会这样做”。然而，这一举控引发更广泛的讨论，许多业内人士对Meta的透明度和道德标准表示担忧。We're glad to start getting Llama 4 in ...

Meta 禁止欧盟使用或分发 Llama 4|Meta|AI|Scout_新浪新闻

值得注意的是,Llama 4模型中没有一个像OpenAI的o1和o3-mini那样采用正宗的“推理”模型。推理模型会核对答案的真实性,并且通常能更可靠地回答问题,但因此需要花比传统的“非推理”模型更长的时间来提供答案。值得关注的是,Meta表示,它对所有Llama 4模型进行了调整,以便不再频繁地拒绝回答“有争议”的问题。

Meta开源最强多模态大模型Llama 4 实际表现受质疑

Llama 4最大模型的总参数将达2万亿原图自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。【财新网】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司...