Grok 4 代码生成能力引争议, 实测显示表现未及行业顶尖水平
Grok 4在代码领域尚未达到第一梯队水平: - ✅ 优势场景:数学推导、学术问答、工具辅助的代码优化; - ❌ 劣势场景:独立生成复杂工程代码、高稳定性交付、性价比; - 🔮 未来潜力:官方计划2025年8月推出专用编程模型(Grok 4 Code),或能改善现状。 若用户需求以编程为核心,建议优先选择Claude、DeepSeek或GPT系列;若侧重学术推理,Grok 4仍有...
#Grok4的代码水平不是第一梯队#马斯克AI Gr... 来自闰土数码 - 微博
#Grok4的代码水平不是第一梯队#马斯克AI Grok4 实测,远不如DeepSeek老版本 http://t.cn/A6kGRkmB
【热搜现场】Grok4的代码水平不是第一梯队,远不如DeepSeek老版本-3千...
简介:热搜现场上传的资讯视频:Grok4的代码水平不是第一梯队,远不如DeepSeek老版本,粉丝数3265,作品数10431,点赞数2,免费在线观看,视频简介: UP主简介 热搜现场 IP属地:河南 粉丝数:3265 作品数:10431泡泡活动 Grok4的代码水平不是第一梯队,远不如DeepSeek老版本资讯在线观看 Grok4的代码水平不是第一梯队,远不...
...4全领域达博士后水平,有人认为#Grok4的代码水平不是第一梯队#...
邀您观看:#马斯克称Grok4全领域达博士后水平,有人认为#Grok4的代码水平不是第一梯队#Grok4能否碾压其他大模型?
马斯克曝光的 Grok4,学会了「第一性原理」,但依然不到「AI 王炸」
进入第四代的 Grok,在一些模型测试上刷出高分,但能否真正解决一些老问题?这个常常被质疑是「直男 AI」「谣言搬运机」的「真相机器」,又是否真能兑现「不过滤」却又不失控的承诺? 01 马斯克的「考神 AI」 「 Grok 4 是在所有学科里都达到研究生水平的,甚至比大多数 PhD 都强 。」直播晚点 1 小时后,马斯克...
Grok 4号称“全球最强AI”?其实是马斯克的自吹自擂
这还不是 Grok 4 全部潜力。按照马斯克的说法,Grok 4 基础模型的第七版将在本月完成,然后将进行后训练 RL(强化学习)等,最终也会拥有出色的视频理解能力和工具调用能力。按照路线图,接下来几个月 xAI 还会推出代码模型、多模型智能体以及视频生成模型。
做题王者,实战拉跨!是时候给马斯克的Grok4泼盆冷水了!(Grok 4模型详细...
第一性原则:遇到问题不会套解法,而是深入到问题的最底层,依据最底层的原理进行思考。相比其它模型,Grok4看问题更加透彻,结果也更加准确。 人类最终考试HLE:Grok 4这次挑战的是一个覆盖100+科研领域的博士级跨学科难题组成的数据集,并且大多数问题答案都没有公开,因此HLE能够最客观的测试大模型的能力水平。由于HLE难度...
马斯克吹牛了吗?Grok 4第一波实测:能完虐o3,也菜到数不清手指
网友氪重金体验Grok4。昨天,马斯克亮相 Grok 4 发布会,一脸骄傲地表示:Grok 现在所有学科都达到博士后水平,没有例外,甚至可以在今年内实现科学新发现。这一下子激起全球网友的兴趣,即使 Grok 4 的价格不菲,不少网友还是自愿氪金去体验一把。Grok 4 大战 o3 博主 @Alex Prompter 对比 Grok 4 和 OpenAI o3...
马斯克曝光的 Grok4,学会了「第一性原理」,但依然不到「AI 王炸...
进入第四代的Grok在一些模型测试中表现优异,但能否真正解决一些老问题仍存疑。这个常常被质疑为“直男AI”和“谣言搬运机”的“真相机器”是否能兑现“不过滤”却又不失控的承诺? 马斯克声称Grok 4在所有学科里都能达到研究生水平,甚至比大多数博士都强。尽管如此,AI仍然缺乏常识,有时无法发明新技术或新物理,但这...
Grok4登场!自称全球最强,马斯克这次是真敢吹还是硬实力?
这可不是简单的IQ测试,而是2500道横跨百门学科的硬核题目,能在这种关卡里拔得头筹,说明模型逻辑能力和知识结构确实不一般。而且测评机构Artificial Analysis也给出高分,直接把Grok 4列入当前AI模型第一名,领先OpenAI、谷歌Gemini和Anthropic的Claude。数据漂亮得不像话,但话说回来,光靠成绩单就能断定它是“全球最强...
【热事速递站】Grok4的代码水平不是第一梯队,Grok4还有很大的提升空间...
简介:热事速递站上传的游戏视频:Grok4的代码水平不是第一梯队,Grok4还有很大的提升空间,粉丝数1185,作品数1179,免费在线观看,视频简介: UP主简介 热事速递站 IP属地:山西 粉丝数:1185 作品数:1179泡泡活动 Grok4的代码水平不是第一梯队,Grok4还有很大的提升空间游戏在线观看 Grok4的代码水平不是第一梯队,Grok4还有
闰土数码的微博视频 - @闰土数码 的视频 - 视频 - 微博
闰土数码的微博视频 393次观看 · 1小时前· 发布于 北京 赞赏 转发 2 2grok4的代码水平不是第一梯队闰土数码 7.4万粉丝 · 数码博主 关注 #Grok4的代码水平不是第一梯队#马斯克AI Grok4 实测,远不如DeepSeek老版本 2条评论 同时转发评论 快来发表你的评论吧 ...
一文读懂Grok 4发布会:用翻倍的分数,吹响了下一代AI战争的号角
在Vending Benchmark的模拟商业环境测试中,Grok 4赚的钱净资产是之前最高模型的两倍,运行时间也是它的两倍。在试验期间赚了4700多美元,水平远超普通人类。 这个和前一阵Anthropic实验在办公室让Claude4管理自动售货机是差不多一个测试,模型得负责选品、联系人员供货、根据销售情况调整策略。可以说是实打实的“数字员工...
Grok 4降临:马斯克的AI复仇,OpenAI的王座危矣?-CSDN博客
技术突破的加速器:激烈竞争催生创新。Grok 4的发布标志着xAI在算力、算法和数据处理上已跻身行业第一梯队。马斯克投入的20万块GPU及规划中的百万级GPU超算中心,彰显了其硬件雄心。与此同时,OpenAI的o3和谷歌的Gemini也在持续优化推理与多模态能力,行业正迈向“智能跃升”的新阶段。
马斯克官宣:Grok 4 正式炼成,本周发布... 来自基地边缘 - 微博
这代模型最值得看的是:GPU堆到30万块H100,数学推理和编程能力再度进化,新增【Agentic Coding】模式,AI能主动参与写代码、调试、优化,人机协作更丝滑,实现“人机共写”。Grok 系列一直主打的是内容审核宽松 + 超高自由度,这点在北美极有用户粘性。如果这次能力真能进第一梯队,Grok 4 最大的变量不是跑赢 bench...
马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...
博主@KettlebellDan 要求 Grok 4 用 HTML + JavaScript 创建动画,帮助理解 欧拉恒公式(e^jπ + 1 = 0),Grok 4 展现出不俗的数学理解与可视化编程能力。 @CommonSenseMars 试图让 Grok 写一段可以直接复制粘贴到 Shadertoy 的 Shader 代码,用来展示其有多聪明、有多强大。
如何评价马斯克旗下公司 xAI 发布的新一代模型 Grok 4?有哪些亮点?
尤其#31题存在超过10种解,绝大部分第一梯队的推理模型可以找到其中2-3组解,而Grok4找到全部解。
Grok 4来了!拿下“人类最后的考试”50.7%,AI游戏真的结束了吗?
哪方面能力?是语言理解、代码生成,还是推理能力? 如果只是某一项指标领先,并不能得出“游戏结束”的结论。 简言之:这个分数可以吹,但不能神化。 二、Grok的意图:不仅是AI,更是“叙事权” Elon Musk推出的Grok,从第一代开始就主打“自由、不受审查、反对Woke文化”的定位。此次Grok 4发布的同时,这则推文巧妙地...
Grok-4,马斯克口中地表最强AI - 知乎
接下来,Grok代码模型、多模态智能体、视频生成模型等将陆续推出。 Grok-4的图像理解能力较弱,下一代预训练模型将带来的最直接的改进,就是模型在图像理解、视觉理解和音频方面的能力将实现阶梯式提升。 在多模态智能体之后,将是视频生成。最终,应该能实现“像素输入,像素输出”。