马斯克吹牛了吗?Grok 4第一波实测:能完虐o3,也菜到数不清手指
有意思的是,看完网友放出的 Grok 4 吊打 o3 的测评,马斯克反倒谦虚起来,回了句「相当不错,但仍有改进空间」。更有网友调侃称,Grok 4 之所以能够大力出奇迹,离不开无尽的算力、华人和加班。参考链接:https://x.com/alex_prompter/status/1943231978779877514 https://x.com/
马斯克吹牛了吗?Grok 4第一波实测:能完虐o3。也菜到数不清手指
Grok 4 大战 o3博主 @Alex Prompter 对比 Grok 4 和 OpenAI o3 进行了一系列。改写后 机器之心的报道来了,部网友们花了不少钱体验了Grok 4。昨天马斯克在发布会上亮相,自豪地说Grok现在各种学科都能达到高级水平,甚至都能搞出科学新发现了!这话一出口,全球网友都沸腾了,虽然Grok 4价格不低,但很多人还...
马斯克吹牛了吗?Grok 4第一波实测:能完虐o3,也菜到数不清手指
昨天,马斯克亮相,一脸骄傲地表示:Grok 现在所有学科都达到博士后水平,没有例外,甚至可以在今年内实现科学新发现。 这一下子激起全球网友的兴趣,即使 Grok 4 的价格不菲,不少网友还是自愿氪金去体验一把。 Grok 4 大战 o3 博主@Alex Prompter 对比 Grok 4 和 OpenAI o3 进行了一系列测试。 原帖地址:https://x...
看看测试马斯克吹牛了吗?Grok 4第一波... 来自龙奔 - 微博
看看测试。『马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指』https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650979346&idx=1&sn=1cdb742adc3d06f357d2a477a30a7b94&chksm=85504ed5c6413e0f9d0b5129e549090d8fa73eee6a169597c93daea283e19472ceb3c444cb5d&xtrack...
Grok4技术测评:数不清6根手指的博士级AI,暴露了大模型哪些缺陷...
当马斯克在直播中宣称Grok 4"所有学科超博士水平"时,科技圈沸腾了。但短短24小时后,网友实测却让这场狂欢变成了荒诞剧:这个能解黎曼猜想的"超级大脑",居然连人类幼童都能完成的手指计数都频频出错。这种"能解微积分却数不清6"的魔幻现实,撕开了当前AI进化最尴尬的伤疤。
网友实测Grok 4,8:2虐惨GPT-o3,但菜到数不清6根手指\n昨天Grok 4...
网友实测Grok 4,8:2虐惨GPT-o3,但菜到数不清6根手指\n昨天Grok 4刚发布,网友们就带着实测来了,还有拿它和GPT-o3做对比的。看完之后,网友用一句话总结:上限很高,下限也很低。不过,这些结果不一定真的代表它们的实力,大家怎么看这场比拼呢?#实测#大模型#马斯克#Grok4#Grok#XAI#GPT-o3#AI#人工智能#科技...
马斯克吹牛了吗?Grok 4第一波实测-网易公开课
马斯克吹牛了吗?Grok 4第一波实测 集数:1 相关推荐 00:27 :我问了马斯克一个问题,你是什么时... 980播放 00:19 马斯克被问AI有什么用: 将全面替... 1608播放 00:21 马斯克:弱者才需要专利,特斯拉的专... 854播放 00:15 马斯克老妈:我72岁都不焦虑,你们... 1235播放 00:17 马斯克睡觉时间...
Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛”
尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型,不管是传统的基准测试,还是 SAT 考试(美国高考)以及各个...
马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6...
马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指 马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指 Source link
马斯克最贵AI首批实测,Grok4一边封神一边翻车
接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的Grok 4来说,马斯克放话“这是地球上最聪明的AI”,还没上线,就已经把话题度拉满了。 不过,Grok模型向来都是跑分没输过,体验没赢过。 如今,距离Grok 4的发布已经过去24小时,我们也搜集了网友分享的一些实测案例,让我们来一起看看这款模型究竟...
马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...
接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。 不过, Grok 模型向来 都是跑分没输过,体验没赢过。 如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了 网友分享的一些实测案例 ,让我们来一起看看这...
马斯克发布Grok4:比OpenAI便宜?学术问题堪比博士级别
适合五分钟写PPT大纲或改简历。高级玩家请切换Grok4Heavy版本。它的核心是四大脑联动。当输入粒子物理实验论文时。第一个AI拆解数学公式。第二个核对实验数据偏差值,第三个检查参考文献可信度。最后整合报告时标出8处数据矛盾点,学术圈已经疯了。斯坦福生物组学生现场实测。上传300页阿尔茨海默症论文PDF。指令"用高中...
机器之心Pro的个人主页
马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指 )对比以上两个提示词可以发现,问题就出在提示词给出的任务难度上,前一个提示词(HTML/JS)要求模型从零开始发明和实现一个物理引擎,后一个提示词(Python)允许模型使用现成的、成熟的物理引擎库。当然数手… ...
马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?
当被要求将一幅被拆分为三张小图的线条漫画,完整还原为纯SVG时,Grok 4表现拔尖,人物动作自然,而o3虽然也想拼全图,但页面排版混乱,出现文字穿模、对白重叠等问题。 【重构专辑封面】 第三关是让模型画出Radiohead的《In Rainbows》封面。OpenAI o3是唯一一个在排版和结构上高度还原的模型,展现出强大的记忆与设计...
马斯克最贵AI首批实测,Grok4一边封神一边翻车
接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的Grok 4来说,马斯克放话“这是地球上最聪明的AI”,还没上线,就已经把话题度拉满了。 不过,Grok模型向来都是跑分没输过,体验没赢过。 如今,距离Grok 4的发布已经过去24小时,我们也搜集了网友分享的一些实测案例,让我们来一起看看这款模型究竟...
马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...
接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。 不过, Grok 模型向来 都是跑分没输过,体验没赢过。 如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了 网友分享的一些实测案例 ,让我们来一...
马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...
接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。 不过, Grok 模型向来 都是跑分没输过,体验没赢过。 如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了 网友分享的一些实测案例 ,让我们来一...
Grok 4号称“全球最强AI”?其实是马斯克的自吹自擂-36氪
Grok已麻烦缠身。 「这是世界上最聪明的人工智能。」 尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。 纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型,不管是传...
马斯克天价AI实测:Grok 4封神编程却败走物理模拟
当马斯克在直播中宣布Grok 4"比所有学科博士都聪明"时,科技圈瞬间炸开了锅。这款月费2153元的AI,顶着"人类最后考试"榜首的光环登场,却在首批用户实测中上演了冰火两重天——程序员们为它严谨的代码欢呼,物理模拟测试却让它狼狈翻车。天价订阅背后的学霸人设 xAI这次祭出的SuperGrokHeavy套餐堪称AI界的爱马仕,...
Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛” - 知乎
似曾相识的“马斯克式吹牛” 「这是世界上最聪明的人工智能。」 尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。 纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型...