阿里开源两款4B小模型:手机电脑都能用,比GPT-4.1-nano还强
一、性能比肩中尺寸模型,agent能力超越GPT-4.1-nano Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507的上下文理解能力都扩展到了256K,可处理长文本,能支持更复杂的文档分析、长篇内容生成以及跨段落推理等场景。 性能方面,Qwen3-4B-Thinking-2507在复杂问题推理能力、数学能力、代码能力以
阿里开源两款4B小模型:手机电脑都能用,比GPT-4.1-nano还强 - 智东西
智东西8月7日报道,今天上午,通义千问Qwen宣布推出两款更小尺寸的新模型:Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。 其中,Qwen3-4B-Thinking-2507的推理能力可媲美中尺寸模型;Qwen3-4B-Instruct-2507在知识、推理、编程、对齐以及agent能力上全面超越了闭源的小尺寸模型GPT-4.1-nano。 此次发布的“2507”...
阿里开源两款4B小模型:手机电脑都能用,比GPT-4.1-nano还强
一、性能比肩中尺寸模型,agent能力超越GPT-4.1-nano Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507的上下文理解能力都扩展到了256K,可处理长文本,能支持更复杂的文档分析、长篇内容生成以及跨段落推理等场景。 性能方面,Qwen3-4B-Thinking-2507在复杂问题推理能力、数学能力、代码能力以及多轮函数调用能力上的表现...
阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI!
性能对比数据显示,Qwen3-4B-Instruct-2507已经超越了闭源小型模型GPT-4.1-nano的表现水平,同时接近同厂牌大规模模型Qwen3-30B-A3B(非推理版本)的能力,这一成就为移动端AI应用提供了强有力的技术支撑。在专业推理能力方面,Qwen3-4B-Thinking-2507展现出色表现。该模型在权威数学推理评测AIME25中获得81.3分的...
阿里通义千问发布小尺寸模型Qwen3-4B
观点网讯:8月7日,中国阿里巴巴集团旗下的通义千问团队正式发布两款4B参数级小尺寸大模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,并同步在魔搭社区与HuggingFace平台开源。通义千问官方表示,在非推理任务中,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano;在推理任务中,Qwen3-4B-Thinking-...
阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑
快科技8月7日消息,今日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。 目前新模型已在魔搭社区、HuggingFace正式开源。 据介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。 在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B...
阿里通义千问4B模型横空出世:小身材大能量如何颠覆AI行业格局?
当全球科技巨头还在千亿参数赛道疯狂内卷时,阿里通义千问突然打出一记漂亮的"轻量化直拳"——Qwen3-4B系列模型以4亿参数实现性能越级,非推理任务碾压闭源的GPT4.1-Nano,推理能力比肩自家30B大模型。这记"四两拨千斤"的技术突破,正在悄然改写AI产业的游戏规则。国产AI的"轻量化突围战"在参数规模决定论大行其...
OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机...
Sam Altman 声称,gpt-oss 性能与 o4-mini 水平相当,并且可以在高端笔记本电脑上运行(WTF!!)(还有一个较小的可以在手机上运行)。 两款开源模型与 o3、o4-mini 的跑分结果比较如下: 总结一波,这两个开源模型的亮点包括: 宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 - 非常适合实验、定制和商业...
阿里通义千问发布新小尺寸模型Qwen3-4B系列- DoNews快讯
2025年8月7日,阿里通义千问发布两款更小尺寸模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。据官方介绍,前者在非推理领域全面超越GPT4.1-Nano,后者在推理领域可媲美中等规模的Qwen3-30B-A3B。目前新模型已在魔搭社区和HuggingFace开源。
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
昨天,久不Open的OpenAI终于开源了一次。不仅和谷歌、Anthropic大撞期,而且gpt-oss-120b和gpt-oss-20b两个模型似乎并没有用性能征服开发者们。而今天半夜,也就是8月8日凌晨1点(太平洋时间8月7日上午10点),打了800集预告的GPT-5,或许就要来了……8月刚开始就战况这么激烈,咱能怎么办?搬小板凳,乖巧...
对标GPT-4o!蚂蚁开源统一多模态大模型Ming-lite-omni,理解生成...
西亭告诉智东西,新开源的Ming-lite-omni模型有几个值得关注的创新点:一是真正把生成和理解模型放到一个模型;二是真正意义上的全模态输入和输出,都支持音视频、图文多种形态;三是真正是以MoE为架构的模型,中间没有串其他东西,交互性较强。 据悉,团队希望这个模型能够接近GPT-4o像人一样去交互,但GPT-4o是闭源模型。所以团队给
OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
没能等到GPT-5,但OpenAI在深夜却很突然地open了一下—— 开源两个推理模型:gpt-oss-120b和gpt-oss-20b。 要知道,上一次OpenAI开源模型还是6年前,也就是2019年的GPT-2。 而这次的名字也是非常的直接,gpt-oss,即Open Source Series,意思就是“开源系列”。
阿里通义千问:发布新模型,部分性能超GPT4.1-Nano并开源
【8月7日阿里通义千问发布新模型并开源】8月7日,阿里通义千问发布更小尺寸新模型,即Qwen3 - 4B - Instruct - 2507和Qwen3 - 4B - Thinking - 2507。通义千问称,非推理领域中,Qwen3 - 4B - Instruct - 2507超越闭源的GPT4.1 - Nano;推理领域里,Qwen3 - 4B - Thinking - 2507可媲美中等规模的Qwe...
云灵AI 的想法: GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三款新模型...
GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三款新模型评测对比 | GPT-4.1是OpenAI于2025年4月15日凌晨发布的全新系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三款新成员。该系列模型在编程、指令遵循和上下文理解方面表现突出,支持最大可达100万个Token的更长上下文窗口。其中,GPT-4.1 nano是OpenAI迄今“最快...
通义千问Qwen3-4B-2507双料更新:手机能轻松跑,体积小、性能强
IT 之家援引博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。 该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。
OpenAI 发布三款 GPT-4.1 系列模型,性能有哪些提升?对行业来说,其...
mini,接近GPT-4o,但是推理延迟只有GPT-4o的一半;新推出的小号模型GPT‑4.1 nano是OpenAI目前最...
OpenAI时隔6年再度开源!两款推理模型,o4-mini级,手机和笔记本能跑
两款推理模型,o4-mini级,手机和笔记本能跑 原创 陈骏达 智东西 美国 一手实测速度惊人,网友吐槽开源不彻底。 作者| 陈骏达 编辑| 李水青 时隔6年,OpenAI再次开源语言模型! 智东西8月6日报道,今天,OpenAI终于放出其传闻已久的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款...
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus...
在诸多测试集上,该模型通用能力超越了闭源的小尺寸模型GPT-4.1-nano。 (注:GPT-4.1-nano是GPT-4.1系列中最小规模的模型,未公开参数量) 和Qwen3-30B-A3B(Non-Thinking)对比,Qwen3-4B-Instruct-2507与其性能接近,还小胜一筹。 换句话说,这个4B的密集模型在性能上与30B的MoE模型能力非常接近,但“占地面积”却...
OpenAI时隔6年再度开源!两款推理模型,o4-mini级,手机和笔记本能跑
时隔6年,OpenAI再次开源语言模型! 智东西8月6日报道,今天,OpenAI终于放出其传闻已久的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款模型类似。 本次OpenAI开源的模型最大亮点之一是其部署的高效性。gpt-oss-120b能够在单个80GB GPU上高效运行,gpt-oss-20b只需16GB内存即可在...
阿里通义千问发布小尺寸模型Qwen3-4B_7x24小时财经新闻_新浪网
新浪财经为您带来:8月7日,阿里通义千问发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越了闭源的GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2