六年来首次!OpenAI发布两款开放权重AI推理模型!奥尔特曼称其为...
OpenAI称gpt-oss-20b是一款中型开放模型,gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。OpenAI表示,较小的模型至少需要16GB显存或统一内存才能发挥最佳性能,并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少60GB显存或统一内存。在性能评估方面,
OpenAI新模型“幻觉”现象深度解析:当AI的创造力开始失控
本周,OpenAI推出的o3和o4-mini模型在科技圈引发了热烈讨论。这些新模型在编程、数学等任务上展现出令人惊艳的表现,但伴随而来的"脑洞大开"问题却让人担忧——它们似乎比前辈们更擅长编造不存在的事物。这种被称为"AI幻觉"的现象,正成为人工智能领域亟待攻克的新难题。一、现象:模型越聪明越"幻觉"?根据OpenAI的...
李彦宏说DeepSeek幻觉高,是真的吗?-钛媒体官方网站
在2025百度AI开发者大会的开幕上,李彦宏直接点出全民AI大模型 DeepSeek-R1 的痛点:“只支持单一模态、幻觉率较高、又慢又贵”。一番犀利评论,再度引发了各界对DeepSeek-R1以及大模型“幻觉”的评议。 但出现强烈幻觉的并不止DeepSeek一家,OpenAI在其内部测试中发现:o3/o4-mini虽然全面替换了o1系列,但是幻觉现象...
大模型巨大问题!AI越聪明,就越容易产生幻觉
这个消息是在上个月底,OpenAI推出最新的AI推理模型o3和o4-mini时传出来的。结果发现,这两个新模型比之前的版本更容易产生幻觉。OpenAI的o4-mini模型在内部准确率测试中产生了48%的幻觉,说明它不太擅长说实话。而它的o3模型幻觉率是33%,大约是之前推理模型的两倍。与此同时,《纽约时报》还提到,谷歌和DeepSee...
刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗
OpenAI 终于开源了,但这次真不太一样 从技术规格来看,OpenAI 这次确实是「动真格」了,并没有拿出缩水版的开源模型敷衍了事,而是推出了性能直逼自家闭源旗舰的诚意之作。据 OpenAI 官方介绍,gpt-oss-120b 总参数量为 1170 亿,激活参数为 51 亿,能够在单个 H100 GPU 上运行,仅需 80 GB 内存,专为生产...
AI越先进,越容易产生“幻觉”?_澎湃商学院_澎湃新闻-The Paper
当下流行的生成式人工智能基于语言模型的一个分支,即“自回归语言模型”。在过去的十几年里,关于语言模型的技术路线之争从未休止。2022年11月,OpenAI发布了具有划时代意义的ChatGPT 3.5,其背后的模型GPT-3.5是一个大型的自回归语言模型。自此,各机构发布的大语言模型都延续了这一技术路线,包括DeepSeek。
如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎
第一,OpenAI指责DeepSeek未经授权就通过大规模调用OpenAI API、抓取ChatGPT“输入输出对"来“蒸馏”训练...
DeepSeek为什么超越了OpenAI? - 知乎
DeepSeek 的快速增长带来了用户规模的激增,现有算力和服务器容量可能难以支撑。开源模型的高效推理虽降低...
在DeepSeek的开源AI模型引发全球关注数月后,OpenAI
在DeepSeek的开源AI模型引发全球关注数月后,OpenAI于周二发布了两个能模仿人类推理过程的开放权重AI模型,分别名为GPT-oss-120b和GPT-oss-20b,这两个模型将在AI软件托管平台Hugging Face上线,可在用户输入指令后生成文本,但不支持图像或视频,还能执行编写代码和在线搜索信息等复杂任务。这两个模型均为开放权重...
开源DeepSeek超OpenAI,综合性能更胜一筹?
DeepSeek以低成本训练著称。据报道,DeepSeek以1/11的算力、仅2000个GPU芯片就训练出了性能超越GPT-4o的模型。而OpenAI则依赖高性能硬件和大规模数据标注,训练成本相对较高。这种成本效益的差异使得DeepSeek在价格敏感的市场中具有更大的优势。二、DeepSeek的开源优势 1. 降低开发成本 DeepSeek的开源特性使得企业或...
开源模型DeepSeek与OpenAI性能对比分析!
模型架构创新:DeepSeek若在稀疏化训练、动态计算分配或数据合成技术上取得突破,可能在特定任务上实现效率优势。例如,MoE架构的改进可降低计算成本,同时保持性能。数据质量与规模:开源模型常依赖有限的开源数据集(如The Pile、Reddit等),而OpenAI可能使用更大规模的多模态私有数据。若DeepSeek通过更
如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎
本来我以为“开源”俩字就是程序员过家家,结果 DeepSeek 直接把桌子掀了:模型、权重、训练脚本、踩坑...
如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎
他们分别是:模型名称访问网址 大网红DeepSeek-R1https://chat.deepseek.com/ 智谱清言Zero推理模型...
OpenAI 的 o1 模型与 DeepSeek 模型在推理能力上的比较-CSDN博客
OpenAI 的 o1 模型系列采用大规模强化学习和思维链 (Chain-of-Thought) 技术进行训练 1,使其能够进行复杂的推理。DeepSeek 的 R1 模型则采用了一种创新的训练方法,即在预训练模型的基础上直接应用强化学习,无需进行监督微调 3。这两种模型都展现出强大的推理能力,并在多个基准测试中取得了优异的成绩。
【AI大模型】国产黑马:DeepSeek-V3与GPT-4o、Claude-3.5-Sonnet的全面对...
12月26日,深度求索公司正式推出了其最新的开源模型——DeepSeek-V3,凭借671B的参数和创新的MoE架构,迅速引起了openAI等大厂公司的关注。今天我们将深入探讨DeepSeek-V3的性能表现,并且与市场上最顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet进行全面对比,看看这款新模型是否真的如传闻中那样出色。一站式国产模型:DeepS...
为什么 AI 会更频繁地出现幻觉?我们该如何阻止它?
人工智能(AI)越先进,就越容易产生“幻觉”,提供不正确、不准确的信息。OpenAI 的研究发现,其最新、最强大的推理模型 o3 和 o4-mini 在 OpenAI PersonQA 基准测试中,分别有 33% 和 48% 的时间出现幻觉。这一比例是旧版 o1 模型的两倍多。虽然 o3 比其前代模型提供了更准确的信息,但似乎也带来了更多...
AI 幻觉正在变得越来越严重——而且这种现象还会持续下去
这个问题并不仅限于 OpenAI。Vectara公司的一个评估幻觉率的热门排行榜显示,一些“推理”模型——包括开发者 DeepSeek 开发的DeepSeek-R1 模型——的幻觉率与其开发者之前的模型相比,出现了两位数的增长。这类模型在做出反应之前,会经过多个步骤来展示推理过程。OpenAI 表示,推理过程并非罪魁祸首。“幻觉在推理模型...
OpenAI迎战Deepseek
2025年1月20日:发布新一代推理模型DeepSeek-R1,在各项性能与 的GPT-4o持平,并开源。V3模型和R1系列模型都是基于V3模型的更基础版本V3-Base开发的,相较于V3(类4o)模型,R1(类o1)系列模型进行了更多自我评估、自我奖励式的强化学习作为后训练。在R1之前,业界大模型普遍依赖于RLHF(基于人类反馈的强化...
AI算力支出超140亿,DeepSeek遭遇美国OpenAI全新o3-mini模型反击|...
OpenAI准备开源?完整版o3最快几周内上线 事实上,大模型推理成本的下降是一个必然趋势。OpenAI在发布o3 mini时表示,其团队降低了token价格。自推出GPT-4以来,每个token的价格降低了95%,但同时保持了顶级的推理能力。在价格、性能等层面,o3-mini是目前OpenAI性价比最高的模型之一,多项技术能力超越了DeepSeek R1...
OpenAI 宣布重新开源,网友:DeepSeek给逼的
OpenAI和DeepSeek页面截图 闭源模型是一个产品,开源模型是一个工具。与闭源模式不同,开放权重允许开发者本地部署、微调模型,在医疗、金融等敏感领域具有独特优势。英伟达推出的个人AI超级计算机,更让企业以低成本运行开源模型成为可能。这种技术民主化趋势,正在重塑AI产业的权力结构,开源必将成为AI模型的主流。闭源...