OpenAI开源两款大模型：性能超DeepSeek，但“幻觉”频发

六年来首次!OpenAI发布两款开放权重AI推理模型!奥尔特曼称其为...

OpenAI称gpt-oss-20b是一款中型开放模型，gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。OpenAI表示，较小的模型至少需要16GB显存或统一内存才能发挥最佳性能，并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少60GB显存或统一内存。在性能评估方面，

OpenAI新模型“幻觉”现象深度解析:当AI的创造力开始失控

本周，OpenAI推出的o3和o4-mini模型在科技圈引发了热烈讨论。这些新模型在编程、数学等任务上展现出令人惊艳的表现，但伴随而来的"脑洞大开"问题却让人担忧——它们似乎比前辈们更擅长编造不存在的事物。这种被称为"AI幻觉"的现象，正成为人工智能领域亟待攻克的新难题。一、现象：模型越聪明越"幻觉"？根据OpenAI的...

李彦宏说DeepSeek幻觉高,是真的吗?-钛媒体官方网站

在2025百度AI开发者大会的开幕上,李彦宏直接点出全民AI大模型 DeepSeek-R1 的痛点:“只支持单一模态、幻觉率较高、又慢又贵”。一番犀利评论,再度引发了各界对DeepSeek-R1以及大模型“幻觉”的评议。但出现强烈幻觉的并不止DeepSeek一家,OpenAI在其内部测试中发现:o3/o4-mini虽然全面替换了o1系列,但是幻觉现象...

大模型巨大问题!AI越聪明,就越容易产生幻觉

这个消息是在上个月底，OpenAI推出最新的AI推理模型o3和o4-mini时传出来的。结果发现，这两个新模型比之前的版本更容易产生幻觉。OpenAI的o4-mini模型在内部准确率测试中产生了48%的幻觉，说明它不太擅长说实话。而它的o3模型幻觉率是33%，大约是之前推理模型的两倍。与此同时，《纽约时报》还提到，谷歌和DeepSee...

刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗

OpenAI 终于开源了，但这次真不太一样从技术规格来看，OpenAI 这次确实是「动真格」了，并没有拿出缩水版的开源模型敷衍了事，而是推出了性能直逼自家闭源旗舰的诚意之作。据 OpenAI 官方介绍，gpt-oss-120b 总参数量为 1170 亿，激活参数为 51 亿，能够在单个 H100 GPU 上运行，仅需 80 GB 内存，专为生产...

AI越先进,越容易产生“幻觉”?_澎湃商学院_澎湃新闻-The Paper

当下流行的生成式人工智能基于语言模型的一个分支,即“自回归语言模型”。在过去的十几年里,关于语言模型的技术路线之争从未休止。2022年11月,OpenAI发布了具有划时代意义的ChatGPT 3.5,其背后的模型GPT-3.5是一个大型的自回归语言模型。自此,各机构发布的大语言模型都延续了这一技术路线,包括DeepSeek。

如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎

第一，OpenAI指责DeepSeek未经授权就通过大规模调用OpenAI API、抓取ChatGPT“输入输出对"来“蒸馏”训练...

DeepSeek为什么超越了OpenAI? - 知乎

DeepSeek 的快速增长带来了用户规模的激增，现有算力和服务器容量可能难以支撑。开源模型的高效推理虽降低...

在DeepSeek的开源AI模型引发全球关注数月后,OpenAI

在DeepSeek的开源AI模型引发全球关注数月后，OpenAI于周二发布了两个能模仿人类推理过程的开放权重AI模型，分别名为GPT-oss-120b和GPT-oss-20b，这两个模型将在AI软件托管平台Hugging Face上线，可在用户输入指令后生成文本，但不支持图像或视频，还能执行编写代码和在线搜索信息等复杂任务。这两个模型均为开放权重...

开源DeepSeek超OpenAI,综合性能更胜一筹?

DeepSeek以低成本训练著称。据报道，DeepSeek以1/11的算力、仅2000个GPU芯片就训练出了性能超越GPT-4o的模型。而OpenAI则依赖高性能硬件和大规模数据标注，训练成本相对较高。这种成本效益的差异使得DeepSeek在价格敏感的市场中具有更大的优势。二、DeepSeek的开源优势 1. 降低开发成本 DeepSeek的开源特性使得企业或...

开源模型DeepSeek与OpenAI性能对比分析!

模型架构创新：DeepSeek若在稀疏化训练、动态计算分配或数据合成技术上取得突破，可能在特定任务上实现效率优势。例如，MoE架构的改进可降低计算成本，同时保持性能。数据质量与规模：开源模型常依赖有限的开源数据集（如The Pile、Reddit等），而OpenAI可能使用更大规模的多模态私有数据。若DeepSeek通过更

如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎

本来我以为“开源”俩字就是程序员过家家，结果 DeepSeek 直接把桌子掀了：模型、权重、训练脚本、踩坑...

如何看待开源模型 DeepSeek 综合性能超过 OpenAI? - 知乎

他们分别是：模型名称访问网址大网红DeepSeek-R1https://chat.deepseek.com/ 智谱清言Zero推理模型...

OpenAI 的 o1 模型与 DeepSeek 模型在推理能力上的比较-CSDN博客

OpenAI 的 o1 模型系列采用大规模强化学习和思维链 (Chain-of-Thought) 技术进行训练 1,使其能够进行复杂的推理。DeepSeek 的 R1 模型则采用了一种创新的训练方法,即在预训练模型的基础上直接应用强化学习,无需进行监督微调 3。这两种模型都展现出强大的推理能力,并在多个基准测试中取得了优异的成绩。

【AI大模型】国产黑马:DeepSeek-V3与GPT-4o、Claude-3.5-Sonnet的全面对...

12月26日,深度求索公司正式推出了其最新的开源模型——DeepSeek-V3,凭借671B的参数和创新的MoE架构,迅速引起了openAI等大厂公司的关注。今天我们将深入探讨DeepSeek-V3的性能表现,并且与市场上最顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet进行全面对比,看看这款新模型是否真的如传闻中那样出色。一站式国产模型:DeepS...

为什么 AI 会更频繁地出现幻觉?我们该如何阻止它?

人工智能（AI）越先进，就越容易产生“幻觉”，提供不正确、不准确的信息。OpenAI 的研究发现，其最新、最强大的推理模型 o3 和 o4-mini 在 OpenAI PersonQA 基准测试中，分别有 33% 和 48% 的时间出现幻觉。这一比例是旧版 o1 模型的两倍多。虽然 o3 比其前代模型提供了更准确的信息，但似乎也带来了更多...

AI 幻觉正在变得越来越严重——而且这种现象还会持续下去

这个问题并不仅限于 OpenAI。Vectara公司的一个评估幻觉率的热门排行榜显示，一些“推理”模型——包括开发者 DeepSeek 开发的DeepSeek-R1 模型——的幻觉率与其开发者之前的模型相比，出现了两位数的增长。这类模型在做出反应之前，会经过多个步骤来展示推理过程。OpenAI 表示，推理过程并非罪魁祸首。“幻觉在推理模型...

OpenAI迎战Deepseek

2025年1月20日：发布新一代推理模型DeepSeek-R1，在各项性能与的GPT-4o持平，并开源。V3模型和R1系列模型都是基于V3模型的更基础版本V3-Base开发的，相较于V3（类4o）模型，R1（类o1）系列模型进行了更多自我评估、自我奖励式的强化学习作为后训练。在R1之前，业界大模型普遍依赖于RLHF（基于人类反馈的强化...

AI算力支出超140亿,DeepSeek遭遇美国OpenAI全新o3-mini模型反击|...

OpenAI准备开源？完整版o3最快几周内上线事实上，大模型推理成本的下降是一个必然趋势。OpenAI在发布o3 mini时表示，其团队降低了token价格。自推出GPT-4以来，每个token的价格降低了95%，但同时保持了顶级的推理能力。在价格、性能等层面，o3-mini是目前OpenAI性价比最高的模型之一，多项技术能力超越了DeepSeek R1...

OpenAI 宣布重新开源,网友:DeepSeek给逼的

OpenAI和DeepSeek页面截图闭源模型是一个产品，开源模型是一个工具。与闭源模式不同，开放权重允许开发者本地部署、微调模型，在医疗、金融等敏感领域具有独特优势。英伟达推出的个人AI超级计算机，更让企业以低成本运行开源模型成为可能。这种技术民主化趋势，正在重塑AI产业的权力结构，开源必将成为AI模型的主流。闭源...