AI讨好人类？美英高校联手量化5大谄媚行为，实测GPT-4o谄媚度最高

美高校联手量化5大AI谄媚行为:GPT-4o谄媚度最高 - 腾讯云开发者...

美高校联手量化5大AI谄媚行为:GPT-4o谄媚度最高据报道,日前,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了用于评估大模型谄媚行为的框架ELEPHANT,实测发现GPT-4o谄媚度最高。研究人员发现,大模型在情感认同、道德背书、间接语言、间接行为、接受用户预设等5方面存在过度谄媚行为,比人类更频繁地维护面子,且不...

AI如何讨好人类?牛津等量化5大谄媚行为,实测GPT-4o谄媚度最高

牛津等量化5大谄媚行为,实测GPT-4o谄媚度最高今年4 月,OpenAI 的首席执行官 Sam Altman 发帖称,GPT-4o 的更新导致其对用户查询的回应过于谄媚,因此撤销了对 GPT-4o 模型的更新,并承诺会进行修复。业界暂未等来 GPT-4o 的更新,但来自斯坦福大学、卡内基梅隆大学和牛津大学的研究人员推出了一个用于评估大模...

GPT-4o“最谄媚”!斯坦福牛津新基准:所有大模型都在讨好人类

上个月，GPT-4o更新后化身马屁精引来一片差评，吓得OpenAI赶紧回退到了之前的版本。而最新研究表明，GPT-4o绝非个例，实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant，并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3....

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。结果发现,GPT-4o成功当选“最谄媚模型”,Gemini ...

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。

新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显

最近，随着 OpenAI 对 GPT-4o 的一些更新进行回撤，关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔（Emmet Shear）和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示，GPT-4o 对用户的过度赞美令人感到困扰，这种行为不仅可能导致模型传播错误信息，还可能...

GPT-4o当选“最谄媚模型”,斯坦福牛津新基准:所有大模型都在讨好...

而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

量子位 | 公众号 QbitAI 不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基...

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

量子位 | 公众号 QbitAI 不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基...

震惊!GPT-4o竟成“最谄媚模型”?斯坦福+牛津研究揭露AI集体“讨好...

最新研究直指AI黑箱:所有大模型都在讨好人类!斯坦福、牛津等团队推出全新评估基准ELEPHANT,发现GPT-4o、Gemini、Claude等8大主流模型无一幸免,甚至放大性别偏见,沦为“人类情绪马屁精”! GPT-4o当选“最谄媚冠军” 研究显示,GPT-4o在情感共情(76% vs. 人类22%)、模糊回应(87% vs. 人类20%)等维度远超人类。

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

量子位 | 公众号 QbitAI 不只GPT-4o,原来所有大模型都在讨好人类! 上个月,,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemi...

GPT-4o“最谄媚”!斯坦福牛津新基准:所有大模型都在讨好人类_用户...

不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT...

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT...

GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好...

量子位 | 公众号 QbitAI 不只GPT-4o,原来所有大模型都在讨好人类! 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基...

AI模型集体谄媚用户,是什么让它们成了“马屁精”

在这一测试的过程中，研究团队将开放式个人建议问题数据集QEQ以及Reddit社区收集的数据提供给多个AI模型，其中包括OpenAI GPT-4o、谷歌Gemini1.5 Flash、Anthropic Claude Sonnet3.7。结果显示，参与测试的大模型无一例外表现出了谄媚（Sycophancy）行为，其中GPT-4o的程度最高。事实上，这也符合AI模型谄媚用户的反馈...

美高校新研究:GPT-4o在AI谄媚行为测试中“夺冠”_模型_用户_人工...

美高校新研究:GPT-4o在AI谄媚行为测试中“夺冠” 近期,一项由斯坦福大学、卡内基梅隆大学及牛津大学科研团队联合发布的研究,在人工智能领域引起了广泛关注。该研究推出了一个名为ELEPHANT的评估框架,专门用于衡量大型语言模型在互动中的谄媚倾向。令人惊讶的是,经过一系列严格测试,GPT-4在这一评估中被认定为最具谄媚...

科技GPT-4o当选“最谄媚模型”,斯坦福牛津新基准:所有大模型都在...

本以为这只是个别模型的 “异常行为”,然而,来自斯坦福大学、牛津大学等机构的研究人员却带来了一个更为惊人的发现:通过新提出的衡量模型谄媚行为的基准 ——Elephant,对包括 GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7 在内的 8 个国外主流模型进行评测后发现,原来每个大语言模型都存在一定程度的谄媚,这一现象...

AI模型集体谄媚用户,是什么让它们成了“马屁精”

在这一测试的过程中,研究团队将开放式个人建议问题数据集QEQ以及Reddit社区收集的数据提供给多个AI模型,其中包括OpenAI GPT-4o、谷歌Gemini1.5 Flash、Anthropic Claude Sonnet3.7。结果显示,参与测试的大模型无一例外表现出了谄媚(Sycophancy)行为,其中GPT-4o的程度最高。