关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家451人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 648

小米米家空调迎“智能诊断”功能,可联网远程识别设备异常状态

IT之家 浏览 542

Pro or Ultra:消息称 iQOO 15 确定会有高配版,目前还在打磨中

IT之家 浏览 654

17岁小伙疑陷东南亚骗局 家人收其戴手铐跪地照片

大风新闻 浏览 611

路易斯破82天球荒!复出后首球,申花锁定胜局,马纳法精妙助攻

奥拜尔 浏览 654

一个多月没了342亿,新东方在线持续受挫!俞敏洪慌不慌?

市界观察 浏览 13926

香港起火楼栋外围使用竹脚手架引关注 被指便宜易运输

上游新闻 浏览 940

超34.2万人爆仓,比特币一度跌破10万美元关口

观察者网 浏览 457

俄最年轻安全部门或成瓦格纳事件最大赢家

红星新闻 浏览 15443

俄军抵达坠毁地点 美媒讨论“参战可能”

环球网资讯 浏览 16809

王传君斩获东京影帝!怼王家卫拒绝宋丹丹,曾因没戏拍卖表卖车

萌神木木 浏览 522

芬兰在芬俄边境开建200公里防护栏:3米高 配夜视仪

澎湃新闻 浏览 14114

秋季的穿衣难度并不高,选择基础款、配色不沉闷,舒适又减龄

静儿时尚达人 浏览 870

特朗普向米莱表态:若你们与中国军方合作 我很不高兴

环球网资讯 浏览 3785

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 474

国亮新材IPO:行业产能过剩、竞争对手强大,未来发展出路在哪里

览富财经网 浏览 453

苏亚雷斯:有信心率领亚泰保级

体坛周报 浏览 839

SpaceX:识别并切断缅甸电诈园区周边逾 2500 台“星链”设备

IT之家 浏览 668

VLOG:直升机博览会初探

新华社 浏览 793

2026款丰田皇冠陆放上市 售28.48-33.28万元

车质网 浏览 701

30亿资本注入,破产重整的上汽红岩如何“翻身”?

汽扯扒谈 浏览 585
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1