关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家792人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 509

闻泰科技百亿半导体资产控制权受限

南方都市报 浏览 831

于和伟点评余皑磊的表现,只字不提演技二字,却真知灼见

娱乐圈笔娱君 浏览 672

库克直播间带货 苹果换了打法

北京商报 浏览 862

但斌人气蝉联第1,邓晓峰热度上升!10月私募人气榜出炉!

私募排排网 浏览 470

宁德时代第三季营收1042亿:同比增12.9% 净利185亿斥资800亿理财

雷递 浏览 695

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 916

上汽销量反超比亚迪,真实“含金量”如何

经济观察报 浏览 594

剑指Anthropic十亿美元级市场!谷歌杀入AI编码大战,与Replit达成多年合作

华尔街见闻官方 浏览 154

男子称爷爷坟里埋了200万 女友给他272万发现其是老赖

潇湘晨报 浏览 4038

震动金融圈!周宝志,被查

中国基金报 浏览 9713

岚图追光L/别克至境世家领衔 12月上市新车汇总

太平洋汽车 浏览 133

金靖靠卖笑成名却被宋丹丹嫌弃?

小椰的奶奶 浏览 464

【英超】德利赫特头球绝平 曼联2比2客平热刺

体坛周报 浏览 418

两位"70后"女官员履新引关注 一位系孔繁森的女儿

新民周刊 浏览 78632

科技巨头再投500亿瞄准这个赛道

中国新闻周刊 浏览 471

朝鲜进行"核反击假想综合战术训练" 金正恩现场指导

环球网资讯 浏览 59143

福斯特:曼联看起来很有信心,但争4与曼城相比差距依然明显

懂球帝 浏览 392

中国游客称在瑞士看到峨眉山石 官方证实:已落户10年

封面新闻 浏览 3073

范曾与女儿、继子断绝关系 其与妻子新公司本月刚成立

红星新闻 浏览 130

沉默的荣耀众星发文告别,吴越真挚,余皑磊搞笑,于和伟看哭众人

娱乐圈笔娱君 浏览 816
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1