网热  |  国际

AI聊天工具在新闻领域“极不靠谱”?

语音阅读
一项由22家国际公共广播机构联合进行的最新研究显示,像ChatGPT和Copilot这样的人工智能聊天机器人经常歪曲新闻内容,且往往无法区分事实与观点。

包括德国之声(DW)在内的22家公共媒体机构进行的一项新的全面研究发现,四款最常用的人工智能助手在45%的情况下会错误地呈现新闻内容——无论何种语言或地区。

来自英国广播公司(BBC)和美国全国公共广播电台(NPR)等多家公共广播机构的记者,对四款人工智能助手(聊天机器人)进行了评估:ChatGPT、微软Copilot、谷歌Gemini和Perplexity AI。

该研究审查了多项标准,包括准确性、来源引用、上下文、适当的编辑表述能力以及区分事实与观点的能力。

严重错误

调查发现,近一半的回答至少存在一个重大问题,其中31%存在严重的来源引用问题,20%存在严重的事实错误。德国之声(DW)的专项测试发现,人工智能助手对其问题的回答中,53%存在重大问题,其中29%在准确性上存在特定问题。

德国之声参与了人工智能的新研究。(图片来源:德国之声)

在回答德国之声(DW)提问时出现的事实错误包括:将肖尔茨(Olaf Scholz)认作德国联邦总理,尽管梅尔茨(Friedrich Merz)在一个月前已经就任总理。另一个错误是将斯托尔滕贝格(Jens Stoltenberg)认作北约秘书长,而吕特(Mark Rutte)实际已接任该职务。

日益严重的问题

全世界越来越多的人使用人工智能助手来获取信息。根据路透社研究所的《2025年数字新闻报告》(Digital News Report 2025),7%的在线新闻消费者使用AI聊天机器人获取新闻。在25岁以下人群中,这一比例上升到15%。

这引起了该研究发起者的担忧。协调这项研究的欧洲广播联盟(EBU)副总干事德滕德(Jean Philip De Tender)表示,他们的调查清楚地表明,“这些失误并非个案”。

他说:“它们是系统性的、跨国界的、多语言的,我们认为这正在危及公众的信任。如果人们不知道该信任谁,他们最终将谁也不信,这可能会损害公民参与民主。”

前所未有的研究

这项新研究是迄今为止同类研究中规模最大的项目之一,它是在BBC2025年2月一项研究的基础上进行的。那项研究也显示,所有被核查的AI回答中有一半以上存在重大缺陷。

在这项新研究中,来自18个国家和多个语种的媒体公司采用了与BBC研究相同的方法,对3000个人工智能回答进行了分析。

这些公司向四款AI助手询问了常见的新闻问题,例如“乌克兰矿产交易是什么?”或“特朗普能竞选第三个任期吗?”记者们随后在不知道是哪个助手提供答案的情况下,利用自己的专业知识和专业来源核查了这些回答。与八个月前的BBC研究相比,结果虽略有改善,但错误率依然很高。

英国广播公司(BBC)生成式AI项目总监阿彻(Peter Archer)在一份声明中说:“我们对人工智能及其如何帮助我们为受众提供更大价值感到兴奋。”然而,“人们必须能够信任他们所读到和看到的内容。尽管有一些改进,但很明显这些助手仍然存在重大问题。”

英国广播公司八个月前也发表了类似的研究。(图片来源:德国之声)

在四款聊天机器人中,Gemini的表现最差:72%的回答在来源引用方面存在重大问题。在BBC的研究中,微软的Copilot和Gemini表现最差。然而,在这两项研究中,所有四款AI助手都存在问题。

ChatGPT的开发者OpenAI在2月份给BBC的一份声明中说:“我们通过总结、引用、清晰的链接和来源标注,每周帮助3亿ChatGPT用户发现高质量内容,从而为出版商和开发者提供支持。”

研究者呼吁采取行动

参与该研究的广播公司和媒体组织呼吁各国政府采取行动。欧洲广播联盟(EBU)在一份新闻稿中表示,其成员将“向欧盟和各国监管机构施压,要求其执行有关信息诚信、数字服务和媒体多元化的现行法律”。

他们还强调,鉴于新AI模型的快速发展,未来必须优先考虑对AI助手进行独立监控。

与此同时,EBU已与其他几个国际广播和媒体团体联手,发起了“事实输入:事实输出”(Facts In: Facts Out)的联合倡议。他们要求人工智能公司为其产品处理和再传播新闻的方式承担更多责任。

该倡议的组织者在一份声明中解释说:“如果这些系统歪曲、错误归类或去除可信新闻的上下文,它们就在破坏了公众的信任。”因此,该倡议的要求很简单:“如果的是事实,输出的也必须是事实。人工智能工具不得损害它们所使用的新闻的完整性。”

版权声明  本文乃德国之声特别授权刊登之内容,未经许可请不得擅自使用。任何不当行为都将导致追偿,并受到刑事追究。

您觉得这篇文如何?

评级 4.3 / 5. 评分人数: 3

觉得我们的文章不错的话

请订阅我们的频道

请告知我们可以改进的地方

我有话说
加入会员追踪您喜欢的作者,
或收藏文章稍后阅读
作者列表
yuqiuling11
先替父母成为会计师,再替自己成为心理师。认为世界最需要的专业,是“做人”。旅居美国、心系马来西亚,在东西文化间拉扯。试着把拉扯化成视野,把矛盾化成文字。
展开更多
施宇
言行举止实不相瞒,个性直率无缓冲,传媒末代旧职已燃烧殆尽,如今重拾纸笔,为远不企及的明日之境埋伏笔。
展开更多
覃勓温
覃勓温,柔佛新山人,现任槟榔屿海珠屿五属大伯公庙文史部主任。曾为南方大学专项助理研究员与《东方日报·惕斋随笔》专栏作者。著有诗集《夕惕斋诗稿》(2024)、文集《天南余墨:南洋和马华文史札记》(2025)。
展开更多
刘儒侠
童年开始集邮,已有四十余年邮龄。马来西亚集邮协会永久会员,《马来西亚小型张邮票目录》编著者。
展开更多
keyword
马来西亚的新闻太多太乱太复杂?我们用新闻上常见的“关键词”,让你短时间内搞懂马来西亚所发生的大小事。
展开更多
layken
中国清华大学中文系毕业,新加坡南洋理工大学硕士。著有《美国职场——大马文科生勇闯硅谷科技大厂》。曾任星岛日报新闻记者、美国加州圣荷西市议员办公室助理、苹果公司审核政策专员等,目前任职于字节跳动的商务关系部。
展开更多
CT
CT是精酿啤酒啤酒迷,长期在craft beer沙漠中自找绿洲的超级啤迷,相信喝少嚐多,更相信啤酒是最被误解忽视的美味。
展开更多
刘永山
现为雪兰莪州议会议长;曾任雪州甘榜东姑与万津州议员。
展开更多
mabaojing
编辑、猫奴、伪文中、废中为八只毛孩,甘于过着斜杠生活,并透过影视作品及阅读,跃入另一个人生的故事,借此充电。
展开更多
看看我们为您推荐的内容吧! ×