文:MenClub 魏文青  
POSTED ON October 30, 2025 12:00 pm

以前大家「有事問Google」,依家大家就可能已經習慣「有事問AI」,甚至有人會於網上討論時貼出AI答案當係金科玉律,認為AI講嘅嘢就一定啱。但《BBC》及歐洲廣播聯盟 (EBU) 近來公佈嘅一個最新研究,就發現市面上所有AI於處理新聞議題時有近50%機會出錯,當中包括錯誤引用、內容準確性等問題。而眾多AI中又以Google Gemini為最差。換言之,距離大家能夠靠AI提供一切答案嘅日子仍然離我哋好遠。

圖片:ImageFX

《BBC》及EBU早前進行咗一個大型研究,搵黎多名專業新聞記者去審查ChatGPT、Copilot、Gemini及Perplexity有關新聞嘅回覆,並評定AI回覆是否準確、是否有引用正確來源、能否分辦事實與意見、以及為閱讀者提供語境等。

結果就發現,有45%嘅AI回覆均有至少一項錯誤。當中31%回覆有嚴重引用錯誤,例如誤導、錯誤,又或直接缺失新聞來源引用;20%回覆則提供錯誤資訊,當中包括過期消息,以及「AI幻覺」資訊(即係AI自己作出黎嘅)等。亦即係話,如果用家無自己去做Fact Check的話,有近半機率會被AI誤導。

圖片:ImageFX

有趣嘅係,報告特別點名Google Gemini表現差劣,指其76%回覆都有錯誤,比其他高出一倍有多,而當中最主要嘅係錯誤引用問題。要留意嘅係Google依家會用Gemini為普通搜尋整理出總結,換言之佢好可能係普通人最常接觸到嘅AI。其影響亦可能係最為廣泛。

成份報告唯一正面嘅,係各大AI嘅表現其實已經比起今年2月嘅同系列研究有所改進,只係仍然唔合格咁解。《BBC》生成式AI專案總裁Peter Archer亦強調,作為新聞業者佢哋係希望AI工具能夠成功,以令更多人接觸到準確嘅新聞內容,不過目前睇黎都仲有好長條路要行。

資料來源:BBC