Menclub

本網站正使用 Cookie
我們使用 Cookie 改善網站體驗。繼續使用我們的網站即表示您同意我們的 Cookie 和隱私政策。

【科技】AI仍然信唔過 BBC研究指近半答案有重大錯誤 Gemini表現最差

文：MenClub 魏文青　　
POSTED ON October 30, 2025 12:00 pm

以前大家「有事問Google」，依家大家就可能已經習慣「有事問AI」，甚至有人會於網上討論時貼出AI答案當係金科玉律，認為AI講嘅嘢就一定啱。但《BBC》及歐洲廣播聯盟 (EBU) 近來公佈嘅一個最新研究，就發現市面上所有AI於處理新聞議題時有近50%機會出錯，當中包括錯誤引用、內容準確性等問題。而眾多AI中又以Google Gemini為最差。換言之，距離大家能夠靠AI提供一切答案嘅日子仍然離我哋好遠。
圖片：ImageFX
《BBC》及EBU早前進行咗一個大型研究，搵黎多名專業新聞記者去審查ChatGPT、Copilot、Gemini及Perplexity有關新聞嘅回覆，並評定AI回覆是否準確、是否有引用正確來源、能否分辦事實與意見、以及為閱讀者提供語境等。結果就發現，有45%嘅AI回覆均有至少一項錯誤。當中31%回覆有嚴重引用錯誤，例如誤導、錯誤，又或直接缺失新聞來源引用；20%回覆則提供錯誤資訊，當中包括過期消息，以及「AI幻覺」資訊（即係AI自己作出黎嘅）等。亦即係話，如果用家無自己去做Fact Check的話，有近半機率會被AI誤導。
圖片：ImageFX
有趣嘅係，報告特別點名Google Gemini表現差劣，指其76%回覆都有錯誤，比其他高出一倍有多，而當中最主要嘅係錯誤引用問題。要留意嘅係Google依家會用Gemini為普通搜尋整理出總結，換言之佢好可能係普通人最常接觸到嘅AI。其影響亦可能係最為廣泛。成份報告唯一正面嘅，係各大AI嘅表現其實已經比起今年2月嘅同系列研究有所改進，只係仍然唔合格咁解。《BBC》生成式AI專案總裁Peter Archer亦強調，作為新聞業者佢哋係希望AI工具能夠成功，以令更多人接觸到準確嘅新聞內容，不過目前睇黎都仲有好長條路要行。
資料來源：BBC

COMMENT

Xpower 突破次元壁，與經典動漫《龍珠Z》展開星際級合作！

2025-10-30

【影視】Sydney Sweeney回應「邦女郎」傳聞：我覺得我演James Bond會更有趣

2025-10-30

SOMETHING NEW

09 Apr 2026

TECH & GADGETS

【科技】LLM只會奉承變「盲撐」美研究警告或致道德淪喪

如果你有用過目前市面上流行嘅IAI，應該會發現佢時不時就會讚你「講得好啱」、「非常有道理」，但你又有無諗過佢呢種「稱讚」其實係「奉承」乃至「過度迎合」，長遠黎講甚至可能會引至社會道德淪喪？下次AI同你講「 ...

30 Mar 2026

TECH & GADGETS

【科技】傳iPhone 18全系列改用縮細版「動態島」邊框尺寸維持不變

距離Apple秋季發布會仲有大半年，有關新一代iPhone嘅消息已陸續流出。最近有消息指，Apple將會為iPhone 18全系列換上尺寸更細嘅動態島（Dynamic Island），進一步提升螢幕觀感。 blockquote class="twitter-twe ...