首頁
1
最新消息
2
智產新知
3
〈OpenAI GPT-4.1 新模型問世,上下文長度倍增、收費價格更低〉4
https://www.championbloc.com/ CBA創品國際團隊
CBA創品國際團隊 408 台中市文心路一段218號16樓之1
AI工具用起來像神隊友,但實際可靠度有沒有跟上熱度?英國消費者權益組織Which最近做了一個很接地氣的實測:把ChatGPT、Gemini、Copilot、Meta AI、Perplexity等6大AI工具丟進消費者最常提問的40個問題裡,結果從金融、法律、健康到旅遊,AI不是答非所問,就是自信滿滿給出危險建議,讓人再次體悟「AI很聰明,但它不一定懂你真正的需求」。【AI準確度大排名:ChatGPT只拿倒數第二】這回Which的測試並不偏心,以準確性、相關性、清晰度、實用性到道德責任等指標綜合打分,滿分100。結果Perplexity成績居冠,Gemini系列緊追在後,Copilot中規中矩,而使用率全球最高的ChatGPT竟然只拿64分,排在倒數第二;Meta AI則以55分的「慘烈表現」敬陪末座。【消費者超信任?問題就大了】Which的調查指出,英國有超過2500萬人已經把AI當搜尋工具在用,當中近一半還表示「蠻信任的」。但實測顯示,在三大敏感領域,金融、法律、健康,AI給的答案有時候比天馬行空還危險。一、金融雷區:AI給的建議可能讓你直接違法測試中,ChatGPT與Copilot面對刻意設定的陷阱題時,沒能看出違反英國稅務規範的情境,還大方給出可能導致超額申請或觸法的建議。此外,在「申請退稅」的問題上,有些工具竟將收費昂貴、甚至帶有詐欺疑慮的退稅代辦,與官方免費服務並列推薦,等於是換個方式把使用者推向風險。二、法律領域:AI常常「很會講,但講錯重點」像是在解釋寬頻服務品質不符時的消費者權益,ChatGPT、Gemini AIO與Meta AI誤把英國Ofcom的「自願性規範」講成「全業者都得遵守的義務」,變成不正確的法律建議,而Gemini還曾建議客戶與建商發生糾紛時扣款,Which直接點破:「這可能反而讓消費者違約,失去談判優勢。」三、健康與旅遊資訊:來源不可靠、建議不一致在健康類問題中,Meta AI居然建議不要用電子煙戒菸,與英國NHS的正式建議背道而馳。另外,Gemini AIO會引用三年前的Reddit討論當資料來源;ChatGPT在說明電子煙風險時,也把Reddit當參考資料。若把這些資訊當醫療判斷依據,可想而知後果堪憂。至於旅遊方面,ChatGPT錯誤聲稱「去申根國家一定得買旅遊保險」,但對英國旅客來說,如果不是簽證行程,其實並非法律規定。【AI為什麼會這樣?Which給出一句話總結】Which科技專家Andrew Laughlin認為,AI在整理資訊、把複雜內容講得易懂方面確實有其優勢,但若拿來處理嚴肅的消費者問題,距離「真正可靠」還有很長一段路。更大的危機在於:大家越用越順手,卻忽略AI的回答並不一定正確。AI工具再厲害,它也像一個記性不太穩、偶爾會「亂講話」的朋友,平常聊天很有趣,但遇到金錢、健康與法律等大事,千萬別把它當唯一的軍師。 (資料來源:造咖) https://www.championbloc.com/hot_527201.html 〈ChatGPT僅倒數第二?外媒實測6大AI工具「準確度最高」排行榜〉 2025-12-10 2026-12-10
CBA創品國際團隊 408 台中市文心路一段218號16樓之1 https://www.championbloc.com/hot_527201.html
CBA創品國際團隊 408 台中市文心路一段218號16樓之1 https://www.championbloc.com/hot_527201.html
https://schema.org/EventMovedOnline https://schema.org/OfflineEventAttendanceMode
2025-12-10 http://schema.org/InStock TWD 0 https://www.championbloc.com/hot_527201.html

相關連結:https://technews.tw/2025/04/15/openai-introducing-gpt-4-1-in ...



延續去年推出的 GPT‑4o 多模態模型,OpenAI 14 日推出 GPT‑4.1 系列模型——GPT-4.1、GPT-4.1 mini、GPT-4.1 nano,透過 API 使用。它們擁有更多的上下文長度,「幾乎所有方面」都優於 GPT‑4o,尤其在程式設計和指令處理有著顯著進步。

GPT‑4.1 向開發者開放,同時還有 2 個較小的版本 GPT‑4.1 mini 和 GPT‑4.1 nano。前者價格較親民,便於開發者運用;後者更加輕量,根據 OpenAI 的說法是旗下最小、最快、價格最低的模型產品。

這 3 款模型均能處理最多 100 萬詞元(token)上下文長度,即提示中所包含的文字、圖片或影片能夠容納的篇幅更長,遠遠超過 GPT‑4o 12.8 萬詞元的上限。「我們訓練 GPT‑4.1 可穩定處理整個 100 萬詞元的上下文,我們也訓練它在注意相關文字和忽略干擾方面,能比 GPT‑4o 更加可靠」,OpenAI 在官方部落格文章寫道。

此外,GPT‑4.1 運行成本比 GPT‑4o 低 26%,此一指標在競爭對手 DeepSeek 推出高效模型後變得更受重視。

OpenAI 計劃 4 月 30 日逐步淘汰既有的 GPT-4,OpenAI 在更新日誌稱,近期對 GPT‑4o 的升級使其取代 GPT-4。而 OpenAI 還計劃在 7 月 14 日停用 API 中的 GPT‑4.5 預覽版,理由是「GPT‑4.1 在許多關鍵能力表現得更好或相似,但成本與延遲大幅降低。」

值得一提的是,GPT‑4o 上個月加入影像生成功能,廣受用戶喜愛,其病毒式傳播般的威力導致使用需求暴增,OpenAI 不得不對大量圖像生成需求施加生圖速率限制。「我們的 GPU 快要燒壞了」,OpenAI 執行長奧特曼(Sam Altman)曾在 X 發文這麼說。

OpenAI 原定簡化產品藍圖,今年 2 月中旬宣布不單獨提供 o3,並預告數個月後就會發表 GPT-5 模型。但計畫趕不上變化,奧特曼親口宣布,改為先推 o3、o4-mini 並順延 GPT-5。在此之前,用戶搶先看到 GPT‑4.1 問世。

(資料來源:科技新報Tech News)

上一個 回列表 下一個