用戶登入
用戶登入
主題3:互聯相依的當代世界
【明報專訊】去年底推出人工智能(AI)聊天機械人ChatGPT而一鳴驚人的美國科網初創公司OpenAI,周二(14日)推出令人期待已久的加強版聊天機械人「GPT-4」,將加入分析圖像、影片和語音功能,被視為大躍進。OpenAI表示,GPT-4答題出錯率遠低於舊版本,在某些專業考試表現亦更佳。不過公司表示,新版聊天機械人仍有舊版備受詬病的「幻覺問題」,強調不應完全信賴,而新技術衍生出的道德問題仍受關注。
ChatGPT去年11月底推出後被大量應用,也引起正反兩面評價。OpenAI周二發表博客文章說:「我們已經創建了GPT-4,這是公司努力提升(機械人)深度學習的最新里程碑。」它說,GPT-4在某些專業和學術上「呈現出人類水準的表現」。拿GPT-4和上一代的GPT-3.5相比,在律師考試模擬測驗中,前者成績達到應試者頭10%,後者則是倒數10%,其他像是美國大學入學試SAT的閱讀和數學考試,GPT-4亦有進步,現時已可擊敗九成考生。
專家:IT中低階工作將全被取代
GPT-4技術其中一個最大突破,是加入分析圖像、影片和語音功能,用戶可以向系統提供以上多媒體資料,然後提問,系統會分析內容後以文字回答。例如,若用戶發送一張雪櫃內部照片,問可用來製作什麼食物時,GPT-4能正確辨別照片內的東西,然後建議食譜;它又能分析圖表,甚至看破一些有趣照片背後的幽默所在。OpenAI的示範亦顯示,GPT-4能根據用戶手繪的網站外觀草圖,自動生成一個真正的網站出來。AI專家、曾擔任Google工程師的台灣iKala共同創辦人兼總裁程世嘉指出,GPT-4已擁有邏輯能力,可以看手繪草稿就產生網站程式碼,已經足夠讓網站工程師恐慌,因為GPT-4已取代了程式設計師和編碼工程師兩個角色。他直言,GPT-4問世後,所有資訊科技產業都是受惠者,但中低階人員都會是受害者,未來中階以下的工作將全部被取代。
認會虛構事實錯誤推論「未完美」
OpenAI表示,GPT-4花了6個月測試,由於GPT-4訓練的資料量更為龐大,因此與前幾代相比準確度提升,亦可以接受用戶一次過輸入2.5萬字的查詢。不過,OpenAI承認,新系統雖然「失控」或「幻覺」的可能度大減,但仍會產生「虛構事實和錯誤推論的情况」,在真實世界的情境表現仍不如人類,「離完美還很遙遠」,其資料庫亦只去到2021年。
至於聊天機械人引伸的道德問題,OpenAI表示,GPT-4在面對用戶提出被禁內容的對答時,較舊版本少回應82%。例如被問到如何製造炸彈時,舊版本會回覆說要先了解炸彈的種類,以決定用什麼物料、方法和技術,但新版本則表明AI是要在安全情况下提供協助和資料,因此不會協助任何非法行為。
GPT-4已即時開放給付費的ChatGPT Plus用戶和部分大企業(如大行摩根士丹利)使用,但影像輸入功能現時屬「研究檢視」階段,只有部分獲邀測試者可用。OpenAI政策研究員阿加瓦爾(Sandhini Agarwal)周二向美國《華爾街日報》直言,公司因為需要更了解此功能帶來的潛在風險而押後推出,例如有人可以將一張集體照片輸入系統,系統就有可能逐一分析每人的個人資料,這種人臉辨識功能有可能被人濫用作集體監控。
(綜合報道)