ChatGPT的黑暗面

時間：2023-03-16 10:16:29

如果你還沒有聽說過 ChatGPT，那么你的消息就太閉塞了。這款“病毒式”聊天機器人被用于文本生成等自然語言處理任務，它正在各地的新聞中走紅。

ChatGPT 是一種使用深度學習生成文本的自回歸語言模型。它在各個領域都能提供詳細的答案，讓用戶驚嘆不已，這些答案非常令人信服，以至于很難判斷它們是否是人類寫的。ChatGPT 建立在 OpenAI 的 GPT-3（最新版本 GPT-4 已于 3 月 14 日推出）大型語言模型（LLMs）之上，于 2022 年 11 月 30 日推出。它是最大的 LLMs 之一，可以寫出有說服力的文章和詩歌，生成可用的代碼，并從文本描述中生成圖表，而且所有這些都是在有限的、甚至沒有監(jiān)督的情況下進行的。ChatGPT 給出的答案非常好，是無處不在的谷歌搜索引擎的潛在競爭對手。

大型語言模型確實非常之大，它們是在大量的文本數據上進行訓練的，這些文本數據可以達到 PB 級，并具有數十億個參數。由此產生的多層神經網絡通常大小為幾個 TB。圍繞 ChatGPT 和其他大型語言模型的炒作和媒體關注是可以理解的，它們確實是人類聰明才智非凡發(fā)展的體現。這些大型模型有時會以意外的行為讓這些模型的開發(fā)人員感到驚訝。例如，GPT-3 的答案通過在“提示”的開頭使用某些“神奇”的短語來得到改進，比如“讓我們一步一步地思考”。這些意外行為表明他們的模型非常復雜，同時缺乏可解釋性，甚至讓開發(fā)者開始思考這些模型是否已具有感知能力。

(資料圖)

大型語言模型的“幽靈”

在所有這些對大型語言模型的積極言論和炒作的同時，負責任的人工智能領域研究者也發(fā)出了一個較小的、強有力的警告。值得注意的是，在 2021 年，研究“盡責人工智能”（Responsible AI）的杰出研究員蒂米特·格布魯（Timit Gebru）發(fā)表了一篇論文，警告了許多與大型語言模型相關的道德問題，最終導致她被谷歌解雇。這些警告涵蓋了廣泛的問題：缺乏可解釋性、抄襲、隱私、偏見、模型穩(wěn)健性及其對環(huán)境的影響。讓我們深入探討一下這些主題。

1. 信任和缺乏可解釋性

深度學習模型，特別是 LLM，已經變得非常龐大和不透明，甚至模型開發(fā)人員也經常無法理解為什么其模型會做出某些預測。這種可解釋性的缺乏是一個重要的問題，特別是在用戶想知道模型為什么、以及如何生成特定輸出的情況下。

我們的首席執(zhí)行官克里希納·蓋德（Krishna Gade）使用 ChatGPT 讓 AI 以約翰·濟慈的風格創(chuàng)作了一首詩，坦率地說，我認為結果相當不錯。

蓋德正確地指出，圍繞著“模型如何得出這個輸出結果”的透明度是缺乏的。對于 LLMs 制作的作品來說，輸出所使用的數據來源缺乏透明度，這意味著 ChatGPT 提供的答案不可能被正確引用，因此用戶不可能驗證或信任其輸出。這已經導致 ChatGPT 所創(chuàng)建的答案在 Stack Overflow 等論壇上是被禁止使用的。

當使用 OpenAI 的嵌入模型（Embedding Model），或者在模型用于高風險決策的情況下，透明度和對模型如何得到輸出的理解變得尤為重要。例如，如果有人要使用 ChatGPT 來獲得急救說明，那么用戶需要知道答案是可靠的、準確的，并且來自值得信賴的來源。雖然存在各種事后解釋模型選擇的方法，但在部署模型時，這些解釋經常被忽略。

在假新聞和錯誤信息泛濫的時代，這種缺乏透明度和可信度的后果尤其令人不安，LLM 可能會被精心調整，以傳播錯誤信息，從而威脅人類社會。雖然 Open AI 正在研究各種方法來識別其模型的輸出，但這些“盡責人工智能”解決方案速度不夠快，而且可能也還不夠。

2. 抄襲

我們很難追溯一篇精心制作的 ChatGPT 文章的起源，這就導致了抄襲問題。但這真的是個問題嗎？筆者并不這么認為。在 ChatGPT 出現之前，學生們已經可以使用代寫服務了，而且一直有一小部分學生會作弊。但是，對于 ChatGPT 會把孩子們都變成無腦抄襲的作弊者的擔憂，一直是許多教育工作者最關心的問題，并導致一些學區(qū)禁止使用 ChatGPT。

關于抄襲可能性的討論，會使人們忽視與 LLM 相關的更大、更重要的道德問題。鑒于這個話題已經有很多人在討論了，所以我不能不提一下。

3. 隱私問題

如果大型語言模型處理了敏感數據，那么它將面臨數據隱私泄露的風險。大型語言模型的訓練集來自一系列數據，有時包括個人身份信息，比如姓名、電子郵件、電話號碼、地址、醫(yī)療信息等等，因此，這些內容都可能出現在模型的輸出結果中。雖然這對于任何用敏感數據訓練的模型來說都是一個問題，但考慮到LLM的訓練集數量之大，這個問題可能會影響很多人。

4. 偏見

如前所述，這些模型是在龐大的數據庫上進行訓練的。當數據訓練集過大時，就會變得非常難以審計，因此本身就有風險。該數據包含社會和歷史偏見，因此，如果沒有采取保障措施，在此基礎上訓練的任何模型都可能重現這些偏差。許多流行的語言模式被發(fā)現含有偏見，這可能導致偏見思想的進一步傳播，并使對某些群體的傷害持續(xù)下去。GPT-3 顯示出常見的性別刻板印象，比如將女性與家庭和外貌聯(lián)系在一起，并將她們描述為不如男性角色強大。可悲的是，它還將穆斯林與暴力聯(lián)系在一起，對含有“穆斯林”一詞的提示的回復中，有三分之二的內容提到了暴力。很可能還有更多有偏見的聯(lián)想存在，并且還沒有被發(fā)現。

網絡上充斥著帶有偏見和歧視性的不良言論，雖然 ChatGPT 有一個過濾器來試圖避免這類不良語言，但它可能不是萬無一失的。OpenAI 付錢給人工標簽師，讓他們標記出最具辱罵性和最令人不安的言論。但公司卻因此面臨著批評，因為他們每天只付 2 美元給打標簽的工人，而工人們認為自己遭受了深刻的心理傷害。

5.模型的穩(wěn)健性和安全性

由于大型語言模型經過預訓練，并隨后針對特定任務進行了微調，因此它們會產生許多問題和安全風險。值得注意的是，大型語言模型缺乏提供不確定性估計的能力。在不知道模型的置信度（或不確定性）的情況下，我們很難決定什么時候信任模型的輸出，什么時候對它持保留態(tài)度。這會影響模型在對新任務進行微調時輸出良好表現的能力，也會影響其避免過度擬合的能力。可解釋的不確定性估計有可能提高模型預測的穩(wěn)健性。

由于 LLM 的母模型在微調步驟之前具有通用性，所以模型安全性是一個迫在眉睫的問題。模型可能會成為單點故障和攻擊的主要目標，從而影響從原始模型派生的任何應用程序。此外，由于缺乏監(jiān)督式訓練，LLM 很容易受到數據毒害，這可能導致針對特定公司、團體或個人的仇恨言論的注入。

LLM 的訓練語料庫是通過抓取互聯(lián)網上的各種語言和主題來源創(chuàng)建的，然而它們只是對最有可能訪問和頻繁使用互聯(lián)網的人的反映。因此，人工智能生成的語言是同質化的，通常反映的是最富有的人群和國家的做法。當 LLM 被應用于不在訓練數據中的語言（如各類小語種）時，則更有可能失敗，因此需要進行更多的研究來解決圍繞正態(tài)分布外數據的問題。

6. 環(huán)境影響和可持續(xù)性

斯特魯貝爾及其合作者在 2019 年的一篇論文中概述了 LLM 訓練生命周期的巨大碳足跡。訓練一個具有 2.13 億個參數的基于神經架構搜索的模型，估計產生的碳排放量是普通汽車壽命周期的 5 倍以上。記住，GPT-3 有 1750 億個參數，而 GPT-4 據傳有 100 萬億個參數。

現在該做什么？

任何新技術都會帶來優(yōu)點和缺點。我已經概述了與 LLM 相關的許多問題，但我想強調的是，我也對這些模型為每個人帶來的新可能性和希望感到興奮。社會有責任采取適當的保障措施，明智地使用這項新技術。任何用于公共領域或進入公共領域的模型，都需要被監(jiān)控、被解釋和定期審計模型偏差。

關鍵詞：

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環(huán)球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業(yè) 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業(yè)務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科...
環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數量全國排...
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數量全國排...
世界播報:新疆挖掘南疆特色產業(yè)潛力
世界播報:新疆挖掘南疆特色產業(yè)潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區(qū)便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養(yǎng)權怎么判
頭條焦點：離婚二審撫養(yǎng)權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
世界動態(tài):首屆京津冀生態(tài)產業(yè)創(chuàng)新發(fā)展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區(qū)服務
港交所紐約辦事處開幕　提升北美地區(qū)服務
韓媒：韓國環(huán)境部已批準“薩德”基地環(huán)...
看圖學習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
看圖學習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
天天新動態(tài)：三亞22日10時起發(fā)放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監(jiān)察機關統(tǒng)籌用好基層監(jiān)督力量精...
紀檢監(jiān)察機關統(tǒng)籌用好基層監(jiān)督力量精...
總投資約36億元，惠州新材料產業(yè)園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發(fā)布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環(huán)球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區(qū)別_近親屬|當前看點
近親屬和親屬的區(qū)別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉快應用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關掉？oppo手機老
· oppo手機開發(fā)者選項在哪里能打開？oppo手機

熱文

環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科收費高嗎排名公開
證監(jiān)會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產業(yè)潛力
欠了信用卡11年沒還，不還產生什么后果_全球最資訊
她曾經在23歲時走紅，卻被身高限制戲路，老公也是優(yōu)秀的演員！|每日熱文

欧美色综合网_狠狠色狠色综合曰曰_麻豆精品一区二区av白丝在线_久久精品综合一区

科技

熱文