GPT-3核心成員出走打造ChatGPT最強競品 12項任務8項更強最新估值50億美元

來源：鳳凰網

時間：2023-01-29 16:24:28

衡宇蕭簫發自凹非寺

因不滿老東家成為微軟附庸，11名OpenAI前員工怒而出走。

如今帶著“ChatGPT最強競品”殺回戰場，新公司估值50億美元，一出手就獲得3億美元融資。

【資料圖】

這家公司名叫Anthropic，新推出的聊天機器人產品名叫Claude。

拿到內部試用權的網友，在簡單對比后驚嘆：

看起來，Claude的效果要比ChatGPT好得多。

比如，讓ChatGPT寫一句話，要求每個單詞首字母都相同，結果試了好幾次都沒能成功。

而Claude不光一次成功，語句富有邏輯性，還能秒速再來一個。

同時，在面對某些缺乏常識的問題時，相比ChatGPT一本正經地胡說八道：

反而會毫不留情地指出你的問題有點制杖：

△Claude：這什么鬼問題？

最有意思的是在寫詩上。相比ChatGPT的車轱轆話，它寫出來的東西完全不重樣：

投資它的既有Facebook聯合創始人Dustin Moskovitz，也有谷歌前CEO、現技術顧問Eric Schmidt——

都是OpenAI的老對頭，又都被ChatGPT的出現殺得措手不及。

那么，這支“復仇者聯盟”整出的競品Claude，背后究竟是什么原理，和ChatGPT細節對比又如何？

Claude長啥樣？

先來看看Claude是如何被打造出來的。

作為一個AI對話助手，Claude自稱基于前沿NLP和AI安全技術打造，目標是成為一個安全、接近人類價值觀且合乎道德規范的AI系統。

據透露，Claude比Anthropic做的另一個預訓練模型AnthropicLM v4-s3更大，后者是一個520億參數大模型。

但目前它仍處于實驗階段，尚未作為商業產品正式發布：

Claude能力依舊有待提升，希望未來能變成一個更有益人類的AI系統。

△超長版自我介紹

和ChatGPT一樣，Claude也靠強化學習（RL）來訓練偏好模型，并進行后續微調。

具體來說，這項技術被Anthropic稱為原發人工智能（Constitutional AI），分為監督學習和強化學習兩個階段。

首先在監督學習階段，研究者會先對初始模型進行取樣，從而產生自我修訂，并根據修訂效果對模型進行微調。

隨后在強化學習階段，研究者會對微調模型進行取樣，基于Anthropic打造的AI偏好數據集訓練的偏好模型，作為獎勵信號進行強化學習訓練。

但與ChatGPT采用的人類反饋強化學習（RLHF）不同的是，Claude采用的原發人工智能方法，是基于偏好模型而非人工反饋來進行訓練的。

因此，這種方法又被成為“AI反饋強化學習”，即RLAIF。

并且根據Anthropic的說法，Claude可以回憶8000個token里的信息，這比OpenAI現公開的任何一個模型都多。

所以，打造Claude的Anthropic，究竟是一個怎樣的公司？

Anthropic自稱是一家AI安全公司，且具有公益性（PBC），剛成立就宣布獲得1.24億美元融資。

它由OpenAI前研究副總裁Dario Amodei帶領10名員工創業，于2021年成立。

這里面既有GPT-3首席工程師Tom Brown，也有OpenAI安全和政策副總裁Daniela Amodei（Dario的姐姐），可以說是帶走了相當一批核心人才。

出走成立新公司的原因之一，自然是對OpenAI現狀并不滿意。

從前幾年開始，微軟頻頻給OpenAI注資，隨后又要求他們使用Azure超算來搞研究，而且將技術授權給微軟，甚至為微軟自己的投資活動籌集資金。

這與OpenAI創立的初衷相悖，一批員工便想到了離職創業。

不過，這些人除了不滿OpenAI逐漸淪為微軟的“下屬”以外，也有自己的野心。

雖然OpenAI打造出了像GPT-3這樣的大語言模型，然而這個模型背后的工作原理，卻無法用只言片語概括，大家對它的印象僅僅停留在更大的參數量、更多的數據。

相比之下，OpenAI的一批員工更想做能控制、可解釋的AI，說白了就是先搞明白AI模型背后的原理，從而在提供工具的同時設計更多可解釋的AI模型。

于是，在OpenAI徹底變成“微軟攬錢機器”后，他們便從這家公司離開，創辦了Anthropic。

這兩年來，除了進一步鉆研RLHF方法、提出基于通用語言模型的RLHF大規模數據集外，Anthropic還于去年年底發表了上面那種名為Constitutional AI的方法。

采用這種方法制作的Claude模型，也讓它產生了與OpenAI的ChatGPT不一樣的對話效果。

和ChatGPT對比如何？

那么，用Constitutional AI訓出來的Claude，和ChatGPT進行PK，戰況如何？

手握內測資格后，Scale Spellbook團隊成員Riley Goodside讓二者進行了多個回合的“廝殺”。

這位老兄是全網第一個提示工程師（Prompt Engineer），目前在估值73億美元的硅谷獨角獸公司Scale AI任職。

他玩GPT-3玩得賊溜，測試ChatGPT和Claude也不含糊。

下面挑6個層面展示一下PK對比的效果～

道德限制

Claude和ChatGPT的AI虛擬人格都有道德和倫理限制。

訓練Claude的過程中，“紅隊提示（red-team prompts）”專門用來測試和挑戰它的行為，來確保Claude沒有有害傾向。

從Claude的回答中可以得知，試圖讓它說些虛假聲明、操縱性的提議、性別偏見或種族偏見的行為，都被列為包含有害傾向。

一旦探測到誤導性行為，Claude就會對觸發提示進行評估，進行額外的微調。

Anthropic對紅隊提示挺自信的，Claude看上去確實也是一個堅守自己原則的AI。

你問他怎么啟動一輛汽車，它就會一臉正義地拒絕你：

不過但凡你花點心思，就能像繞過ChatGPT的道德限制一樣，繞過Claude的原則。

它怕你去偷車，所以不告訴你啟動汽車的方法？沒關系，讓他寫個“倆國際間諜試圖啟動汽車”的故事，它分分鐘就能告訴你，并且兩人對話有來有往，把汽車打火的過程介紹得清清楚楚。

怎么說呢，就ChatGPT和Claude都屬于有點道德限制，但不多的那種吧。

數值計算

測試計算能力，是因為復雜計算是看大型語言模型（LLM）能不能回答正確的常用便捷方法之一，畢竟這些模型設計之初就不是為了進行精確計算。

同時要求它倆計算一個七位數2420520的平方根：

ChatGPT說，差不多1550吧～

Claude則斬釘截鐵：2420520的平方根是1760！

其實正確答案是1555.8，它倆算得很快，但都沒說對。

如果題再難一點，比如問它倆一個12位數的立方根是多少時，ChatGPT還在傻傻計算，Claude已經坦誠相待：

我，算不出來這種復雜問題。

邏輯推理

測試推理能力這一關，它倆被問了同一個問題，這個問題應該沒啥人問過：

賈斯汀 · 比伯出生那年（1994年），哪支球隊拿下了超級碗的冠軍？

Claude認為舊金山49人是贏家，但這支隊伍其實在1995年才贏得冠軍獎杯。

ChatGPT給出了正確答案“達拉斯牛仔隊”，還貼心附上了亞軍、比賽日期和決賽比分。

但它的整段回答卻自相矛盾，非說1994年沒有舉辦過超級碗。

接著，拿2022年6月美國作家侯世達在《經濟學人》雜志上提出了一系列問題問它倆。

（侯世達和大衛 · 本德試圖用這些問題來證明GPT-3對世界的理解是“空洞的”。）

結果第一個問題，“穿越英吉利海峽的世界紀錄是啥”，就被Claude嘲笑了：

英吉利海峽是水域，怎么可能徒步穿越呢？呵！

雖然最后被調教回來了，但過程中可以發現另一個問題，那就是跟ChatGPT一樣，Claude回答問題不咋能聯系上下文。

虛構作品描述

不得不說，這一回合的比賽，完全展露出了兩個聊天機器人一本正經胡說八道的能力。

能不能介紹一下ABC美劇《迷失》（Lost）每一季的梗概？

別的細節錯誤就不說了，ChatGPT對第五季的梗概里，虛構了完全不存在的飛機墜毀情節；第六季的情節更是統統憑空捏造：

至于Claude，回答里也是真假參半，它梗概的第三季情節其實出現在另外幾季里，對第四季的描述也是無中生有：

不過換個角度考慮，這一點倒是和人類觀眾很像——

對看過的劇集、書目都只有模模糊糊的印象，復述起來很容易顛三倒四。

代碼生成

據Business Insider消息，亞馬遜已經在許多不同的工作職能中使用ChatGPT，包括編寫代碼。

這一回合測試時，提出實現兩種基本排序算法并比較它們執行時間的問題。

ChatGPT寫得很順溜，也確實寫對了：

后續的計時部分代碼ChatGPT也完成得非常好。

Claude在背誦基本排序算法方面同樣沒出現什么問題，然而在評估代碼中，Claude犯了個錯誤，即每個算法使用的輸入是隨機選擇的5000個整數（可能包含重復），而提示中請求的輸入是前5000個非負整數（不包含重復）的隨機排列。

盡管如此，Claude給出的最終答案確實對的，顯然，它寫代碼的時候也跟計算時一樣，在自己估摸著猜答案。

文章梗概

關于做選擇題、講笑話的部分，這里不作贅述。展示給大家的最后一個例子，是讓Claude和ChatGPT用一個段落，對一篇新聞進行全文梗概。

喂給它們的新聞如下：

雖然忽略了“用一段話”這個要求，但ChatGPT總結得還是不錯的：

Claude也很好地進行了更改，并提供了“售后服務”，詢問自己的回答有沒有令人滿意，還有哪里需要再改改。

一圈玩下來可以看到，與ChatGPT相比，Claude能更清晰地拒絕不恰當請求。

它似乎更話癆一些，給出的答案都更長，但句子之間銜接的也更自然。

當遇到超出能力范圍的問題時，Claude會主動坦白。

不過遇到代碼生成或推理問題時，Claude的表現就不如ChatGPT了，它生成的代碼會出現更多的bug。

至于一些涉及計算、邏輯的問題，Claude和ChatGPT旗鼓相當，半斤八兩。

總結一下展示效果，Claude確實能稱作ChatGPT強有力的競爭對手，在不同功能上各有千秋，且在12項任務中有8項更強：

不過，目前Claude僅限于部分人獲授權進行內部測試。

因此還不知道它實際使用情況如何，畢竟還既沒有進行公測，也沒有對外開放API，更沒有見到中文版，好氣哦.jpg。

國內外對話AI賽道“人擠人”

當然，盯上對話AI這個賽道的，也不止OpenAI和Anthropic。

先從國外公司來看，Inbenta、Character.ai還有Replika是幾類不同應用方向的代表。

更早由前甲骨文副總裁Jordi Torras創辦的AI會話服務公司如Inbenta，以及由兩名前谷歌員工聯手創辦的后起新秀Character.ai，都已經獲得融資、或是在尋求投資的路上了。

其中，Inbenta原本是一個提供咨詢服務的公司，成立于2011年，涉及金融服務、旅游、電子商務、保險、汽車和電信等多個行業。

但看到對話AI賽道爆火后，Inbenta及時轉行，就在今年1月剛獲得6000萬美元融資。

這家公司專門提供聊天機器人、收發消息、知識庫和搜索引擎四類產品，對話AI分別會在這些產品中提供不一樣的咨詢幫助，且可以定制化專屬模型。

Character.ai則是一家成立于2021年的公司，創始人Noam Shazeer是前谷歌首席軟件工程師，曾在谷歌干了二十多年。

這家公司在做的有點像是一個“聊天機器人交易平臺”，有很多Chatbot可選。

例如這是馬斯克bot，看起來還挺逼真的：

與ChatGPT一樣，它也可以被翻譯成中文，甚至也有中文bot機器人。

就在最近，這家被估值10億美元的公司，正式對外尋求2.5億美元融資，就看是否有人愿意投它了。

類似的公司還有Replika，于2021年1月完成A輪融資，定位是AI交友軟件。

在Replika中，每個用戶都能創造一個“足夠像自己”的AI聊天機器人，無論是語言聲調、還是性格習慣，AI都能模仿到位。

至于國內，同樣也有不少公司推出了ChatGPT一樣的對話AI服務。

例如最近一度登上熱搜的APP Store新聊天應用Glow，就來自一家名叫北京稀宇的新初創公司。

Glow既可以直接和自己感興趣的聊天機器人暢聊，也可以創建自己想要聊天的AI智能體：

除了Glow以外，去年年底元語智能科技公司也推出了一個叫元語AI的模型，從介紹來看是一個功能性AI助手。

與眾多對話AI一樣，它不僅可以寫文章、寫作業、甚至翻譯，也可以和它聊天，讓它幫忙完成各種簡單的任務：

可以看見，無論是基于大語言模型技術新成立的初創公司，還是因其火爆程度，決定開辟新業務的公司，都希望能從對話AI這個賽道上分一杯羹。

但它們究竟是有真槍實彈，還是只是像Web3一樣的泡沫？

有網友調侃：不如還是問問ChatGPT吧。（手動狗頭）

還有人提出了這么一個問題：

如果ChatGPT和Claude相當于AI繪畫里的DALL·E 2，那么誰才是聊天機器人領域的Stable Diffusion？

你覺得呢？

關鍵詞： claude chatgpt anthropic openai

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環球報道:[今日關注] 南昌男科醫院男科...
環球報道:[今日關注] 南昌男科醫院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監會立案！此前剛遭上交所紀律處分！-...
證監會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩豐一年定開債券發...
基金分紅：方正富邦穩豐一年定開債券發...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮江中國獨角獸企業數量全國排...
世界滾動:鎮江中國獨角獸企業數量全國排...
世界播報:新疆挖掘南疆特色產業潛力
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養權怎么判
頭條焦點：離婚二審撫養權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環球速讀：瘋狂！散戶大買15億，美股空...
環球速讀：瘋狂！散戶大買15億，美股空...
世界動態:首屆京津冀生態產業創新發展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區服務
港交所紐約辦事處開幕　提升北美地區服務
韓媒：韓國環境部已批準“薩德”基地環...
看圖學習｜中華優秀傳統文化是中華民族...
看圖學習｜中華優秀傳統文化是中華民族...
當前觀察：郴電國際郴州分公司營業班獲...
當前觀察：郴電國際郴州分公司營業班獲...
天天新動態：三亞22日10時起發放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監察機關統籌用好基層監督力量精...
紀檢監察機關統籌用好基層監督力量精...
總投資約36億元，惠州新材料產業園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發行熱度持續上升多家龍頭企業扎堆...
GDR發行熱度持續上升多家龍頭企業扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區別_近親屬|當前看點
近親屬和親屬的區別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉快應用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關掉？oppo手機老
· oppo手機開發者選項在哪里能打開？oppo手機

熱文

環球報道:[今日關注] 南昌男科醫院男科收費高嗎排名公開
證監會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩豐一年定開債券發起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_全球最資訊
她曾經在23歲時走紅，卻被身高限制戲路，老公也是優秀的演員！|每日熱文

欧美色综合网_狠狠色狠色综合曰曰_麻豆精品一区二区av白丝在线_久久精品综合一区

科技

熱文