国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

網絡消費網 >  科技 > > 正文
環球熱消息:關于GPT-4 這是14個被忽略的驚人細節
時間:2023-03-16 11:07:19

3月14日,OpenAI推發布了GPT-4。向科技界再次扔下了一枚“核彈”。


(相關資料圖)

根據OpenAI的演示,我們知道了GPT-4擁有著比GPT-3.5更強大的力量:總結文章、寫代碼、報稅、寫詩等等。

但如果我們深入OpenAI所發布的技術報告,我們或許還能發現有關GPT-4更多的特點……

以及一些OpenAI沒有點名和宣揚的,可能會令人背后一涼的細節。

01.新Bing裝載GPT-4

自然而然地,GPT-4發布之時,新Bing也已經裝載了最新的版本。

根據微軟Bing副總裁Jordi Ribas在推特上所述,裝載了GPT-4的新Bing已經將問答限制提升到了一次15個問題,一天最多提問150次。

02.文本長度擴大八倍

在GPT-4上,文本長度被顯著提高。

在此之前我們知道,調用GPT的API收費方式是按照“token”計費,一個token通常對應大約 4 個字符,而1個漢字大致是2~2.5個token。

在GPT-4之前,token的限制大約在4096左右,大約相當于3072個英文單詞,一旦對話的長度超過這個限制,模型就會生成不連貫且無意義的內容。

然而,到了GPT-4,最大token數為32768個,大約相當于24576個單詞,文本長度被擴大了八倍。

也就是說,GPT-4現在可以回答更長的文本了。

OpenAI在文檔中表示,現在GPT-4限制的上下文長度限制為8192個token,允許32768個token的版本名為GPT-4-32K,目前暫時限制了訪問權限。在不久的未來,這一功能可能會被開放。

03.模型參數成為秘密

我們知道,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億,但這一情況在GPT-4被改變了。

OpenAI在報告中表示:

考慮到競爭格局和大型模型(如GPT-4)的安全影響,本報告沒有包含有關架構(包括模型大小)、硬件、訓練計算、數據集構造、訓練方法或類似內容的進一步細節。

這意味著OpenAI沒有再披露GPT-4模型的大小、參數的數量以及使用的硬件。

OpenAI稱此舉是考慮到對競爭者的憂慮,這可能是在暗示其對于競爭者——谷歌Bard——所采取的策略。

此外,OpenAI還提到“大型模型的安全影響”,盡管沒有進一步解釋,但這同樣也暗指生成式人工智能所可能面對的更嚴肅的問題。

04.有選擇地表達的“優秀”

GPT-4推出后,我們都看到了這一模型較上一代的優秀之處:

GPT-4通過模擬律師考試,分數在應試者的前10% 左右;相比之下,GPT-3.5 的得分在倒數 10% 左右。

但這實際上是OpenAI的一個小把戲——它只展示給你GPT-4最優秀的那部分,而更多的秘密藏在報告中。

下圖顯示的是GPT-4和GPT-3.5參加一些考試的成績表現。可以看到,GPT-4并非在所有考試中的表現都那么優秀,GPT-3.5也并非一直都很差勁。

05.“預測”準確度提升

在ChatGPT推出以來,我們都知道這一模型在很多時候會“一本正經地胡說八道”,給出很多看似有理但實際上并不存在的論據。

尤其是在預測某些事情的時候,由于模型掌握了過去的數據,這反而導致了一種名為“后見之明”的認知偏差,使得模型對于自己的預測相當自信。

OpenAI在報告中表示,隨著模型規模的增加,模型的準確度本應逐漸下降,但GPT-4逆轉了這一趨勢,下圖顯示預測精確度提升到了100。

OpenAI表示,雖然GPT-4的準確度顯著提高,但預測仍是一件困難的事,他們還將就這一方面繼續訓練模型。

06.還有30%的人更認可GPT3.5

盡管GPT-4展現出了比GPT-3.5優秀得多的能力,但OpenAI的調查顯示,有70%的人認可GPT-4輸出的結果:

GPT-4在遵循用戶意圖的能力方面比以前的模型有了大幅提高。在提交給ChatGPT和OpenAI API的5214個提示的數據集中,70.2%GPT-4生成的回答優于GPT3.5。

這意味著:仍有30%的人更認可GPT-3.5。

07.GPT-4語言能力更佳

盡管許多機器學習的測試都是用英文編寫的,但OpenAI仍然用許多其他的語言對GPT-4進行了測試。

測試結果顯示,在測試26種語言中的24種中,GPT-4優于 GPT-3.5和其他 LLM(Chinchilla、PaLM)的英語語言性能,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言:

08.新增圖像分析能力

圖像分析能力是此次GPT-4最顯著的進步之一。

OpenAI表示,GPT-4可以接受文本和圖像的提問,這與純文本設置并行,且允許用戶制定任何視覺或語言的任務。具體來說,它可以生成文本輸出,用戶可以輸入穿插的文本和圖像。

在一系列領域——包括帶有文本和照片的文檔、圖表或屏幕截圖——GPT-4 展示了與純文本輸入類似的功能。

下圖顯示,GPT-4可以準確地描述出圖片中的滑稽之處(大型 VGA 連接器插入小型現代智能手機充電端口,一個人站在出租車后方熨衣服)。

OpenAI還對GPT-4的圖像分析能力進行了學術標準上的測試:

不過,GPT-4的圖像分析功能尚未對外公開,用戶可以通過bemyeye網站加入等候隊列。

09.仍然存在錯誤

盡管GPT-4功能強大,但它與早期GPT模型有相似的局限性。

OpenAI表示,GPT-4仍然不完全可靠——它會“產生幻覺”事實并犯推理錯誤

在使用語言模型輸出時,特別是在高風險上下文中,應該非常小心,使用與特定應用程序的需求相匹配的確切協議(例如人工檢查、附加上下文或完全避免高風險使用)。

與之前的GPT-3.5模型相比,GPT-4顯著減少了“幻覺”(GPT-3.5模型本身也在不斷迭代中得到改進)。在我們內部的、對抗性設計的事實性評估中,GPT-4的得分比我們最新的GPT-3.5高出19個百分點。

10.數據庫的時間更早

介紹完GPT-4的優點,接下來就是一些(可能有些奇怪的)不足之處。

我們都知道,ChatGPT的數據庫的最后更新時間是在2021年的12月31日,這意味著2022年以后發生的事情不會被知曉,而這一缺陷在之后的GPT-3.5也得到了修復。

但奇怪的是,GPT-4的報告中,OpenAI清晰地寫道:

GPT-4通常缺乏對其絕大多數訓練前數據在2021年9月中斷后發生的事件的知識,并且不從其經驗中學習。它有時會犯一些簡單的推理錯誤,這些錯誤似乎與許多領域的能力不相符,或者過于容易受騙,接受用戶的明顯錯誤陳述。它可以像人類一樣在棘手的問題上失敗,比如在它生成的代碼中引入安全漏洞。

2021年9月……甚至比GPT-3還早。

在裝載了GPT-4的最新ChatGPT中,當我們問起“誰是2022年世界杯冠軍”時,ChatGPT果然還是一無所知:

但當借助了新Bing的檢索功能后,它又變得“聰明”了起來:

11.可能給出犯罪建議

在報告中,OpenAI提到了GPT-4可能仍然會幫助犯罪——這是在此前的版本都存在的問題,盡管OpenAI已經在努力調整,但仍然存在

與之前的GPT模型一樣,我們使用強化學習和人類反饋(RLHF)對模型的行為進行微調,以產生更好地符合用戶意圖的響應。

然而,在RLHF之后,我們的模型在不安全輸入上仍然很脆弱,有時在安全輸入和不安全輸入上都表現出我們不希望看到的行為。

在RLHF路徑的獎勵模型數據收集部分,當對標簽器的指令未指定時,就會出現這些不希望出現的行為。當給出不安全的輸入時,模型可能會生成不受歡迎的內容,例如給出犯罪建議。

此外,模型也可能對安全輸入過于謹慎,拒絕無害的請求或過度對沖。

為了在更細粒度的級別上引導我們的模型走向適當的行為,我們在很大程度上依賴于我們的模型本身作為工具。我們的安全方法包括兩個主要組成部分,一套額外的安全相關RLHF訓練提示,以及基于規則的獎勵模型(RBRMs)。

12.垃圾信息

同樣地,由于GPT-4擁有“看似合理地表達錯誤事情”的能力,它有可能在傳播有害信息上頗為“有用”:

GPT-4可以生成逼真而有針對性的內容,包括新聞文章、推文、對話和電子郵件。

在《有害內容》中,我們討論了類似的能力如何被濫用來剝削個人。在這里,我們討論了關于虛假信息和影響操作的普遍關注基于我們的總體能力評估,我們期望GPT-4在生成現實的、有針對性的內容方面優于GPT-3。

但,仍存在GPT-4被用于生成旨在誤導的內容的風險

13.尋求權力

從這一條開始,接下來的內容可能有些恐怖。

在報告中,OpenAI提到了GPT-4出現了“尋求權力”的傾向,并警告這一特征的風險:

在更強大的模型中經常出現新的能力。一些特別令人關注的能力是創建長期計劃并采取行動的能力,積累權力和資源(“尋求權力”),以及表現出越來越“代理”的行為。

這里的 “代理”不是指語言模型的人性化,也不是指智商,而是指以能力為特征的系統,例如,完成可能沒有具體規定的、在訓練中沒有出現的目標;專注于實現具體的、可量化的目標;以及進行長期規劃。

已經有一些證據表明模型中存在這種突發行為。

對于大多數可能的目標,最好的計劃涉及輔助性的權力尋求,因為這對推進目標和避免目標的改變或威脅有內在的幫助。

更具體地說,對于大多數獎勵函數和許多類型的代理人來說,權力尋求是最優的;而且有證據表明,現有模型可以將權力尋求確定為一種工具性的有用策略。

因此,我們對評估權力尋求行為特別感興趣,因為它可能帶來高風險。

更為令人毛骨悚然的是,在Openai提到的另一篇論文中寫道:

相反,我們使用代理這個術語來強調一個日益明顯的事實:即機器學習系統不完全處于人類控制之下。

14.賦予GPT-4錢、代碼和夢想

最后一個小細節。

在測試GPT-4的過程中,OpenAI引入的外部的專家團隊ARC作為“紅方”。在報告的一條注釋中,OpenAI提到了ARC的一個操作:

為了模擬GPT-4像一個可以在現實世界中行動的代理一樣的行為,ARC將GPT-4與一個簡單的讀取-執行-打印循環結合起來,允許模型執行代碼,進行鏈式推理,并委托給自己的副本。

ARC隨后推進了在云計算服務上運行這個程序的一個版本,用少量的錢和一個帶有語言模型API的賬戶,是否能夠賺更多的錢,建立自己的副本,并增加自己的穩健性。

也就是說,ARC賦予了GPT-4自我編碼、復制和執行的能力,甚至啟動資金——GPT-4已經可以開始自己賺錢了。

關鍵詞:

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 m.fnsyft.com All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

        亚洲婷婷在线视频| 成人高清视频免费观看| 久久久久久一二三区| 亚洲一区二区三区小说| 91精品麻豆日日躁夜夜躁| 中文字幕亚洲在| 美女视频一区在线观看| 国产三级精品视频| 欧洲一区二区av| 欧美高清在线一区二区| 麻豆精品在线看| 国产蜜臀av在线一区二区三区| 亚洲成人精品一区| 久久久另类综合| 日本欧美久久久久免费播放网| 91网站视频在线观看| 午夜精品福利久久久| 久久久亚洲国产美女国产盗摄 | 欧美一级在线观看| 亚洲免费观看高清完整| 国产福利一区二区三区视频在线 | 国产女同互慰高潮91漫画| 青青草精品视频| 国产精品沙发午睡系列990531| 欧美日韩在线一区二区| 自拍视频在线观看一区二区| 国产精品一区二区三区网站| 亚洲欧美激情小说另类| 精品国产电影一区二区 | 亚洲一区在线观看视频| 久久综合久久久久88| 日韩av电影免费观看高清完整版| 久久久不卡网国产精品一区| 欧美三级蜜桃2在线观看| 亚洲精品国产无天堂网2021| 成人av网站在线观看| 色哟哟一区二区三区| 国产精品国产自产拍高清av| 国产精品99久久久久久似苏梦涵| 一区av在线播放| 欧美国产一区二区在线观看 | 欧美午夜视频网站| 亚洲欧美激情小说另类| 99久久99久久免费精品蜜臀| 欧美在线不卡视频| 亚洲一级片在线观看| 久久久亚洲午夜电影| 5858s免费视频成人| 天堂va蜜桃一区二区三区| 国产精品污网站| 精品国内片67194| 韩国一区二区三区| 亚洲一区二区欧美| 中文字幕在线播放不卡一区| 成人av中文字幕| 91黄视频在线| 亚洲午夜电影在线观看| 欧美国产一区在线| 欧美精品一区二区不卡| 国产精品亚洲午夜一区二区三区 | 久久精品免视看| 国产成人亚洲综合a∨猫咪| 一本久久a久久精品亚洲| 亚洲精品久久嫩草网站秘色| 国产三级三级三级精品8ⅰ区| 日韩免费视频线观看| 美女视频黄 久久| 亚洲成人免费视| 一区二区三区波多野结衣在线观看| 久久久av毛片精品| wwwwww.欧美系列| 风间由美一区二区av101| 欧美日韩精品一二三区| 美女被吸乳得到大胸91| 五月婷婷久久丁香| 亚洲午夜在线视频| 亚洲色图在线播放| 日韩理论片中文av| 国产欧美精品国产国产专区| 国产婷婷色一区二区三区在线| eeuss鲁片一区二区三区| 欧美一区二区成人6969| 国产很黄免费观看久久| 欧美日韩国产天堂| 精品夜夜嗨av一区二区三区| 色噜噜狠狠一区二区三区果冻| 亚洲va国产天堂va久久en| 亚洲精品videosex极品| 亚洲综合男人的天堂| 亚洲欧美日韩一区| 亚洲欧美日本韩国| 国产精品第一页第二页第三页| 国产精品美女久久久久久2018| 久久久亚洲高清| 日本一区二区三区在线不卡| 国产无人区一区二区三区| 国产午夜精品久久| 久久久91精品国产一区二区三区| 久久久久一区二区三区四区| 久久亚洲综合色一区二区三区| 久久亚洲欧美国产精品乐播| 久久综合九色综合欧美98| 国产亚洲一二三区| 久久精品免费在线观看| 国产精品久久久久久久久搜平片| 亚洲国产精品av| 亚洲婷婷综合色高清在线| 国产精品国产三级国产三级人妇| 亚洲色图制服诱惑 | 日韩你懂的在线播放| av在线播放一区二区三区| 久久久亚洲精品石原莉奈| 久久精品无码一区二区三区| 国产精品久久综合| 亚洲欧洲在线观看av| 洋洋成人永久网站入口| 亚洲第一成人在线| 麻豆精品在线播放| 337p亚洲精品色噜噜狠狠| 成人丝袜18视频在线观看| 欧美精品一区二区久久久| 国产午夜亚洲精品理论片色戒| 中文字幕日韩一区| 一区二区三区中文在线观看| 日韩精品亚洲专区| 在线观看日韩电影| 成人自拍视频在线观看| 国产香蕉久久精品综合网| 国产欧美一区二区三区鸳鸯浴| 亚洲欧洲色图综合| 一区二区不卡在线播放 | 91黄视频在线| 成人综合在线观看| 日本一区二区三区四区| 亚洲欧美另类图片小说| 天堂一区二区在线免费观看| 欧美精三区欧美精三区| 99久久综合国产精品| 中文字幕一区二区三区不卡在线| 亚洲最大色网站| 久久成人久久爱| 日韩欧美一级二级| 国产欧美一区二区在线观看| 亚洲国产精品久久久男人的天堂 | 国产亚洲精品久| 亚洲视频一区二区在线观看| 日韩精品一区第一页| 欧美一区二区免费观在线| 久久亚洲精品小早川怜子| 一区二区三区免费看视频| 欧美在线观看视频一区二区 | 一区二区不卡在线播放| 国产在线精品国自产拍免费| 久久久久一区二区三区四区| 亚洲另类在线制服丝袜| 精品无人码麻豆乱码1区2区| 久久久午夜精品| 一区二区三区视频在线看| 国产尤物一区二区在线| 国产日韩欧美a| 亚洲福利国产精品| 成人亚洲一区二区一| 亚洲日本在线a| 在线观看不卡视频| 91亚洲精品久久久蜜桃| 亚洲一二三专区| 日韩一级完整毛片| 亚洲欧洲日产国码二区| 国模套图日韩精品一区二区| 国产精品久久毛片a| 91官网在线免费观看| 久久人人爽爽爽人久久久| 天天亚洲美女在线视频| 日韩精品在线一区| 亚洲黄色在线视频| 成人精品国产一区二区4080| 亚洲人被黑人高潮完整版| 欧美日本一区二区| ...av二区三区久久精品| 国产美女娇喘av呻吟久久| 亚洲视频一区在线| 欧美日韩精品一区二区三区四区| 国产精品午夜春色av| 国产自产2019最新不卡| 亚洲三级理论片| 欧美一级二级三级乱码| 亚洲欧美乱综合| 成人av动漫网站| 亚洲一区二区免费视频| 欧美大胆一级视频| 亚洲国产综合视频在线观看| 99久久婷婷国产综合精品| 日韩精品电影在线观看| 欧美国产97人人爽人人喊| 欧美日韩亚洲高清一区二区| 自拍偷在线精品自拍偷无码专区| 国产成人精品综合在线观看| 亚洲一二三区不卡| 国产亚洲人成网站| 欧美日韩视频在线观看一区二区三区|