国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

網絡消費網 >  科技 > > 正文
世界看點:GPT-4震撼發布:多模態大模型,直接升級ChatGPT、必應,開放API,游戲終結了?
時間:2023-03-15 06:25:28

在 ChatGPT 引爆科技領域之后,人們一直在討論 AI「下一步」的發展會是什么,很多學者都提到了多模態,我們并沒有等太久。今天凌晨,OpenAI 發布了多模態預訓練大模型 GPT-4。

GPT-4 實現了以下幾個方面的飛躍式提升:強大的識圖能力;文字輸入限制提升至 2.5 萬字;回答準確性顯著提高;能夠生成歌詞、創意文本,實現風格變化。

「GPT-4 是世界第一款高體驗,強能力的先進AI系統,我們希望很快把它推向所有人,」OpenAI 工程師在介紹視頻里說道。


(資料圖)

似乎是想一口氣終結這場游戲,OpenAI 既發布了論文(更像是技術報告)、 System Card,把 ChatGPT 直接升級成了 GPT-4 版的,也開放了 GPT-4 的 API。

另外,微軟營銷主管在 GPT-4 發布后第一時間表示:「如果你在過去六周內的任何時候使用過新的 Bing 預覽版,你就已經提前了解了 OpenAI 最新模型的強大功能。」是的,微軟的新必應早就已經用上了GPT-4。

接下來,就讓我們細細品味這場震撼發布。

GPT-4:我 SAT 考 710,也能當律師

GPT-4 是一個大型多模態模型,能接受圖像和文本輸入,再輸出正確的文本回復。實驗表明,GPT-4 在各種專業測試和學術 基準上的表現與人類水平相當。例如,它通過了模擬律師考試,且分數在應試者的前 10% 左右;相比之下,GPT-3.5 的得分在倒數 10% 左右。

OpenAI 花了 6 個月的時間使用對抗性測試程序和 ChatGPT 的經驗教訓對 GPT-4 進行迭代調整 ,從而在真實性、可控性等方面取得了有史以來最好的結果。

在過去的兩年里,OpenAI 重建了整個 深度學習堆棧,并與 Azure 一起為其工作負載從頭開始設計了一臺超級計算機。一年前,OpenAI 在訓練 GPT-3.5 時第一次嘗試運行了該超算系統,之后他們又陸續發現并修復了一些錯誤,改進了其理論基礎。這些改進的結果是 GPT-4 的訓練運行獲得了前所未有的穩定,以至于 OpenAI 能夠提前準確預測 GPT-4 的訓練性能,它也是第一個實現這一點的大模型。OpenAI 表示他們將繼續專注于可靠的擴展,進一步完善方法,以幫助其實現更強大的提前預測性能和 規劃未來的能力,這對安全至關重要。

OpenAI 正在通過 ChatGPT 和 API(有候補名單)發布 GPT-4 的文本輸入功能。圖像輸入功能方面,為了獲得更廣泛的可用性,OpenAI 正在與其他公司展開合作。

OpenAI 今天還開源了 OpenAI Evals,這是其用于自動評估 AI 模型性能的框架。OpenAI 表示此舉是為了讓所有人都可以指出其模型中的缺點,以幫助 OpenAI 進一步改進模型。

有趣的是,GPT-3.5 和 GPT-4 之間的區別很微妙。當任務的復雜性達到足夠的閾值時,差異就會出現 ——GPT-4 比 GPT-3.5 更可靠、更有創意,并且能夠處理更細微的指令。為了了解這兩個模型之間的差異,OpenAI 在各種 基準和一些為人類設計的模擬考試上進行了實驗。

OpenAI 還在為 機器學習模型設計的傳統 基準上評估了 GPT-4。GPT-4 大大優于現有的大型 語言模型,以及大多數 SOTA 模型:

許多現有的 機器學習 基準測試都是用英語編寫的。為了初步了解 GPT-4 在其他語言上的能力,研究團隊使用 Azure Translate 將 MMLU 基準 —— 一套涵蓋 57 個主題的 14000 個多項選擇題 —— 翻譯成多種語言。在測試的 26 種語言的 24 種中,GPT-4 優于 GPT-3.5 和其他大 語言模型(Chinchilla、PaLM)的英語語言性能:

就像許多使用 ChatGPT 的公司一樣,OpenAI 表示他們內部也在使用 GPT-4,因此 OpenAI 也在關注大型 語言模型在內容生成、銷售和編程等方面的應用效果。OpenAI 還使用 GPT-4 輔助人們評估 AI 輸出,這也是 OpenAI 對其策略的第二階段。OpenAI 既是 GPT-4 的開發者,也是使用者。

GPT-4:我能玩梗圖

GPT-4 可以接受文本和圖像形式的 prompt,新能力與純文本設置并行,允許用戶指定任何視覺或語言任務。

具體來說,它在人類給定由散布的文本和圖像組成的輸入的情況下生成相應的文本輸出(自然語言、代碼等)。在一系列領域 —— 包括帶有文本和照片的文檔、圖表或屏幕截圖上 ——GPT-4 展示了與純文本輸入類似的功能。此外,它還可以通過為純文本 語言模型開發的測試時間技術得到增強,包括少樣本和思維鏈 prompt。

比如給 GPT-4 一個長相奇怪的充電器的圖片,問為什么這很可笑?

GPT-4 回答道,VGA 線充 iPhone。

格魯吉亞和西亞的人均每日肉類消費,算平均數:

看起來,現在的 GPT 已經不會在計算上胡言亂語了:

還是太簡單,那直接讓它做題,還是個物理題:

GPT-4 看懂了法語題目,并完整解答:

GPT-4 可以理解一張照片里「有什么不對勁的地方」:

GPT-4 還可以量子速讀看論文,如果你給它 InstructGPT 的論文,讓它總結摘要,就會變成這樣:

如果你對論文里的某一個圖感興趣呢?GPT-4 也可以解釋一下:

接著來,問 GPT-4 梗圖是什么意思:

它給出了詳細的回答:

那么漫畫呢?

讓 GPT-4 解釋為什么要給 神經網絡加層數,似乎有一點加倍的幽默感。

不過 OpenAI 在這里說了,圖像輸入是研究預覽,仍不公開。

研究人員用學術的 Benchmark 視角來解讀 GPT-4 的看圖能力,然而這已經不夠了,他們還能不斷發現該模型可以令人興奮地處理新任務 —— 現在的矛盾是 AI 的能力和人類想象力之間的矛盾。

看到這里,應該有研究人員感嘆:CV 不存在了。

可控性

與具有固定冗長、平靜語氣和風格的經典 ChatGPT 個性不同,開發人員(以及 ChatGPT 用戶)現在可以通過在「系統」消息中描述這些方向來規定他們的 AI 的風格和任務。

系統消息允許 API 用戶在一定范圍內定制化實現不同的用戶體驗。OpenAI 知道你們在讓 ChatGPT 玩 Cosplay,也鼓勵你們這樣做。

局限性

盡管功能已經非常強大,但 GPT-4 仍與早期的 GPT 模型具有相似的局限性,其中最重要的一點是它仍然不完全可靠。OpenAI 表示,GPT-4 仍然會產生幻覺、生成錯誤答案,并出現推理錯誤。

目前,使用 語言模型應謹慎審查輸出內容,必要時使用與特定用例的需求相匹配的確切協議(例如人工審查、附加上下文或完全避免使用) 。

總的來說,GPT-4 相對于以前的模型(經過多次迭代和改進)已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%:

GPT-4 在 TruthfulQA 等外部 基準測試方面也取得了進展,OpenAI 測試了模型將事實與錯誤陳述的對抗性選擇區分開的能力,結果如下圖所示。

實驗結果表明,GPT-4 基本模型在此任務上僅比 GPT-3.5 略好;然而,在經過 RLHF 后訓練之后,二者的差距就很大了。以下是 GPT-4 的測試示例 —— 并不是所有時候它都能做出正確的選擇。

該模型在其輸出中可能會有各種偏見,OpenAI 在這些方面已經取得了進展,目標是使建立的 人工智能系統具有合理的默認行為,以反映廣泛的用戶價值觀。

GPT-4 通常缺乏對其絕大部分數據截止后(2021 年 9 月)發生的事件的了解,也不會從其經驗中學習。它有時會犯一些簡單的推理錯誤,這似乎與這么多領域的能力不相符,或者過于輕信用戶的明顯虛假陳述。有時它也會像人類一樣在困難的問題上失敗,比如在它生成的代碼中引入安全漏洞。

GPT-4 預測時也可能出錯但很自信,意識到可能出錯時也不會 double-check。有趣的是,基礎預訓練模型經過高度校準(其對答案的預測置信度通常與正確概率相匹配)。然而,通過 OpenAI 目前的后訓練(post-training)過程,校準減少了。

風險及緩解措施

OpenAI 表示,研究團隊一直在對 GPT-4 進行迭代,使其從訓練開始就更加安全和一致,所做的努力包括預訓練數據的選擇和過濾、評估和專家參與、模型安全改進以及監測和執行。

GPT-4 有著與以前的模型類似的風險,如產生有害的建議、錯誤的代碼或不準確的信息。同時,GPT-4 的額外能力導致了新的風險面。為了了解這些風險的程度,團隊聘請了 50 多位來自 人工智能對齊風險、網絡安全、生物風險、信任和安全以及國際安全等領域的專家,對該模型在高風險領域的行為進行對抗性測試。這些領域需要專業知識來評估,來自這些專家的反饋和數據為緩解措施和模型的改進提供了依據。

預防風險

按照 demo 視頻里 OpenAI 工程師們的說法,GPT-4 的訓練在去年 8 月完成,剩下的時間都在進行微調提升,以及最重要的去除危險內容生成的工作。

GPT-4 在 RLHF 訓練中加入了一個額外的安全獎勵信號,通過訓練模型拒絕對此類內容的請求來減少有害的輸出。獎勵是由 GPT-4 的零樣本分類器提供的,它判斷安全邊界和安全相關 prompt 的完成方式。為了防止模型拒絕有效的請求,團隊從各種來源(例如,標注的生產數據、人類的紅隊、模型生成的 prompt)收集多樣化的數據集,在允許和不允許的類別上應用安全獎勵信號(有正值或負值)。

這些措施大大在許多方面改善了 GPT-4 的安全性能。與 GPT-3.5 相比,模型對不允許內容的請求的響應傾向降低了 82%,而 GPT-4 對敏感請求(如醫療建議和自我傷害)的響應符合政策的頻率提高了 29%。

訓練過程

與之前的 GPT 模型一樣,GPT-4 基礎模型經過訓練可以預測文檔中的下一個單詞。OpenAI 使用公開可用的數據(例如互聯網數據)以及已獲得許可的數據進行訓練。訓練數據是一個網絡規模的數據 語料庫,包括數學問題的正確和錯誤解決方案、弱推理和強推理、自相矛盾和一致的陳述,以及各種各樣的意識形態和想法。

因此,當提出問題時,基礎模型的回應可能與用戶的意圖相去甚遠。為了使其與用戶意圖保持一致,OpenAI 依然使用 強化學習人類反饋 (RLHF) 來微調模型的行為。請注意,該模型的能力似乎主要來自預訓練過程 ——RLHF 不會提高考試成績(甚至可能會降低它)。但是模型的控制來自后訓練過程 —— 基礎模型甚至需要及時的工程設計來回答問題。

GPT-4 的一大重點是建立了一個可預測擴展的 深度學習棧。主要原因是,對于像 GPT-4 這樣的大型訓練,進行廣泛的特定模型調整是不可行的。團隊開發了基礎設施和優化,在多種規模下都有可預測的行為。為了驗證這種可擴展性,他們提前準確地預測了 GPT-4 在內部代碼庫(不屬于訓練集)上的最終損失,方法是通過使用相同的方法訓練的模型進行推斷,但使用的計算量為 1/10000。

現在,OpenAI 可以準確地預測在訓練過程中優化的指標(損失)。例如從計算量為 1/1000 的模型中推斷并成功地預測了 HumanEval 數據集的一個子集的通過率:

有些能力仍然難以預測。例如,Inverse Scaling 競賽旨在找到一個隨著模型計算量的增加而變得更糟的指標,而 hindsight neglect 任務是獲勝者之一。GPT-4 扭轉了這一趨勢。

能夠準確預測未來的 機器學習能力對于技術安全來說至關重要,但它并沒有得到足夠的重視,OpenAI 表示正在投入更多精力開發相關方法,并呼吁業界共同努力。

OpenAI 表示正在開源 OpenAI Evals 軟件框架,它被用于創建和運行 基準測試以評估 GPT-4 等模型,同時可以逐樣本地檢查模型性能。

ChatGPT 直接升級至 GPT-4 版

GPT-4 發布后,OpenAI 直接升級了 ChatGPT。ChatGPT Plus 訂閱者可以在 chat.openai.com 上獲得具有使用上限的 GPT-4 訪問權限。

要訪問 GPT-4 API(它使用與 gpt-3.5-turbo 相同的 ChatCompletions API),用戶可以注冊等待。OpenAI 會邀請部分開發者體驗。

獲得訪問權限后,用戶目前可以向 GPT-4 模型發出純文本請求(圖像輸入仍處于有限的 alpha 階段)。至于價格方面,定價為每 1k 個 prompt token 0.03 美元,每 1k 個 completion token 0.06 美元。默認速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。

GPT-4 的上下文長度為 8,192 個 token。OpenAI 還提供了 32,768 個 token 上下文(約 50 頁文本)版本的有限訪問,該版本也將隨著時間自動更新(當前版本 gpt-4-32k-0314,也支持到 6 月 14 日)。定價為每 1K prompt token 0.06 美元和每 1k completion token 0.12 美元。

以上,就是今天 OpenAI 關于 GPT-4 的所有內容了。令人不滿的一點是,OpenAI 公開的技術報告中,不包含任何關于模型架構、硬件、算力等方面的更多信息,可以說是很不 Open 了。

不管怎樣,迫不及待的用戶大概已經開始測試體驗了吧。

最后,也想問一下讀者,看完 GPT-4 的發布,你有何感想。

關鍵詞:

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 m.fnsyft.com All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

        性做久久久久久久久| 国产91精品欧美| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 日韩欧美中文一区二区| 亚洲欧美一区二区不卡| 国产一区视频网站| 国产精品美女久久久久av爽李琼 | 国产电影一区在线| 亚洲欧美日韩一区二区 | 国产日韩视频一区二区三区| 性久久久久久久| 久久久久久9999| 日本视频一区二区三区| 久久久www免费人成精品| 亚洲国产三级在线| 国产亚洲欧美激情| 久久精品国产**网站演员| 国产精品免费丝袜| 欧美一级免费观看| 性欧美疯狂xxxxbbbb| 久久嫩草精品久久久久| 欧美色窝79yyyycom| 亚洲人成精品久久久久| 懂色av中文一区二区三区| 亚洲一区二区三区视频在线| 久久久99精品久久| 久久超碰97人人做人人爱| 欧美国产欧美综合| 91精品啪在线观看国产60岁| 夜夜精品视频一区二区| 2022国产精品视频| 欧美日韩不卡在线| 午夜精品爽啪视频| 欧美国产成人精品| 欧美一级在线观看| 日韩高清在线一区| 综合久久久久综合| 久久网这里都是精品| 国产一区二区三区免费播放| 亚洲综合色视频| 国产网红主播福利一区二区| 国产传媒欧美日韩成人| 午夜不卡av免费| 亚洲精品视频免费观看| 久久久久九九视频| 日韩午夜激情视频| 久久99深爱久久99精品| 亚洲一区二区三区美女| 国产蜜臀av在线一区二区三区| 国产大陆a不卡| 欧美自拍丝袜亚洲| 午夜国产精品一区| 亚洲三级电影全部在线观看高清| 国产亚洲精品久| 成人黄色综合网站| 欧美日韩一区二区三区不卡| 亚洲r级在线视频| 亚洲视频 欧洲视频| 亚洲国产岛国毛片在线| 91亚洲精品一区二区乱码| 91精品一区二区三区在线观看| 另类小说视频一区二区| 亚洲高清视频的网址| 亚洲美女少妇撒尿| 国产精品女主播在线观看| 久久久不卡网国产精品一区| 国产麻豆精品视频| 欧美性生活一区| 日韩精品亚洲专区| 亚洲午夜久久久久中文字幕久| 亚洲免费观看高清完整| 亚洲国产精品国自产拍av| 久久精品一区二区三区不卡| 成人av集中营| 日韩一区二区麻豆国产| 国产精品18久久久久久久久| 欧美日韩一区二区三区免费看| 青青草国产成人av片免费| 亚洲一区二区高清| 一区二区不卡在线播放| 亚洲少妇最新在线视频| 亚洲三级免费观看| 国产精品久久福利| 亚洲欧洲三级电影| 国产精品乱人伦一区二区| 国产精品系列在线| 中文字幕第一页久久| 国产精品麻豆99久久久久久| 国产欧美一区二区精品仙草咪| 欧美激情一区二区三区四区| 久久一日本道色综合| 国产欧美一区二区三区在线看蜜臀| 91色porny在线视频| 久久精品网站免费观看| wwwwxxxxx欧美| 中文字幕av一区 二区| 国产欧美一二三区| 成人免费在线播放视频| 中文字幕一区二区三区在线播放 | 2023国产精品| 国产欧美综合色| 欧美激情一区二区三区不卡| 国产精品成人在线观看| 1000精品久久久久久久久| 一区二区三区在线高清| 亚洲一区二区三区在线看| 日日夜夜免费精品| 欧洲一区在线电影| 国产麻豆成人传媒免费观看| 日韩一区二区高清| www成人在线观看| 中文字幕亚洲综合久久菠萝蜜| 国产精品久久久久久亚洲毛片| 亚洲午夜成aⅴ人片| 婷婷国产在线综合| 欧美日韩亚州综合| 国产.欧美.日韩| 国产亚洲欧美色| 国产精品福利影院| 亚洲电影在线免费观看| 日本久久一区二区三区| 国产乱码精品一品二品| 久久在线观看免费| 国产精品三级久久久久三级| 依依成人精品视频| 五月激情综合婷婷| 国产精品综合网| 久久亚洲私人国产精品va媚药| 欧美国产乱子伦| 午夜天堂影视香蕉久久| 欧美日韩亚洲丝袜制服| 99热这里都是精品| 亚洲欧洲成人自拍| 午夜精彩视频在线观看不卡| 国产精品一区二区无线| 久久久国产午夜精品| 亚洲精选免费视频| 久久福利资源站| 久久网站热最新地址| 日韩美女视频一区| 美日韩一级片在线观看| 精品国产亚洲一区二区三区在线观看| 国产欧美综合在线观看第十页| 亚洲综合在线免费观看| 欧美亚洲国产一卡| 91欧美一区二区| 亚洲在线视频网站| 欧美日韩国产一区| 久久精品一区二区| 婷婷一区二区三区| 日韩精品一区二区三区在线| 国产精品嫩草影院com| 日韩高清不卡一区二区三区| 日韩欧美专区在线| 最新高清无码专区| 国模无码大尺度一区二区三区| 久久久久久久电影| 亚洲综合激情网| 成人免费毛片高清视频| 亚洲免费看黄网站| 欧美精品自拍偷拍| 中文字幕不卡在线播放| 美脚の诱脚舐め脚责91| 久久精品视频一区| 亚洲电影一区二区三区| 波波电影院一区二区三区| 亚洲男人天堂av| 678五月天丁香亚洲综合网| 国产精品久久久久久久第一福利| 美国十次综合导航| 国产精品无码永久免费888| 色哟哟一区二区在线观看| 91亚洲精华国产精华精华液| 亚洲成人av电影| 久久综合久久久久88| 亚洲国产视频a| 91老师国产黑色丝袜在线| 日韩中文欧美在线| 久久精品人人做人人爽人人| 色综合久久中文综合久久牛| www国产成人| 久久精品国产在热久久| 国产精品情趣视频| 欧美精品一二三四| 亚洲美女少妇撒尿| 成人国产亚洲欧美成人综合网| 亚洲一区二区不卡免费| 久久视频一区二区| 欧洲精品一区二区三区在线观看| 国产色产综合色产在线视频| 久久 天天综合| 一区二区三区四区五区视频在线观看 | 欧日韩精品视频| 国产精品久久久爽爽爽麻豆色哟哟 | 国产v综合v亚洲欧| 香蕉影视欧美成人| 国产三级一区二区| 欧美日韩的一区二区| 亚洲免费av在线| 久久久久久久久久久99999|