国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

網絡消費網 >  科技 > > 正文
環球熱資訊!GPT-4 OpenAI的斷崖式領先 人類的專屬技能不多了
時間:2023-03-15 15:21:03

圖片來源@視覺中國

文 | 甲子光年,作者 | 趙健


(相關資料圖)

人工智能會替代人類嗎?在ChatGPT出現之后,人類對于這個問題的答案已經越來越沒有信心。

而在昨天夜里,OpenAI低調發布了深度學習新的里程碑:GPT-4,一個比ChatGPT更強大的大模型!OpenAI表示,GPT-4雖然在許多現實世界場景中的能力依舊不如人類,但在各種專業和學術基準上已經和人類表現持平。

GPT-4是一個多模態大模型,具有更強大的創造性、更長的上下文處理能力,可支持圖像輸入,還可以自定義GPT-4的語言風格。在OpenAI短短24分鐘的發布會中,有這樣一個場景:在草稿本上用紙筆畫出一個非常粗糙的草圖,拍照并上傳,GPT-4在10秒左右直接生成了網站代碼。

著名經濟學家朱嘉明表示:GPT-4是OpenAI創造出的又一個重大科技事件,達到了AI歷史上前所未有的、不可逆轉的新高度。

過去兩年,OpenAI重建了整個深度學習堆棧,并與微軟Azure一起從頭開始共同設計了一臺超級計算機。一年前,OpenAI訓練GPT-3.5(即ChatGPT)作為系統的第一次“試運行”,發現并修復了一些錯誤并改進了理論基礎。

OpenAI花了6個月的時間來迭代調整GPT-4,取得了有史以來最好的結果,并且成為第一個能夠提前準確預測其訓練性能的大型模型。這意味著大模型的訓練方法將會從過去的純粹“暴力美學”進化出更高的可控性與預期性。

這次OpenAI并沒有公布論文,只有一份技術報告,并且不提供架構(包括模型大小)、硬件、訓練計算、數據集構建、訓練方法等細節。換句話說,其他AI公司不可能再像過去一樣,走一條模仿、復現、超越的道路了

壓力來到了國內公司,尤其是明天即將發布文心一言的百度。

比ChatGPT更強大

GPT-4比以往任何時候都更具創造性和協作性。它可以承擔文本、音頻、圖像的生成、編輯任務,并能與用戶一起迭代創意和技術寫作任務,例如創作歌曲、編寫劇本或學習用戶的寫作風格等。

GPT-4能夠處理超過25000個單詞的文本,允許使用長格式內容創建、擴展對話以及文檔搜索和分析等用例。

在簡單的談話中,ChatGPT與GPT-4可能看不出太大差距。但是,當任務的復雜性達到足夠的閾值時,差異就會出現——GPT-4比GPT-3.5更可靠、更有創意,并且能夠處理更細微的指令。

左邊是ChatGPT,右邊是GPT-4

為了解這兩種模型之間的區別,OpenAI在各種基準測試中進行了測試,包括人類的模擬考試,比如GRE。OpenAI并沒有針對這些考試進行專門培訓,但GPT-4的排名依然名列前茅。例如,它通過模擬律師考試,分數在應試者的前10%左右;相比之下,GPT-3.5的得分在倒數10%左右。

GPT-4在語言風格上也迎來了更新。與具有固定冗長語氣和風格的經典ChatGPT不同,開發人員(普通用戶也將會開放)現在可以在“系統”消息中通過描述來規定他們的AI風格和任務,也就是“自定義”能力。

OpenAI在為機器學習模型設計的傳統基準上評估了GPT-4,大大優于現有的大型語言模型,以及大多數最先進的 (SOTA) 模型:

許多現有的ML基準測試都是用英語編寫的。OpenAI使用Azure Translate將MMLU基準——一套涵蓋57個主題的 14000個多項選擇題——翻譯成多種語言。在測試的24種語言中,GPT-4優于GPT-3.5和其他LLM(Chinchilla、PaLM)的英語語言性能,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言:

OpenAI表示內部也在使用GPT-4,對支持、銷售、內容審核和編程等功能產生了巨大影響。

多模態大模型,支持圖片輸入

除了文本能力的增強,GPT-4還帶來了新的能力——多模態,它可以接受圖像作為輸入并生成說明、分類和分析結果。

具體來說,它能在用戶輸入散布式文本與圖像后,自主生成文本輸出(自然語言、代碼等)。在包括帶有文本和照片的文檔、圖表與屏幕截圖中,GPT-4展示了與純文本輸入同樣強大的功能。此外,它還可以通過為純文本語言模型開發的測試時間技術實現進化,能運用少量鏡頭和思維鏈提示。

不過,GPT-4的圖像輸入展示仍然只是研究“樣品”預覽,真正的成果尚未公開。

GPT-4可以指出被加工圖片的“異常”之處

GPT-4還能讀懂“梗圖”,理解幽默

GPT-4甚至可以直接閱讀并分析帶有圖片的論文:

OpenAI在一組標準的學術視覺基準測試中對GPT-4的表現進行評估,預覽了它的性能。然而,OpenAI表示這些數字并不完全代表它的能力范圍,因為OpenAI不斷發現這個模型能夠解決新的、“令人興奮”的任務。OpenAI計劃很快發布更多的分析和評估數據,以及對測試時間技術影響的全面調查。

花6個月時間訓練,但訓練數據只截止到2021年9月

GPT-4是如何訓練出來的?

遵循GPT、GPT-2和GPT-3的研究路徑,OpenAI的深度學習方法利用更多數據和更多計算來創建越來越復雜和強大的語言模型。

過去兩年,OpenAI重建了整個深度學習堆棧,并與微軟Azure一起從頭開始共同設計了一臺超級計算機。一年前,訓練GPT-3.5作為系統的第一次“試運行”,OpenAI發現并修復了一些錯誤并改進了理論基礎。結果,GPT-4 訓練運行前所未有地穩定,成為能夠提前準確預測其訓練性能的第一個大型模型。

OpenAI花了6個月的時間使用對抗性測試程序和ChatGPT的經驗教訓迭代調整 GPT-4,從而在真實性、可操縱性以及拒絕越界和敏感問題方面獲得了有史以來最好的結果。在OpenAI的內部評估中,與GPT-3.5相比,GPT-4響應被禁止內容請求的可能性低82%,產生事實響應的可能性高40%。

與以前的GPT模型一樣,GPT-4基礎模型經過訓練可以預測文檔中的下一個單詞,并且使用公開可用的數據(例如互聯網數據)以及已獲得許可的數據進行訓練。

盡管功能強大,但GPT-4與早期的GPT模型具有相似的局限。最重要的是,它仍然不完全可靠,會“幻覺”事實并出現推理錯誤。

GPT-4的訓練數據截止到2021年9月,因此對之后發生的事件缺乏了解,并且不會從自己的經驗中學習。它有時會犯一些簡單的推理錯誤,這些錯誤似乎與其強大的跨領域功能不符,有時也會過于輕信用戶明顯錯誤的陳述;有時,它也會像人類一樣在解決難題時失敗,例如在生成的代碼中引入安全漏洞。

OpenAI提醒,在使用語言模型輸出時應格外小心,特別是在高風險上下文中,使用符合特定用例需求的確切協議(例如人工審查、附加上下文的基礎或完全避免高風險使用)。

為此,OpenAI納入了更多的人工反饋,包括ChatGPT用戶提交的反饋——這其中可能也包括你與ChatGPT的對話數據。OpenAI還與50多位專家合作,在AI安全和保障等領域獲得早期反饋。

雖然生成內容的可靠性仍是一個真問題,但GPT-4相對于以前的模型顯著減少了胡說八道。在OpenAI的內部對抗性真實性評估中,GPT-4的得分比OpenAI最新的GPT-3.5高 40%:

GPT-4項目的主要焦點之一是構建可預測擴展的深度學習框架,主要原因是對于像GPT-4這樣非常大的訓練任務,進行大量的模型特定調整是不可行的。

OpenAI開發了基礎設施和優化方法,能夠在多個規模下表現出非常可預測的行為。為了驗證這種可擴展性,OpenAI通過對使用相同方法進行訓練但計算量少10000倍的模型進行推斷,在內部代碼庫(不是訓練集的一部分)上準確預測了GPT-4的最終損失。

現在OpenAI可以準確預測OpenAI在訓練期間優化的指標(損失),開始開發方法來預測更多可解釋的指標。例如,OpenAI成功預測了HumanEval數據集子集的通過率,從計算量減少 1000 倍的模型推斷。

OpenAI認為,準確預測未來的機器學習能力是安全的重要組成部分,但相對于其潛在影響而言,它并沒有得到足夠的重視。OpenAI正在加大力度開發方法,為社會提供更好的未來系統預期指導,希望這成為該領域的共同目標。

如何嘗鮮GPT-4?

目前有兩種辦法可以體驗GPT-4。

如果你是普通用戶,此前訂閱了ChatGPT Plus,將會直接獲得GPT-4的訪問權限。不過,ChatGPT Plus只能用美國信用卡開通。

OpenAI將根據實踐中的需求和系統性能調整使用上限,但預計會受到嚴重的容量限制。

根據OpenAI看到的流量模式,OpenAI可能會為更高容量的GPT-4使用引入新的訂閱級別;OpenAI也希望在某個時候提供一些免費的GPT-4查詢,這樣那些沒有訂閱的人也可以嘗試一下。

如果你是開發者,要訪問GPT-4 API(使用與GPT-3.5-turbo相同的ChatCompletions API),需要像等待New Bing一樣加入OpenAI的候補名單。

OpenAI今天將開始邀請一些開發人員,并逐步擴大規模以平衡容量與需求。

OpenAI也公布了定價策略——每1000個prompt tokens0.03美元,每1000個completion tokens 0.06美元。默認速率限制為每分鐘4萬個token和每分鐘200個請求。

GPT-4的上下文長度為8192個token。OpenAI還提供了32768 個tokens上下文(約50頁文本)版本的有限訪問,該版本也將隨著時間自動更新(當前版本GPT-4-32k-0314,支持到6月14日)。定價為每1000個prompt token 0.06美元和每1000個completion token 0.12美元。

此外,OpenAI宣布開源其軟件框架OpenAI Evals,用于創建和運行基準測試以評估GPT-4等模型。

OpenAI使用Evals來指導OpenAI模型的開發,OpenAI的用戶可以應用它來跟蹤模型版本的性能,并不斷發展產品集成。例如,Stripe使用Evals來補充他們的人工評估,以衡量其基于GPT的文檔工具的準確性。

由于所有代碼都是開源的,Evals支持編寫新的類來實現自定義評估邏輯。然而,在OpenAI自己的經驗中,許多基準測試都遵循幾種“模板”的其中之一,因此OpenAI還包括了最有用的模板,包括一個“模型評估模板”——OpenAI發現GPT-4出人意料地能夠檢查自己的工作。

OpenAI希望Evals成為分享和眾包基準測試的工具,代表著最廣泛的失敗模式和困難任務。作為一個示范,OpenAI創建了一個邏輯謎題評估,其中包含GPT-4失敗的十個提示。Evals也與實施現有基準測試兼容;OpenAI包括了幾個實施學術基準測試和幾個(小的子集)CoQA集成的筆記本作為示例。

GPT-4已經積累了部分商業客戶。比如,Stripe使用GPT-4掃描商業網站并向客戶支持人員提供摘要,Duolingo將 GPT-4構建到新的語言學習訂閱層中。摩根士丹利正在創建一個由GPT-4驅動的系統,該系統將從公司文件中檢索信息并將其提供給金融分析師。可汗學院正在利用GPT-4構建某種自動化導師。

GPT-4將大模型推向了一個新的高度,甚至是“斷崖式”領先。包括谷歌、百度在內的海內外科技公司,不可避免地將面對自家產品“發布即落后”的尷尬局面,而微軟則躺在OpenAI背后“賺麻了”。

關鍵詞:

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 m.fnsyft.com All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

        欧美一级免费观看| 天天射综合影视| 精品在线一区二区| 国产午夜精品一区二区| 色哟哟一区二区三区| 久久一留热品黄| 丝袜国产日韩另类美女| 99国产精品久久久久久久久久| 亚洲激情图片一区| 日韩一区二区免费视频| 一区二区高清视频在线观看| 国产高清亚洲一区| 亚洲女子a中天字幕| 日韩欧美在线123| 亚洲一区二区在线视频| 成人黄色一级视频| 亚洲成人www| 国产香蕉久久精品综合网| 婷婷开心激情综合| 国产亚洲精品资源在线26u| 色诱视频网站一区| 国产精品三级视频| 国产精品一区二区在线播放| 亚洲女同女同女同女同女同69| 日韩一级精品视频在线观看| 亚洲一区二区美女| 91猫先生在线| 欧美色视频一区| 亚洲欧美国产77777| www.66久久| 日本伦理一区二区| 亚洲视频一区在线| 成人动漫视频在线| 91久久精品网| 亚洲精品va在线观看| 9l国产精品久久久久麻豆| 日本丶国产丶欧美色综合| 国产精品免费免费| 粉嫩蜜臀av国产精品网站| 亚洲mv在线观看| 最新久久zyz资源站| 粉嫩一区二区三区在线看| 亚洲va中文字幕| 国产精品国产三级国产专播品爱网| 国产主播一区二区| 亚洲福中文字幕伊人影院| 国产亚洲女人久久久久毛片| 国产一区二区福利| 午夜精品久久久久久久蜜桃app| 国产精品网友自拍| caoporen国产精品视频| 欧美优质美女网站| 亚洲第一在线综合网站| 国产欧美日韩另类视频免费观看| 欧美一级免费观看| 看片网站欧美日韩| 亚洲一区二区在线免费观看视频| 国产精品网站在线| 99久久99久久综合| 91精品欧美一区二区三区综合在| 人人狠狠综合久久亚洲| 一区二区三区四区五区视频在线观看| 国产日韩亚洲欧美综合| 成人免费视频视频| 欧美久久久一区| 免费不卡在线观看| 亚洲第一久久影院| 一区av在线播放| 国产精品国产三级国产| 国产亚洲成aⅴ人片在线观看| 成人一道本在线| 欧美精品99久久久**| 麻豆一区二区三| 色哟哟一区二区在线观看| 亚洲国产精品一区二区尤物区| 中文字幕一区二区5566日韩| 日本一区二区三级电影在线观看| 成人精品高清在线| 日韩免费电影一区| 国产精品456露脸| 欧美精品欧美精品系列| 久久99久久精品| 欧美影片第一页| 麻豆精品一区二区三区| 色婷婷久久综合| 日韩不卡在线观看日韩不卡视频| 亚洲一区二区三区四区中文字幕 | 国产精品123| 欧美日韩国产在线观看| 精品一区二区日韩| 欧美日韩在线不卡| 国产尤物一区二区| 9191国产精品| 国产成人99久久亚洲综合精品| 欧美巨大另类极品videosbest | 久久夜色精品国产欧美乱极品| 日韩免费在线观看| av一区二区久久| 久久中文字幕电影| 久久精品亚洲麻豆av一区二区| 久久精品夜色噜噜亚洲aⅴ| 久久日韩精品一区二区五区| 国产日产精品一区| 国产精品青草久久| 亚洲男女一区二区三区| 一区二区三区中文在线观看| 亚洲国产精品一区二区尤物区| 亚洲图片欧美色图| 美腿丝袜亚洲综合| 欧美疯狂性受xxxxx喷水图片| 国产成人av电影在线观看| 欧美成人a在线| 久久众筹精品私拍模特| 亚洲国产经典视频| 亚洲欧洲成人精品av97| 亚洲香蕉伊在人在线观| 色哟哟精品一区| 国产自产v一区二区三区c| 欧美一区二区三区在线看| av一二三不卡影片| 国产精品少妇自拍| 亚洲美女免费在线| 欧美aⅴ一区二区三区视频| 欧美日韩美少妇| 不卡电影免费在线播放一区| 国产日韩影视精品| 亚洲视频小说图片| 日韩精品视频网| 在线成人免费视频| 91女神在线视频| 亚洲欧美色一区| 一本大道久久a久久精二百| 国产一区二区三区在线观看免费 | 午夜精品福利在线| 国产乱一区二区| 久久久蜜桃精品| 亚洲天堂a在线| 日av在线不卡| 欧美videofree性高清杂交| 国产欧美日本一区视频| 亚洲午夜影视影院在线观看| 欧美三区免费完整视频在线观看| 成人av在线电影| 亚洲三级在线免费观看| 色av综合在线| 99精品桃花视频在线观看| 亚洲欧美成aⅴ人在线观看| 午夜精品一区二区三区电影天堂| 国产麻豆日韩欧美久久| 亚洲国产精品t66y| 香蕉乱码成人久久天堂爱免费| 国产成人免费在线视频| 国产精品久久久久永久免费观看| 亚洲一级电影视频| 国产乱码一区二区三区| 国产精品免费久久| 色综合久久久久久久久| 99精品1区2区| 亚洲午夜久久久久久久久电影网 | 亚洲一区二区三区不卡国产欧美| 欧美视频中文一区二区三区在线观看| 99久久er热在这里只有精品15| 亚洲激情自拍视频| 欧美日韩亚洲综合在线| 国产亚洲短视频| 日本成人在线电影网| 精品国产乱码久久久久久久| 亚洲欧美另类久久久精品2019| 国产制服丝袜一区| 国产精品美日韩| 欧美四级电影网| 国产精品污www在线观看| 免费在线视频一区| 国产欧美视频一区二区三区| 亚洲va天堂va国产va久| 99国内精品久久| 午夜精品福利一区二区蜜股av| 欧美成人官网二区| 亚洲国产成人高清精品| av影院午夜一区| 五月婷婷激情综合| 久久久久久免费| 色婷婷精品大在线视频| 国产视频不卡一区| 久久99精品国产| 亚洲视频一区二区免费在线观看| 欧美日韩mp4| 亚洲特黄一级片| 国产a级毛片一区| 亚洲国产精品久久人人爱蜜臀| 欧美成人精品高清在线播放| 亚洲福利国产精品| 久久精品夜色噜噜亚洲a∨| 老司机午夜精品| 中文字幕一区二区三| 在线成人高清不卡| 一区二区三区高清| 97aⅴ精品视频一二三区| 免费视频最近日韩| 日韩毛片一二三区|