首頁
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人知識 > OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3  
 

OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

來源:AI MOOC人工智能平臺      編輯:創(chuàng)澤      時間:2020/6/9      主題:其他   [加盟]

2020年5月底OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3,最大的GPT-3模型參數(shù)達(dá)到了1750億個參數(shù)。論文《Language Models are Few-Shot Learners》長達(dá)74頁已發(fā)布在arXiv。

有網(wǎng)友估算最大的GPT-3模型大小大約有700G,這個大小即使OpenAI公開模型,我們一般的電腦也無法使用。一般需要使用分布式集群才能把這個模型跑起來。雖然OpenAI沒有公布論文的花費,不過有網(wǎng)友估計這篇論文大約花費了上千萬美元用于模型訓(xùn)練。

如此驚人的模型在模型的設(shè)計上和訓(xùn)練上有什么特別之處嗎?答案是沒有。作者表示GPT-3的模型架構(gòu)跟GPT-2是一樣的,只是使用了更多的模型參數(shù)。模型訓(xùn)練也跟GPT-2是一樣的,使用預(yù)測下一個詞的方式來訓(xùn)練語言模型,只不過GPT-3訓(xùn)練時使用了更多的數(shù)據(jù)。

既然這樣,那這只怪獸特別之處是什么?GPT-3論文的核心在于下圖:






多尺度圖卷積神經(jīng)網(wǎng)絡(luò):有效統(tǒng)一三維形狀離散化特征表示

解決了傳統(tǒng)圖卷積神經(jīng)網(wǎng)絡(luò)中圖節(jié)點學(xué)習(xí)到的特征對圖分辨率和連接關(guān)系敏感的問題,可以實現(xiàn)在低分辨率的三維形狀上學(xué)習(xí)特征,在高低分辨率形狀之上進(jìn)行測試,并且保持不同分辨率特征的一致性

履約時間預(yù)估:如何讓外賣更快送達(dá)

外賣履約時間預(yù)估模型,預(yù)估的是從用戶下單開始到騎手將餐品送達(dá)用戶手中所花的時間

性能超越最新序列推薦模型,華為諾亞方舟提出記憶增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)

記憶增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)對短期的商品語境信息建模,并使用共享的記憶網(wǎng)絡(luò)來捕捉商品之間的長期依賴,對多個模型進(jìn)行了對比,在Top-K序列推薦中效果極佳

如何創(chuàng)造可信的AI,這里有馬庫斯的11條建議

馬庫斯系統(tǒng)性地闡述了對當(dāng)前AI研究界的批判,從認(rèn)識科學(xué)領(lǐng)域中針對性地給出了11條可執(zhí)行的建議

用于微創(chuàng)手術(shù)的觸覺傳感器(二)

MIS 和RMIS觸覺傳感器最常用的傳感原理是基于電氣的傳感器。這些觸覺傳感器進(jìn)一步分為壓阻型、壓電型和電容型傳感器

用于微創(chuàng)手術(shù)的觸覺傳感器

應(yīng)用于MIS的觸覺傳感器主要是基于電學(xué)或光學(xué)原理開發(fā)的,應(yīng)該是小尺寸和圓柱形的,可在導(dǎo)管的管身或尖端集成

醫(yī)院候診區(qū)流感性疾病的非接觸式綜合檢測平臺

非接觸式檢測平臺FluSense由麥克風(fēng)陣列和熱成像攝像機(jī)組成,用于捕捉不同的候診室人群行為,包括咳嗽和語言活動以及候診室病人數(shù)量

大阪大學(xué)胡正濤博士(萬偉偉老師團(tuán)隊)為機(jī)器人開發(fā)通用工具解決復(fù)雜變種變量的操作任務(wù)

通過機(jī)械機(jī)構(gòu)實現(xiàn)機(jī)械手到工具的動力傳遞,無需外部控制及供能,對機(jī)器人的避障路徑規(guī)劃影響極小

深度學(xué)習(xí)的可解釋性研究(三)——是誰在撩動琴弦

神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種,變量敏感性分析用來檢驗輸入屬性變量對模型的影響程度,樣本敏感性分析用來研究具體樣本對模型的重要程度

深度學(xué)習(xí)的可解釋性研究(二)——不如打開箱子看一看

神經(jīng)網(wǎng)絡(luò)模型本身其實并不是一個黑箱,其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為

深度學(xué)習(xí)的可解釋性研究(一)— 讓模型具備說人話的能力

為決策樹模型是一個具有比較好的可解釋性的模型,以決策樹為代表的規(guī)則模型在可解釋性研究方面起到了非常關(guān)鍵的作用

不完美場景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法

騰訊優(yōu)圖實驗室高級研究員Louis在分享了自適應(yīng)缺陷數(shù)據(jù),業(yè)務(wù)場景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運營體系(ML0ps)實踐指
» 四驅(qū)四轉(zhuǎn)移動機(jī)器人運動模型及應(yīng)用分析
» 國內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場景
» 國內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728