欧美三级一区 I 亚洲一本大道av久在线播放 I 神马影院一区二区 I 欧美日韩亚洲国产综合 I 午夜日韩福利 I 久久久久免费精品国产 I 小小拗女性bbwxxxx国产 I 精品日韩一区 I 天天射天天搞 I 久久精品极品盛宴观看 I 日韩欧美高清一区二区 I 国产日韩欧美网站 I 欧美在线天堂 I 久草91视频 I 99精品久久久久久久婷婷 I 天天网综合 I 黄色av播放 I 福利片一区二区 I 国产一区二区不卡老阿姨 I 91九色蝌蚪在线观看 I 亚洲 国产 日韩在线 精品 I 久久国内精品自在自线图片 I 华人在线视频 I 日韩城人免费 I 色小妹影院 I 久久亚洲人成综合网 I 久操中文在线 I 午夜精品三级久久久有码 I 天堂无码人妻精品av一区 I 久久亚洲精中文字幕冲田杏梨 I 精品少妇无码一区二区三批 I 女生裸体视频一区二区三区 I 91久久精品www人人做人人爽 I 欧洲做爰大片 I 一区二区三区中文字幕精品精品

首頁 > 汽車生活 > 汽車生活 > 谷歌開源最強端側(cè)小模型:2B參數(shù)越級跑贏GPT-3.5-Turbo

谷歌開源最強端側(cè)小模型:2B參數(shù)越級跑贏GPT-3.5-Turbo

發(fā)布時間:2024-08-01 22:35:25

谷歌也來卷「小」模型了,一出手就是王炸,勝過了比自己參數(shù)多得多的GPT-3.5、Mixtral競品模型。

今年 6 月底,谷歌開源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以來,27B 版本迅速成為了大模型競技場 LMSYS Chatbot Arena 中排名最高的開放模型之一,在真實對話任務中比其兩倍規(guī)模以上的模型表現(xiàn)還要好。

 

如今,僅僅過去了一個多月,谷歌在追求負責任 AI 的基礎上,更加地考慮該系列模型的安全性和可訪問性,并有了一系列新成果。

 

此次,Gemma 2 不僅有了更輕量級「Gemma 2 2B」版本,還構(gòu)建一個安全內(nèi)容分類器模型「ShieldGemma」和一個模型可解釋性工具「Gemma Scope」。具體如下:

  • Gemma 2 2B 具有內(nèi)置安全改進功能,實現(xiàn)了性能與效率的強大平衡;
  • ShieldGemma 基于 Gemma 2 構(gòu)建,用于過濾 AI 模型的輸入和輸出,確保用戶安全;
  • Gemma Scope 提供對模型內(nèi)部工作原理的無與倫比的洞察力。

其中,Gemma 2 2B 無疑是「最耀眼的仔」,它在大模型競技場 LMSYS Chatbot Arena 中的結(jié)果令人眼前一亮:僅憑 20 億參數(shù)就跑出了 1130 分,這一數(shù)值要高于 GPT-3.5-Turbo(0613)和 Mixtral-8x7b。

這也意味著,Gemma 2 2B 將成為端側(cè)模型的最佳選擇。

 

 

蘋果機器學習研究(MLR)團隊研究科學家 Awni Hannun 展示了 Gemma 2 2B 跑在 iPhone 15 pro 上的情況,使用了 4bit 量化版本,結(jié)果顯示速度是相當快。

 

 

 
00:01 / 00:26
 
 

 

視頻來源:https://x.com/awnihannun/status/1818709510485389563

此外,對于前段時間很多大模型都翻了車的「9.9 和 9.11 誰大」的問題,Gemma 2 2B 也能輕松拿捏。

 

 

圖源:https://x.com/tuturetom/status/1818823253634564134

與此同時,從谷歌 Gemma 2 2B 的強大性能也可以看到一種趨勢,即「小」模型逐漸擁有了與更大尺寸模型匹敵的底氣和效能優(yōu)勢。

這種趨勢也引起了一些業(yè)內(nèi)人士的關注,比如知名人工智能科學家、Lepton AI 創(chuàng)始人賈揚清提出了一種觀點:大語言模型(LLM)的模型大小是否正在走 CNN 的老路呢?

在 ImageNet 時代,我們看到參數(shù)大小快速增長,然后我們轉(zhuǎn)向了更小、更高效的模型。這是在 LLM 時代之前,我們中的許多人可能已經(jīng)忘記了。

  • 大型模型的曙光:我們以 AlexNet(2012)作為基線開始,然后經(jīng)歷了大約 3 年的模型大小增長。VGGNet(2014)在性能和尺寸方面都可稱為強大的模型。
  • 縮小模型:GoogLeNet(2015)將模型大小從 GB 級縮小到 MB 級,縮小了 100 倍,同時保持了良好的性能。類似工作如 SqueezeNet(2015)和其他工作也遵循類似的趨勢。
  • 合理的平衡:后來的工作如 ResNet(2015)、ResNeXT(2016)等,都保持了適中的模型大小。請注意,我們實際上很樂意使用更多的算力,但參數(shù)高效同樣重要。
  • 設備端學習?MobileNet(2017)是谷歌的一項特別有趣的工作,占用空間很小,但性能卻非常出色。上周,我的一個朋友告訴我「哇,我們?nèi)匀辉谑褂?MobileNet,因為它在設備端具有出色的特征嵌入通用性」。是的,嵌入式嵌入是實實在在很好用。

最后,賈揚清發(fā)出靈魂一問,「LLM 會遵循同樣的趨勢嗎?」

汽車生活更多>>

庫克稱iPhone 17等兼容機型用戶正“積極利用”蘋果牌AI IDC發(fā)布最新數(shù)據(jù):OPPO系手機全球銷量猛增,擠進前三! 特斯拉財報會議萬字實錄|馬斯克意外官宣停產(chǎn)Model S/X;直言只有中國機器人配做對手 【智庫聲音】上觀新聞 | 張虎祥等:社群運營:上海社區(qū)商業(yè)的新玩法 抖音電商:年貨節(jié)期間品牌年貨禮盒銷量增長3倍 對話九識CEO孔旗:我們已實現(xiàn)業(yè)務現(xiàn)金流和毛利率正向增長 千問迭代,是阿里的又一次 AI 戰(zhàn)略選擇 哈工大系闖出人形機器人黑馬:成立不到一年,全棧開源3m/s原型機 新能源車的「硬核」戰(zhàn)事,2026年卷向何處? 賈國龍再發(fā)聲:西貝從來不存在“兩歲的西藍花”,現(xiàn)在標準是一個月內(nèi)使用完畢 ARR達2.4億美元,可靈能帶快手起飛嗎? 世界級工廠按斤賣,觀致常熟工廠是如何被人為做空的 兩部門:對公租房建設期間用地及公租房建成后占地,免征城鎮(zhèn)土地使用稅 華住,比攜程還會撈金? 追覓科技俞浩:生態(tài)鏈基金已獲募資數(shù)量和規(guī)模雙料第一 國泰海通證券:維持農(nóng)夫山泉“增持”評級 料下半年提速 盈利繼續(xù)樂觀 國泰海通證券:維持優(yōu)然牧業(yè)(09858)“增持”評級 大股東定增彰顯信心 新一代奧迪Q5L賣30.98萬起!盤盤優(yōu)缺點,我推薦購買嗎? Agent時代,為什么多模態(tài)數(shù)據(jù)湖是必選項? 索尼與本田聯(lián)手造車了?AFEELA 1亮相,車內(nèi)可遠程操控PS游戲機 尺寸全面升級!哈弗猛龍加長版要來了,造型硬朗氣派,搭1.5T插混 本田革新品牌標識 “雙手”新“H”引領2027電動化新紀元‌ 北向資金持倉路徑曝光!全球鋰電巨頭連續(xù)7個季度獲加倉,商業(yè)航天概念股獲大面積掃貨 又一半導體概念股,將登陸A股!本周五申購! iQOO/紅米/OPPO/真我新機齊發(fā):誰才是真正的中端小鋼炮? 消息稱蘋果iOS 26.4將對健康應用進行重大升級 榮耀MagicBook Pro 14 2026筆記本亮相CES 小米開出大罰單,許斐徐潔云取消年終獎,辭退經(jīng)辦人員,大熊道歉 這誰頂?shù)米。縤QOO新機1月6日突襲曝光,性能直接拉滿到爆! iPhone 18影像規(guī)格曝光,沒有2億像素