欧美三级一区 I 亚洲一本大道av久在线播放 I 神马影院一区二区 I 欧美日韩亚洲国产综合 I 午夜日韩福利 I 久久久久免费精品国产 I 小小拗女性bbwxxxx国产 I 精品日韩一区 I 天天射天天搞 I 久久精品极品盛宴观看 I 日韩欧美高清一区二区 I 国产日韩欧美网站 I 欧美在线天堂 I 久草91视频 I 99精品久久久久久久婷婷 I 天天网综合 I 黄色av播放 I 福利片一区二区 I 国产一区二区不卡老阿姨 I 91九色蝌蚪在线观看 I 亚洲 国产 日韩在线 精品 I 久久国内精品自在自线图片 I 华人在线视频 I 日韩城人免费 I 色小妹影院 I 久久亚洲人成综合网 I 久操中文在线 I 午夜精品三级久久久有码 I 天堂无码人妻精品av一区 I 久久亚洲精中文字幕冲田杏梨 I 精品少妇无码一区二区三批 I 女生裸体视频一区二区三区 I 91久久精品www人人做人人爽 I 欧洲做爰大片 I 一区二区三区中文字幕精品精品

首頁(yè) > 汽車(chē)生活 > 汽車(chē)生活 > 微軟發(fā)布Phi-3 Mini:3.8B參數(shù)小到能塞進(jìn)手機(jī),性能媲美GPT-3.5

微軟發(fā)布Phi-3 Mini:3.8B參數(shù)小到能塞進(jìn)手機(jī),性能媲美GPT-3.5

發(fā)布時(shí)間:2024-04-24 22:46:37

 

編譯 | 長(zhǎng)頸鹿
編輯 | 香草

智東西4月24日?qǐng)?bào)道,4月23日,微軟在官網(wǎng)開(kāi)源了小語(yǔ)言模型(SLM)——Phi-3-mini。這是微軟Phi-3系列模型推出的首個(gè)模型。

Phi-3-mini作為微軟Phi系列的第四代產(chǎn)品,以其38億參數(shù)和3.3T tokens的龐大訓(xùn)練數(shù)據(jù)量,在語(yǔ)言、推理、編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中超越了眾多數(shù)百億參數(shù)規(guī)模的模型。

此外,Phi-3-mini有4k和128k tokens兩個(gè)上下文長(zhǎng)度變體,經(jīng)過(guò)預(yù)訓(xùn)練和指令調(diào)整,可以更好地理解人類(lèi)的語(yǔ)言、表達(dá)、邏輯并執(zhí)行不同類(lèi)型的指令。

與大語(yǔ)言模型相比,Phi-3-mini模型操作更為簡(jiǎn)便。該模型的體積很小,這一特性使其可以在端側(cè)部署和運(yùn)行。據(jù)稱(chēng),該模型可以作為聊天機(jī)器人離線訪問(wèn),且具有不亞于GPT-3.5的性能。

Phi-3-mini的成本大幅降低。微軟生成式AI研究副總裁塞巴斯蒂安·布貝克(Sébastien Bubeck)稱(chēng),相比于其他相似功能的模型,Phi-3-mini成本可能只有十分之一。

據(jù)微軟研究團(tuán)隊(duì)稱(chēng),Phi-3-mini小體積、高性能的創(chuàng)新歸功于由合成數(shù)據(jù)組成的數(shù)據(jù)集。該數(shù)據(jù)集由大量已過(guò)濾的網(wǎng)絡(luò)數(shù)據(jù)和其他AI制作的兒童讀物中的合成數(shù)據(jù)組成。

微軟計(jì)劃在未來(lái)幾周內(nèi)推出Phi-3系列的另外兩個(gè)模型,分別是Phi-3-small(7B)和Phi-3-medium(14B)。

目前有三個(gè)平臺(tái)可以獲取Phi-3-mini:

Microsoft Azure AI Studio:https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/2/registry/azureml

Hugging Face:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama:https://ollama.com/library/phi3

一、“小而美”的模型,Phi-3-mini優(yōu)于兩倍其尺寸模型

據(jù)微軟官網(wǎng)稱(chēng),Phi-3模型是目前能力最強(qiáng)、性?xún)r(jià)比最高的小型語(yǔ)言模型(SLM),其在多種語(yǔ)言、推理、編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中均展現(xiàn)出超越同等規(guī)模甚至更大型模型的能力。

Phi-3-mini包含兩種上下文長(zhǎng)度的規(guī)模,分別是4k和128k tokens,其中128k tokens的上下文窗口支持在同類(lèi)模型是首次實(shí)現(xiàn),且對(duì)模型質(zhì)量的影響微乎其微。此外,該模型經(jīng)過(guò)指令微調(diào),能夠以自然語(yǔ)言方式響應(yīng)和執(zhí)行多種指令,確保了其即時(shí)可用性。

Phi-3模型在小尺寸上具有突破性的性能。根據(jù)微軟研發(fā)團(tuán)隊(duì)的測(cè)試,Phi-3模型在基準(zhǔn)測(cè)試中優(yōu)于相同尺寸和更大尺寸的語(yǔ)言模型。其中,Phi-3-mini的性能優(yōu)于其尺寸兩倍的模型,而Phi-3-small和Phi-3-medium的性能優(yōu)于更大的模型,包括GPT-3.5 Turbo。

根據(jù)性能對(duì)照表,Phi-3-mini的兩個(gè)變體于基準(zhǔn)測(cè)試的19個(gè)對(duì)比項(xiàng)中,有17項(xiàng)勝過(guò)Gemma-7b模型,18項(xiàng)勝過(guò)Mistral-7b模型,11項(xiàng)勝過(guò)Llama-3-8B模型。但也有11項(xiàng)次于GPT3.5-Turbo模型,17項(xiàng)次于Claude-3 Sonnet模型。

 

▲Phi-3系列基準(zhǔn)測(cè)試對(duì)照表(圖源:微軟)

此外,微軟還在學(xué)術(shù)報(bào)告中稱(chēng)Phi-3模型的整體性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。

Phi系列模型的起源于微軟研究部門(mén),已經(jīng)被廣泛使用,其中Phi-2下載量超過(guò)200萬(wàn)次。從用于Python編碼的Phi-1開(kāi)始,到增強(qiáng)推理和理解的Phi-1.5,再到27億參數(shù)的Phi-2,Phi系列在語(yǔ)言理解方面超越了其25倍參數(shù)大小的模型。

微軟計(jì)劃在未來(lái)幾周內(nèi)推出Phi-3系列的另外兩個(gè)模型,分別是Phi-3-small(7B)和Phi-3-medium(14B),旨在為Azure AI和其他模型庫(kù)提供更靈活的選擇。

二、Phi-3遵循安全和高質(zhì),Phi-3-mini為多個(gè)平臺(tái)專(zhuān)門(mén)優(yōu)化

Phi-3模型的設(shè)計(jì)遵循了微軟的“負(fù)責(zé)任AI標(biāo)準(zhǔn)”,包括問(wèn)責(zé)制、透明度、公平性、可靠性與安全性、隱私與安全和包容性。Phi-3模型經(jīng)歷了嚴(yán)格的安全度量和評(píng)估、紅隊(duì)測(cè)試、敏感用途審查,并遵循安全指南,以確保這些模型在開(kāi)發(fā)、測(cè)試和部署過(guò)程中都符合微軟的標(biāo)準(zhǔn)和最佳實(shí)踐。

Phi-3模型在訓(xùn)練過(guò)程中采用了高質(zhì)量的數(shù)據(jù),這是基于先前的Phi模型工作的延續(xù)。它們還通過(guò)了廣泛的安全后訓(xùn)練,包括從人類(lèi)反饋中進(jìn)行的強(qiáng)化學(xué)習(xí)(RLHF)、在數(shù)十個(gè)傷害類(lèi)別上進(jìn)行的自動(dòng)測(cè)試和手動(dòng)紅隊(duì)測(cè)試。

此外,Phi-3-mini在Azure AI上配備了一套完整的部署、評(píng)估和微調(diào)工具鏈,并通過(guò)Ollama平臺(tái)使開(kāi)發(fā)者能夠在本地筆記本電腦上運(yùn)行。模型還針對(duì)ONNX Runtime進(jìn)行了優(yōu)化,支持Windows DirectML,并且實(shí)現(xiàn)了跨平臺(tái)支持,包括GPU、CPU和移動(dòng)硬件。

同時(shí),Phi-3-mini也作為英偉達(dá)推理微服務(wù)(NVIDIA NIM)提供,具備可廣泛部署的標(biāo)準(zhǔn)API接口,并對(duì)英偉達(dá)GPU進(jìn)行了專(zhuān)門(mén)優(yōu)化。

三、Phi-3提供離線推理場(chǎng)景,AI解決方案已落地印度

微軟公司通過(guò)提供Copilots幫助客戶用生成式AI進(jìn)行業(yè)務(wù)轉(zhuǎn)型。他們認(rèn)為,不同任務(wù)對(duì)質(zhì)量成本曲線上不同規(guī)模模型的需求正日益增長(zhǎng)。

小語(yǔ)言模型,如Phi-3,特別適用于以下情況:資源受限的環(huán)境,包括設(shè)備上和離線推理場(chǎng)景;延遲約束的場(chǎng)景,快速響應(yīng)時(shí)間至關(guān)重要;以及成本受限的用例,特別是那些具有較簡(jiǎn)單任務(wù)的用例。

由于尺寸較小,Phi-3模型可以在計(jì)算受限的推理環(huán)境中使用,特別是Phi-3-mini可以在端側(cè)使用。Phi-3模型的較小尺寸還使得微調(diào)或定制變得更加容易和更具成本效益。此外,較低的計(jì)算需求使其成本更低,延遲更好。較長(zhǎng)的上下文窗口使其能夠處理和推理大量的文本內(nèi)容,如文檔、網(wǎng)頁(yè)、代碼等。

微軟的一些客戶已經(jīng)開(kāi)始使用Phi-3構(gòu)建解決方案。比如農(nóng)業(yè)領(lǐng)域,Phi-3模型為農(nóng)民提供了更便捷、更經(jīng)濟(jì)的解決方案,并幫助他們?cè)跊](méi)有穩(wěn)定互聯(lián)網(wǎng)連接的情況下使用AI技術(shù)。

印度一家領(lǐng)先的商業(yè)集團(tuán)ITC正在將Phi-3模型用于Krishi Mitra(一款面向農(nóng)民的應(yīng)用程序)內(nèi),幫助印度農(nóng)民通過(guò)技術(shù)手段獲得更好的農(nóng)業(yè)解決方案。據(jù)悉,該應(yīng)用已經(jīng)覆蓋了超過(guò)一百萬(wàn)名農(nóng)民。

結(jié)語(yǔ):大小模型相輔相成,離線AI聊天已成現(xiàn)實(shí)

微軟的Phi-3模型設(shè)計(jì)的初衷旨在兼容多種設(shè)備。Phi-3與Stability AI的Zephyr、谷歌的Gemini Nano和Anthropic的Claude 3 Haiku等小型模型一樣,能夠在端側(cè)運(yùn)行,而無(wú)需依賴(lài)互聯(lián)網(wǎng)連接。

盡管云端大模型在性能上全面超越小模型,但它們也存在一些局限性,包括較高的成本、運(yùn)行速度以及對(duì)互聯(lián)網(wǎng)連接的依賴(lài)。相比之下,Phi-3允許用戶在沒(méi)有網(wǎng)絡(luò)的情況下與虛擬助手進(jìn)行互動(dòng),能夠在不上傳數(shù)據(jù)的前提下實(shí)現(xiàn)內(nèi)容總結(jié),解決了AI領(lǐng)域的一部分弊端。

未來(lái)這類(lèi)模型有望與智能手機(jī)集成,甚至可能內(nèi)置于常用家電中,為用戶的生活提供個(gè)性化建議。我們期待AI變得越來(lái)越生活化,也期待小語(yǔ)言模型在未來(lái)的進(jìn)步

汽車(chē)生活更多>>

三星首款三折疊!Galaxy Z TriFold國(guó)行開(kāi)啟預(yù)定:售價(jià)19999元起 vivo新機(jī)突然官宣:驍龍8E5+四款新配色,12月15日見(jiàn)真章 多場(chǎng)景全通關(guān),長(zhǎng)安啟源Q07用實(shí)力守護(hù)每一程 11月賣(mài)出2.4萬(wàn)臺(tái),車(chē)長(zhǎng)近5米全系插混動(dòng)力,方程豹鈦7有何底氣? 鴻蒙智行全面深化戰(zhàn)略合作 共建統(tǒng)一服務(wù)體系、共享充電網(wǎng)絡(luò),打造智能汽車(chē)生態(tài)聯(lián)盟 特斯拉上海超級(jí)工廠迎來(lái)第400萬(wàn)輛整車(chē)下線,貢獻(xiàn)全球市場(chǎng)一半產(chǎn)量 國(guó)產(chǎn)純電方盒子再出海!悅也Plus在巴西市場(chǎng)正式投產(chǎn) 馬斯克發(fā)來(lái)賀電,特斯拉上海超級(jí)工廠第400萬(wàn)輛整車(chē)下線 ChatGPT周活躍用戶數(shù)已突破8億 自費(fèi)購(gòu)買(mǎi),把豆包AI手機(jī)當(dāng)主力機(jī)3天,我的真實(shí)體驗(yàn)有些不同 vivo攜前沿技術(shù)成果亮相數(shù)智科技生態(tài)大會(huì),點(diǎn)亮數(shù)智生態(tài)新圖景 2025常州新能源購(gòu)車(chē)補(bǔ)貼及常州參與省級(jí)汽車(chē)煥新補(bǔ)貼即將停止! 上汽通用凱迪拉克Vistiq中大型SUV申報(bào),海外約7.9萬(wàn)美元起 五恒健康座艙+1320km!別克至境世家43.99萬(wàn)起,重新定義豪華MPV 家用車(chē)不是越省油就越好,這三款SUV有勁安全,坐著很舒適 14.98萬(wàn)元起售!福特新蒙迪歐以全能實(shí)力,開(kāi)啟智慧出行新體驗(yàn) 保時(shí)捷Carrera GT:V10引擎轟鳴,體驗(yàn)純粹機(jī)械駕駛的極致魅力 2025尖叫之夜全陣容炸穿內(nèi)娛!超百位明星空降澳門(mén) 一老板給員工“少發(fā)500塊可休10天假”引討論,回應(yīng):?jiǎn)T工充分協(xié)商后一致同意,有人回老家有人買(mǎi)機(jī)票出去玩 全場(chǎng)景舒享大型MPV銳勝M(fèi)8正式上市,限時(shí)補(bǔ)貼后售價(jià)12.98萬(wàn)起 五菱繽果Pro申報(bào)圖公布,圓潤(rùn)造型純電小車(chē) 2025第48周銷(xiāo)量排行 華為Mate80系列進(jìn)入前三 戶外樓頂水箱液位實(shí)時(shí)監(jiān)測(cè)方案-超聲波液位檢測(cè) 藍(lán)光舞臺(tái)燈光下,四名歌手同步表演! 燉鍋奶茶加桃酥 “廣德三件套”為何能爆火? 欠中國(guó)代工廠超25億元,美知名機(jī)器人公司爆雷,瀕臨破產(chǎn)!一度占據(jù)80%美國(guó)市場(chǎng) 嵐圖追光L定檔12月10日上市,華系首款800V插混旗艦轎車(chē)即將登場(chǎng) VLA大模型“點(diǎn)睛”,魏牌新藍(lán)山智駕如何從“聰明”到“懂你”? 預(yù)測(cè)會(huì)很猛,但沒(méi)想到會(huì)這么猛!《瘋狂動(dòng)物城2》刷屏朋友圈,影院經(jīng)理:完全沒(méi)有對(duì)手 三星推出首款三折疊智能手機(jī) 搭載全套Galaxy AI