色婷婷综合久色aⅴ_欧美高清性xxxxhdvideosex_www.国产一区二区_国产一区日韩二区欧美三区_成人字幕网zmw_亚洲色图欧美在线

首頁 > 汽車生活 > 汽車生活 > 驅(qū)動增強(qiáng)終端側(cè)生成式AI體驗(yàn)的技術(shù):多模態(tài)生成式AI

驅(qū)動增強(qiáng)終端側(cè)生成式AI體驗(yàn)的技術(shù):多模態(tài)生成式AI

發(fā)布時(shí)間:2024-05-11 16:37:39來源: 15210273549

改善情境化和定制化一直是用戶體驗(yàn)的長期需求。例如,消費(fèi)者希望終端能夠自動利用來自智能手機(jī)數(shù)據(jù)和傳感器的情境信息和自定義偏好,讓體驗(yàn)更直觀和無縫,比如基于當(dāng)前位置、時(shí)刻和食物選擇偏好推薦餐廳用餐,創(chuàng)造愉悅體驗(yàn)。

盡管生成式AI已展現(xiàn)出新興的和變革性的能力,但其仍有很大改進(jìn)空間。類似多模態(tài)生成式AI等這樣的技術(shù)可應(yīng)對生成式AI更加情境化和定制化的體驗(yàn)趨勢。

多模態(tài)生成式AI模型輸入和輸出多種模態(tài),以提供更佳響應(yīng)和答案

多模態(tài)AI模型能夠更好的理解世界

大語言模型(LLM)為純文本訓(xùn)練模型帶來了驚艷的能力。如果模型能夠支持包含更多知識的不同信息形式,能帶來怎樣的提升呢?

人類能夠通過語言和閱讀文字學(xué)到很多東西,但也需要通過各種感官和互動形成對世界的理解:

我們的眼睛讓我們能夠看到球在傾斜地面上滾動的場景,以及當(dāng)球滾到沙發(fā)后面會如何消失。

我們的耳朵可以識別語音中的情緒或警報(bào)聲來源的方向。

我們與世界的接觸和互動讓我們知道如何用手握住泡沫塑料咖啡杯,以及如何在走路時(shí)避免摔倒。

類似的例子不勝枚舉。

盡管語言可以描述幾乎所有這些事情,但它可能不如其他模態(tài)做得那么好或那么高效。

正如人類需要利用各種感官學(xué)習(xí),生成式AI除了利用文本之外還可以使用更多其他模態(tài)學(xué)習(xí):這正是多模態(tài)生成式AI模型的作用所在。

多模態(tài)生成式AI模型可基于一系列模態(tài)進(jìn)行訓(xùn)練,包括文本、圖像、語音、音頻、視頻、3D、激光雷達(dá)(LIDAR)、射頻(RF)、以及幾乎任何傳感器數(shù)據(jù)。

通過利用所有這些傳感器,融合數(shù)據(jù),并更全面地理解世界,多模態(tài)生成式AI模型可以提供更佳答案。AI研究人員已經(jīng)做到了這一點(diǎn),他們利用不同模態(tài)的一系列數(shù)據(jù)在云端訓(xùn)練多模態(tài)大模型(LMM),讓模型更“智能”。OpenAIGPT-4V和谷歌Gemini就是這類LMM。

這能給用戶帶來什么?舉例來說,LMM可以充當(dāng)通用助手,接收任何模態(tài)的輸入,為更廣泛的問題類型提供大幅改進(jìn)的答案。比如基于復(fù)雜的停車標(biāo)志回答用戶可否停車,或基于振動噪音回答用戶該如何修理洗碗機(jī)故障。

下一步,部署LMM進(jìn)行推理:盡管生成式AI推理可在云端運(yùn)行,但在邊緣終端側(cè)運(yùn)行有著諸多好處,比如隱私、可靠性、成本效益和即時(shí)性。

例如,傳感器和相應(yīng)的傳感器數(shù)據(jù)來源于邊緣終端,因此在終端側(cè)處理和保存數(shù)據(jù)更具成本效益和可擴(kuò)展性。

終端側(cè)LLM現(xiàn)在具備視覺理解能力

高通AI研究近期演示了全球首個(gè)在Android手機(jī)上運(yùn)行的多模態(tài)LLM。我們展示了一個(gè)超過70億參數(shù)的大語言和視覺助理大模型(LLaVA),其可接受包括文本和圖像在內(nèi)的多種類型的數(shù)據(jù)輸入,并生成關(guān)于圖像的多輪對話。通過全棧AI優(yōu)化,LLaVA能夠在搭載第三代驍龍8移動平臺的參考設(shè)計(jì)上以實(shí)時(shí)響應(yīng)的速度在終端側(cè)生成token。

具有語言理解和視覺理解能力的LMM能夠賦能諸多用例,例如識別和討論復(fù)雜的視覺圖案、物體和場景。

例如,視覺AI助手可以幫助視力障礙者更好地理解周圍環(huán)境并與之互動,從而提高生活質(zhì)量。

終端側(cè)LLM現(xiàn)在具備聽覺理解能力

在搭載驍龍XElite的WindowsPC上,高通近期還展示了全球首個(gè)在終端側(cè)運(yùn)行的超70億參數(shù)的LMM,可接受文本和環(huán)境音頻輸入(如音樂、交通環(huán)境音頻等),并基于音頻內(nèi)容生成多輪對話。

音頻提供的更多情境信息可以幫助LMM針對用戶的提示給出更佳答案。我們很高興看到終端側(cè)LMM現(xiàn)已支持視覺、語音和音頻模態(tài),并期待對更多模態(tài)的支持。

生成式AI時(shí)代剛剛開始,無限創(chuàng)新即將到來

更多終端側(cè)生成式AI技術(shù)進(jìn)步即將到來

打造能夠更好理解情境信息的AI模型是獲得更佳答案和體驗(yàn)提升的必要條件,多模態(tài)生成式AI正是即將應(yīng)用于未來終端的最新變革性技術(shù)之一。歡迎閱讀博客第二部分,我將深入介紹LoRA,探究它將如何幫助應(yīng)對現(xiàn)有挑戰(zhàn),為消費(fèi)者和企業(yè)規(guī)模化提供情境化、定制化和個(gè)性化體驗(yàn)。

汽車生活更多>>

風(fēng)云A8降2萬 如今這個(gè)價(jià)格是怎樣做到越級之選的 家門口享受原廠服務(wù),北京現(xiàn)代聯(lián)手京東養(yǎng)車,車主修車更方便了! 智領(lǐng)未來!北京現(xiàn)代攜手京東養(yǎng)車,開啟數(shù)字化養(yǎng)車全新時(shí)代 4月多款新車上市 方程豹鈦3預(yù)計(jì)小訂單輕松破萬!訂單數(shù)據(jù)和用戶畫像如何? 12.98萬元搭配激光雷達(dá)智駕!零跑B10的預(yù)售成績火爆 奇瑞“不客氣”,混動技術(shù)如何智領(lǐng)全球? 吉利銀河星耀8預(yù)售開啟:中國豪華電混轎車的“破局者”來了! 國民車紅旗H5 PHEV 國車級超規(guī)格全維安 比亞迪騰勢Z9 GT交付破萬,創(chuàng)新能源豪華GT車型最快紀(jì)錄 小姐姐最愛買的電動車:小鵬MONA M03累計(jì)交付超6萬臺 方程豹豹8交付破萬,國產(chǎn)硬派SUV新速度 smart品牌全球銷量增長7%,2025年拓展超10個(gè)海外市場 虞美人花在廢墟上綻放:加拿大的戰(zhàn)爭紀(jì)念 甘會斌|人間已無格爾茨 秉持國匠擔(dān)當(dāng),天津城投·時(shí)代之城引領(lǐng)城市更新迭代 理解貴州|紅色I(xiàn)P,何以鮮亮如新——解碼貴州紅色之旅的現(xiàn)代表達(dá) 上海春運(yùn)辦:對外客運(yùn)量呈快速增長趨勢,明天將發(fā)送63萬人次 《國色芳華》:花開應(yīng)傲骨 我要去長安探秘,長安汽車黑科技體驗(yàn)營免費(fèi)開放 比亞迪全新跑車曝光,對標(biāo)保時(shí)捷911,老百姓買得起不? 豐田MR2有望重生,Celica及旗艦超跑也在路上 自動駕駛新時(shí)代即將到來?中美兩地對比測試小鵬特斯拉智駕系統(tǒng) 比亞迪唐L霸氣來襲,提供無人機(jī)艙,1月17日正式發(fā)布,劍指理想L6 捷尼賽思GV60 Magma能否憑借650馬力刷新高性能電動車市場格局? 37年聚焦中國用戶需求,一汽奧迪以“56789” 體系再現(xiàn)王者實(shí)力 6.2L V8機(jī)增+720Ps馬力,4秒內(nèi)破百,美式SUV頂流,油門給我踩踩踩! 2025年舟山市定海區(qū)民政局招聘社會救助專職社工公告 2025年溫州市蒼南縣人武部招聘民兵教練員駕駛員公告 2025年紹興科技館招聘工作人員公告
主站蜘蛛池模板: 日本高清在线观看视频 | 欧美日色 | 色哟哟哟在线精品观看视频 | 啪啪免费网站 | 女人被男人狂躁下面在线观看 | 欧美高清另类自拍视频在线看 | 欧美又黄又嫩大片a级 | 日韩精品hd | 色综合激情 | www.yw193.com| 中文字幕日韩欧美一区二区三区 | 成人精品视频 成人影院 | 9191在线 | www中文字幕 | 九九色网站 | 国产精品中文在线 | 国产高清在线精品一区二区三区 | 久久久久久国产精品mv | 摸金校尉之九幽将军 | 亚洲欧洲精品成人久久奇米网 | 欧美操人视频 | 亚洲精品人成网在线播放蜜芽 | 91久久精品国产一区二区 | 久综合网 | www嫩草| 亚洲精品国产电影 | 91久久国产视频 | 九九热视频免费 | 国产精品视频在线观看 | 九九99热久久精品在线9 | 国产一区 | 少妇特黄a一区二区三区88av | 色成人在线 | 丁香花在线电影小说观看 | 日韩欧美一区二区三区不卡在线 | 看黄色毛片 | 91大神精品长腿在线观看网站 | 久草2018| 狠狠操天天操 | 狠狠操狠狠操狠狠操 | 国产91在线观看 |