欧美三级一区 I 亚洲一本大道av久在线播放 I 神马影院一区二区 I 欧美日韩亚洲国产综合 I 午夜日韩福利 I 久久久久免费精品国产 I 小小拗女性bbwxxxx国产 I 精品日韩一区 I 天天射天天搞 I 久久精品极品盛宴观看 I 日韩欧美高清一区二区 I 国产日韩欧美网站 I 欧美在线天堂 I 久草91视频 I 99精品久久久久久久婷婷 I 天天网综合 I 黄色av播放 I 福利片一区二区 I 国产一区二区不卡老阿姨 I 91九色蝌蚪在线观看 I 亚洲 国产 日韩在线 精品 I 久久国内精品自在自线图片 I 华人在线视频 I 日韩城人免费 I 色小妹影院 I 久久亚洲人成综合网 I 久操中文在线 I 午夜精品三级久久久有码 I 天堂无码人妻精品av一区 I 久久亚洲精中文字幕冲田杏梨 I 精品少妇无码一区二区三批 I 女生裸体视频一区二区三区 I 91久久精品www人人做人人爽 I 欧洲做爰大片 I 一区二区三区中文字幕精品精品

首頁 > 汽車生活 > 汽車生活 > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時成本更低,速度更快。

一、o1-mini 簡介

  • OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評估基準(zhǔn)測試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過專門優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語言模型更小,因此運(yùn)行成本更低,更適合實(shí)際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語言模型更快,例如在單詞推理問題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競賽中取得了 70.0% 的成績,與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競賽中獲得了 1650 Elo 的評分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類偏好評估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語言類領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對良性邊緣案例的合規(guī)性(“不過度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評估

0.22

0.83

人工來源的越獄評估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識)方面的知識儲備有限。

六、未來展望

  • OpenAI 將在未來版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識儲備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語言模型更經(jīng)濟(jì)、更快,是需要推理能力但對世界知識要求不高的應(yīng)用的理想選擇。

來源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項,以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗,并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開放文檔格式 (ODT、ODS 和 ODP) 和專有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動和云,具有廣泛的專用增值功能和其他優(yōu)勢,例如 SLA。

汽車生活更多>>

三星首款三折疊!Galaxy Z TriFold國行開啟預(yù)定:售價19999元起 vivo新機(jī)突然官宣:驍龍8E5+四款新配色,12月15日見真章 多場景全通關(guān),長安啟源Q07用實(shí)力守護(hù)每一程 11月賣出2.4萬臺,車長近5米全系插混動力,方程豹鈦7有何底氣? 鴻蒙智行全面深化戰(zhàn)略合作 共建統(tǒng)一服務(wù)體系、共享充電網(wǎng)絡(luò),打造智能汽車生態(tài)聯(lián)盟 特斯拉上海超級工廠迎來第400萬輛整車下線,貢獻(xiàn)全球市場一半產(chǎn)量 國產(chǎn)純電方盒子再出海!悅也Plus在巴西市場正式投產(chǎn) 馬斯克發(fā)來賀電,特斯拉上海超級工廠第400萬輛整車下線 ChatGPT周活躍用戶數(shù)已突破8億 自費(fèi)購買,把豆包AI手機(jī)當(dāng)主力機(jī)3天,我的真實(shí)體驗有些不同 vivo攜前沿技術(shù)成果亮相數(shù)智科技生態(tài)大會,點(diǎn)亮數(shù)智生態(tài)新圖景 2025常州新能源購車補(bǔ)貼及常州參與省級汽車煥新補(bǔ)貼即將停止! 上汽通用凱迪拉克Vistiq中大型SUV申報,海外約7.9萬美元起 五恒健康座艙+1320km!別克至境世家43.99萬起,重新定義豪華MPV 家用車不是越省油就越好,這三款SUV有勁安全,坐著很舒適 14.98萬元起售!福特新蒙迪歐以全能實(shí)力,開啟智慧出行新體驗 保時捷Carrera GT:V10引擎轟鳴,體驗純粹機(jī)械駕駛的極致魅力 2025尖叫之夜全陣容炸穿內(nèi)娛!超百位明星空降澳門 一老板給員工“少發(fā)500塊可休10天假”引討論,回應(yīng):員工充分協(xié)商后一致同意,有人回老家有人買機(jī)票出去玩 全場景舒享大型MPV銳勝M(fèi)8正式上市,限時補(bǔ)貼后售價12.98萬起 五菱繽果Pro申報圖公布,圓潤造型純電小車 2025第48周銷量排行 華為Mate80系列進(jìn)入前三 戶外樓頂水箱液位實(shí)時監(jiān)測方案-超聲波液位檢測 藍(lán)光舞臺燈光下,四名歌手同步表演! 燉鍋奶茶加桃酥 “廣德三件套”為何能爆火? 欠中國代工廠超25億元,美知名機(jī)器人公司爆雷,瀕臨破產(chǎn)!一度占據(jù)80%美國市場 嵐圖追光L定檔12月10日上市,華系首款800V插混旗艦轎車即將登場 VLA大模型“點(diǎn)睛”,魏牌新藍(lán)山智駕如何從“聰明”到“懂你”? 預(yù)測會很猛,但沒想到會這么猛!《瘋狂動物城2》刷屏朋友圈,影院經(jīng)理:完全沒有對手 三星推出首款三折疊智能手機(jī) 搭載全套Galaxy AI