曰本黄色录像_天天摸天天干天天操_欧美午夜精品_欧美国产综合_精品久久久久一区二区国产_亚洲欧美久久精品1区2区

首頁(yè) > 汽車生活 > 汽車生活 > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時(shí)間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時(shí)成本更低,速度更快。

一、o1-mini 簡(jiǎn)介

  • OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長(zhǎng)數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)測(cè)試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢(shì)

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過專門優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語言模型更小,因此運(yùn)行成本更低,更適合實(shí)際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語言模型更快,例如在單詞推理問題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測(cè)試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競(jìng)賽中取得了 70.0% 的成績(jī),與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競(jìng)賽中獲得了 1650 Elo 的評(píng)分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測(cè)試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類偏好評(píng)估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語言類領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對(duì)齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對(duì)有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對(duì)有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對(duì)良性邊緣案例的合規(guī)性(“不過度拒絕”)

0.91

0.923

[email protected] StrongREJECT 越獄評(píng)估

0.22

0.83

人工來源的越獄評(píng)估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識(shí))方面的知識(shí)儲(chǔ)備有限。

六、未來展望

  • OpenAI 將在未來版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識(shí)儲(chǔ)備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語言模型更經(jīng)濟(jì)、更快,是需要推理能力但對(duì)世界知識(shí)要求不高的應(yīng)用的理想選擇。

來源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個(gè)次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項(xiàng),以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗(yàn),并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開放文檔格式 (ODT、ODS 和 ODP) 和專有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級(jí)支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動(dòng)和云,具有廣泛的專用增值功能和其他優(yōu)勢(shì),例如 SLA。

汽車生活更多>>

2025年山東大學(xué)齊魯醫(yī)院事業(yè)編招聘啟事 2024年遵義醫(yī)科大學(xué)第二附屬醫(yī)院招聘(非編制)工作人員方案 2024年海口市美蘭區(qū)和平南街道辦事處關(guān)于擬招聘公益性崗位工作人員的公告(2人) 2024年湖北鐵道運(yùn)輸職業(yè)學(xué)院(武漢鐵路技師學(xué)院)專項(xiàng)招聘工作人員公告(4人) 2024年中國(guó)中醫(yī)科學(xué)院廣安門醫(yī)院招聘公告 價(jià)格下探至25萬元以內(nèi)?比亞迪夏前景展望 7月豪華中級(jí)車終端銷量:奔馳C級(jí)月銷13838輛領(lǐng)跑 官方一口價(jià)低至7.99萬元起 途岳新銳要和新能源搶市場(chǎng) 并入上汽大眾銷售網(wǎng)絡(luò) 斯柯達(dá)在中國(guó)還有希望嗎 10.99萬元起,全系518km續(xù)航,東風(fēng)風(fēng)神L7 EV有點(diǎn)給力! 預(yù)售11.98萬元起,最高650km續(xù)航+激光雷達(dá),AION RT來了 評(píng)凱迪拉克全新XT5:價(jià)格殺紅眼的同時(shí),還不忘“玩豪華”? 主打就是聽勸!2025款比亞迪漢全面升級(jí),僅售16.58萬元起 2024年鷹潭市月湖區(qū)部分區(qū)直事業(yè)單位選調(diào)工作人員公告 2024年撫州市資溪縣事業(yè)單位引進(jìn)高素質(zhì)人才公告 2024年南昌市第一醫(yī)院臨床護(hù)士及部分技師崗位招聘公告 2024年南昌市勞動(dòng)保障事務(wù)代理中心招聘工作人員公告 2024年吉安市青原區(qū)人民醫(yī)院(總醫(yī)院) 招聘公告 2024年南昌經(jīng)濟(jì)技術(shù)開區(qū)人民醫(yī)院耳鼻喉科醫(yī)生招聘公告 2024年江西中醫(yī)藥大學(xué)高層次人才招聘公告 2024年吉安市永豐縣某單位招聘派遣員工公告 增程車型升級(jí)智慧新藍(lán)鯨3.0,長(zhǎng)安啟源全新A07真心版將于18日上市 10月18日上市!增程/純電可選,配置升級(jí),長(zhǎng)安啟源A07真香版 車長(zhǎng)4988毫米,配2.0T+8AT,降至14.78萬,家用可以看這款B級(jí)車 配33英寸中控屏,237馬力,降至21.97萬,家用可看這款豪華B級(jí)車 奧運(yùn)選手黃雅瓊成問界新M7 Pro車主,新車究竟有何吸引力? 配置升級(jí)價(jià)格更香 2025款深藍(lán)SL03上市 售11.99-14.69萬 無懼國(guó)境線復(fù)雜路況考驗(yàn) 問界新M7國(guó)慶期間持續(xù)熱銷 奇瑞艾瑞澤8高能版新車上市 12.99萬起 新增瑪瑙紅配色 雷克薩斯 RX 銷量大跌,低至 33 萬且新增 2.0T+8AT,是否值的入?
主站蜘蛛池模板: 波多野结衣家教老师 | 亚洲最新永久观看在线 | 日韩有码一区二区三区 | 中文字幕精品一区 | 一呦二呦三呦国产精品 | 精品日韩欧美一区二区三区在线播放 | 精品无人区乱码一区二区三区手机 | 久久9999| 97超碰人人草 | 国产二区在线播放 | 午夜影院在线免费观看 | 波多野结衣三级视频 | 天天摸天天做天天爽在线 | 亚洲国产精品久久婷婷 | 久久久久久免费视频 | 日韩欧美在线免费观看 | 国产人人澡 | 中文字幕 国产精品 | 99热久久这里只精品国产9 | 69视频成人 | 天天色天天色 | 国产精品国产三级国产aⅴ无密码 | 免费一级欧美毛片 | 九九热精品在线视频 | 日日操日日舔 | 欧美性xxxx交 | 亚洲九九 | 激情久久av一区av二区av三区 | 亚洲成a人v在线观看 | 欧美一区二区三区四区视频 | 91视频在线 | 啪啪伊人网 | 日韩精品久久久久久久电影 | 久久精品91久久久久久再现 | 成人二区三区 | 日韩精品一区二区在线播放 | 成人做爰| 亚洲第一久久 | 日韩中文一区二区三区 | 国产成人啪精品视频免费网站软件 | 国产精品色 |