亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

首個OpenAI免費推理模型o3-mini發布 DeepSeek讓奧特曼反思:不開源我們錯了

訪客 10個月前 (02-02) 閱讀數 9306 #區塊鏈
文章標簽 前沿文章

DeepSeek真算是給大模型圈提了個速——

就在剛剛,OpenAI深夜緊急發布了最新推理模型,o3-mini系列。

一共包含三個版本:low、medium和high。

其中o3-mini和o3-mini-high已經上線:

根據官方口徑,o3系列模型,目標是推動低成本推理的邊界。

ChatGPT Plus、團隊和Pro用戶從今天起可以訪問OpenAI o3-mini,企業級訪問將在一周后開放。

免費用戶也可以通過選擇“Search+Reason”來使用o3-mini來體驗搜索。

或許是被DeepSeek逼急了,這是OpenAI首次向用戶免費推出的推理模型。

甚至在隨后的Reddit“有問必答”活動中,CEO奧特曼也罕見公開反思:

在開源權重AI模型這個問題上,(個人認為)我們站在了歷史錯誤的一邊。

與此同時,短短數小時內,網友們已經開始瘋狂實測ing……

針對STEM推理優化,但價格相較DeepSeek-R1依舊貴出天際

還是先來看看技術報告都寫了啥。

去年年底,OpenAI上線了o3-mini預覽版,再次刷新小模型能力邊界。(在成本和低延遲上與o1-mini相當)

當時CEO奧特曼預告稱,正式版將在今年1月發布。而卡在ddl的最后時刻,正式版o3-mini終于上桌。

整體而言,和前一代o1-mini類似,它也針對STEM(Science、Technology、Engineering、Mathematics)進行了優化,延續了mini系列小而美的風格。

僅o3-mini(medium),不但在數學編碼上的表現與o1系列相當,而且響應更快。

人類專家測評顯示,大多數情況下o3-mini比o1-mini產生更準確、更清晰的答案,獲得了56%的偏好度,同時在處理復雜現實問題時的重大錯誤率更是降低了39%。

數學能力上,低推理強度下的o3-mini(low)達到了與o1-mini相當的水平;中等推理強度下能力媲美滿血版o1;而一旦推理強度拉滿(high),其表現直接超越o1系列一眾模型。

在由60多位頂尖數學家準備的FrontierMath難題測試中,高推理強度下的o3-mini相較o1系列也有了大幅提升。

官方甚至特意注明,如果搭配Python工具使用,o3-mini(high)在第一次嘗試時就解決了超過32%的問題,其中包括28%以上的T3級問題。

科學能力方面,在PhD水平的物化生問題上,低推理強度下的o3-mini就已經和o1-mini拉開了層級。

當然,在編碼這項重要能力上,o3-mini更是在各層級上領先o1系列。

根據它們在LiveBench的表現可以看出,隨著推理強度升級,o3-mini的優勢還在不斷擴大。

而且需要提醒,o3-mini在取得上述領先的同時響應更快,其平均響應時間為7.7秒,較o1-mini的10.16秒提升了24%。

最后在安全評估方面,o3-mini在多項安全評估中明顯超過了GPT-4o。

價格方面,相比于輸入/輸出分別為0.14/0.55美元的DeepSeek-R1,o3-mini依舊貴出天際。

根據網友辣評,DeepSeek-R1目前還是性價比之王:更快、更好、更便宜。

BTW,OpenAI此次照例公布了o3-mini背后團隊。可以看出,這一次是由奧特曼本人親自帶隊,研究項目主管分別為Carpus Chang和Kristen Ying(名單中也有很多我們熟悉的老朋友如任鴻宇、趙盛佳等)。

網友瘋狂實測中

正如我們剛才所提到的,目前網友們已經開始瘋狂實測中。

不過從評價上來看,大伙兒對o3-mini的表現褒貶不一。

例如在用Python實現“球在四維體內部彈跳”的任務上,有人認為o3-mini是最好的LLM:

效果是這樣的:

然后有網友嘗試用DeepSeek來做同樣的任務,從效果上來看,認為o3-mini稍微勝出一些:

更直接的對比,讓一個球在旋轉的六邊形內彈跳,球應受到重力和摩擦力的影響,o3-mini和DeepSeek R1的效果差距就比較明顯了:

包括更復雜的一些的任務,在球體內創建100個彈跳的黃色球,o3-mini現在也是可以做到:

再如讓o3-mini設計兩個貪吃蛇互相競爭的游戲:

除了DeepSeek之外,網友也用o1和o3-mini的效果做了對比,例如生成一座龐大、驚人的史詩級漂浮城市。

還有一位網友提出了令幾乎所有大模型都會出錯的迷惑性題目,但讓他較為震驚的是,o3-mini竟然答對了:

不過知名播客博主Lex Fridman對o3-mini的評價卻是:

OpenAI o3-mini是一個好模型,但DeepSeek R1性能相似,價格更低,并揭示了其推理過程。

更好的模型將會出現(迫不及待想要 o3-pro),但“DeepSeek 時刻”是真實的。我認為五年后它仍會被記住,作為科技歷史上的一個轉折點。

One More Thing

就在o3-mini上線幾小時后,奧特曼本人也攜團隊參與了Reddit的“有問必答”活動。

考慮到開源DeepSeek最近攪動了AI圈,奧特曼罕見公開反思:

在開源權重AI模型這個問題上,(個人認為)我們站在了歷史錯誤的一邊。

甚至也承認,OpenAI的領先優勢不會像以前那么大了。

DeepSeek的確很優秀,我們也會繼續研發更好的模型,但領先優勢將更小。

與此同時,OpenAI的一些未來計劃也曝光了。

比如高級語音模式即將迎來更新,OpenAI會直接稱它為GPT-5,而不是GPT-5o,不過目前還沒有具體時間表。

另外,推理模型也將支持調用更多工具。

最后,滿血版o3也被提及,不過看起來距離還相當遙遠……

熱門
亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app
  • <strike id="ykeqq"><input id="ykeqq"></input></strike>
  • <strike id="ykeqq"><menu id="ykeqq"></menu></strike>
    <strike id="ykeqq"></strike>
    <fieldset id="ykeqq"></fieldset>
    <del id="ykeqq"><dfn id="ykeqq"></dfn></del>
    国产精品豆花视频| 欧美国产日韩在线| 久久久精品一区| 欧美精品18videos性欧美| 国产精品欧美一区二区三区奶水| 午夜精品亚洲一区二区三区嫩草| 亚洲一区二区日本| 免费看的黄色欧美网站| 久久久国产精品一区二区中文| 久久激情综合| 欧美精品激情blacked18| 国产日韩欧美精品在线| 午夜视频在线观看一区二区| 欧美成人一区二区三区| 国产精品日韩欧美一区| 亚洲综合久久久久| 久久先锋影音av| 久久一本综合频道| 国产精品久久久久高潮| 亚洲制服少妇| 欧美成人性生活| 国产在线视频欧美| 西西裸体人体做爰大胆久久久| 欧美另类极品videosbest最新版本| 国产欧美精品一区aⅴ影院| 欧美一区二区三区视频免费| 欧美电影在线观看| 国产精品夜夜夜| 在线看片成人| 免费日韩成人| 国产农村妇女毛片精品久久麻豆| 欧美一区二区三区免费在线看| 欧美日韩一区国产| 亚洲欧美在线免费| 欧美日韩一二区| 亚洲免费影院| 欧美日韩三区| 亚洲女同精品视频| 欧美亚洲不卡| 欧美在线综合视频| 国产欧美日韩亚洲精品| 国产欧美一区二区三区另类精品 | 国产精品你懂的在线| 欧美视频专区一二在线观看| 在线免费精品视频| 欧美精品一区二区三区在线播放 | 国产精品一区在线观看| 久久成人精品电影| 国产欧美亚洲日本| 久热精品视频在线| 激情综合色综合久久| 男女视频一区二区| 国产精品综合不卡av | 国产乱肥老妇国产一区二 | 国产免费亚洲高清| 亚洲欧美久久| 国产精品一区在线观看你懂的| 欧美在线欧美在线| 国产精品免费视频观看| 久久成人综合网| 国产午夜精品一区理论片飘花 | 欧美视频一区在线| 先锋影音国产一区| 国产麻豆综合| 欧美国产乱视频| 欧美亚洲网站| 国产午夜精品一区理论片飘花| 欧美成人午夜视频| 欧美伊人久久| 黄色欧美成人| 欧美日韩和欧美的一区二区| 亚洲欧美日韩一区在线观看| 国产日产欧美一区| 欧美日韩成人在线播放| 欧美粗暴jizz性欧美20| 欲色影视综合吧| 亚洲欧美日韩综合一区| 国产视频不卡| 欧美午夜视频网站| 女女同性精品视频| 欧美一区国产二区| 韩国v欧美v日本v亚洲v| 欧美视频在线观看| 欧美成人精品1314www| 欧美在线观看视频| 亚洲视频精品| 国产喷白浆一区二区三区| 亚洲午夜av电影| 国产欧美一区二区精品秋霞影院| 欧美日韩精品二区| 国产一区二区三区直播精品电影 | 国产欧美一区二区精品忘忧草| 欧美日本不卡| 久久久精品动漫| 亚洲欧美日韩精品一区二区| 国产日韩一区在线| 欧美午夜精品理论片a级按摩 | 久久久蜜桃精品| 亚洲主播在线| 国产一区二区在线观看免费播放 | 亚洲一级影院| 激情六月综合| 亚洲女人小视频在线观看| 欧美日韩一区三区四区| 欧美激情一区二区三区在线| 久热re这里精品视频在线6| 久久电影一区| 午夜精品一区二区三区四区| 亚洲色无码播放| 今天的高清视频免费播放成人| 国产免费成人av| 国产精品欧美风情| 国产精品嫩草99a| 国产精品高精视频免费| 欧美日韩一区二区视频在线观看 | 国产麻豆午夜三级精品| 欧美在线91| 亚洲在线成人精品| 在线精品国产成人综合| 国产日韩欧美另类| 国产精品久久久久一区二区| 欧美日精品一区视频| 欧美日韩天天操| 欧美日韩福利| 欧美日韩国产123| 欧美色欧美亚洲另类二区 | 欧美日韩蜜桃| 欧美区二区三区| 亚洲一区美女视频在线观看免费| 亚洲在线免费| 亚洲新中文字幕| 亚洲性夜色噜噜噜7777| 伊人影院久久| 狠狠色狠狠色综合日日91app| 激情小说另类小说亚洲欧美 | 免费av成人在线| 久久影院午夜论| 久久综合福利| 欧美成人国产va精品日本一级| 欧美α欧美αv大片| 欧美日韩在线观看视频| 久久久久久久一区| 久久视频这里只有精品| 狂野欧美激情性xxxx| 你懂的视频欧美| 欧美国产精品v| 欧美久久久久久| 久久久久久久成人| 麻豆精品视频| 在线观看视频一区二区欧美日韩| 国产日韩欧美二区| 在线精品国精品国产尤物884a| 亚洲午夜精品久久| 欧美一级大片在线观看| 午夜精品视频| 久久九九99视频| 欧美69wwwcom| 欧美精品二区| 国产精品一区二区在线观看网站| 国产欧美视频一区二区| 国产午夜精品一区二区三区欧美 | 久久视频在线看| 欧美激情按摩在线| 国产精品伦一区| 激情成人av| 亚洲欧美一区二区三区久久| 久久久精品日韩| 欧美精品在线播放| 国产伦精品一区二区三区高清| 国内欧美视频一区二区| 亚洲一级黄色av| 久久久久久国产精品mv| 欧美激情一区二区三区成人| 国产精品男女猛烈高潮激情| 黄色成人91| 欧美一区二区高清| 欧美大片网址| 国产精品免费在线| 亚洲特级毛片| 久久乐国产精品| 久久久久国色av免费看影院| 国产日韩欧美日韩| 欧美日韩国产在线播放网站| 悠悠资源网久久精品| 1024精品一区二区三区| 亚洲午夜电影网| 国产精品视频久久一区| 亚洲视频在线免费观看| 久久精品30| 在线一区二区三区做爰视频网站| 韩日成人av| 羞羞漫画18久久大片| 久久精品国产一区二区三区| 牛牛国产精品| 欧美亚洲一区三区| 欧美国产日韩一二三区| 国产精品综合不卡av| 欧美一区综合| 欧美三区美女| 一区二区在线观看视频|