在歷經(jīng)十二天的技術(shù)分享直播盛宴后,OpenAI于上周五終于揭曉了其終極武器——o3推理模型,作為對今年早些時(shí)候發(fā)布的o1模型的全面升級。有趣的是,關(guān)于命名跳過“o2”的原因,公司發(fā)言人透露,這是出于對英國電信運(yùn)營商O2的敬意與避讓。
o3不僅僅是一個(gè)單獨(dú)的模型,而是一個(gè)包含o3及o3-mini兩個(gè)版本的系列,后者作為精簡版,專為特定任務(wù)優(yōu)化調(diào)整。
OpenAI大膽宣稱,o3模型在某些特定條件下,已逼近通用人工智能(AGI)的門檻。他們定義的AGI,是指在經(jīng)濟(jì)價(jià)值顯著的工作領(lǐng)域超越人類的高度自主系統(tǒng)。
那么,o3的實(shí)力究竟幾何?據(jù)OpenAI介紹,o3在ARC-AGI圖形邏輯推理基準(zhǔn)測試中創(chuàng)下新紀(jì)錄,低算力場景下得分75.7%,高算力場景下更是飆升至87.5%,超越了象征人類水平線的85%大關(guān)。相比之下,o1模型的得分僅在25%至32%之間徘徊,o3的表現(xiàn)實(shí)現(xiàn)了近三倍的飛躍。
尤為引人注目的是,在全球知名的編程競賽平臺Codeforces上,o3模型獲得了2727的高分,遠(yuǎn)超o1的1891分。獵豹移動與獵戶星空董事長傅盛對此評論道,隨著o3的發(fā)布,編程將不再是專業(yè)人士的專屬領(lǐng)地,每個(gè)人都能輕松表達(dá)需求,由大語言模型代為實(shí)現(xiàn)編程夢想。
“目睹o3的發(fā)布,我深感程序員的傳統(tǒng)角色或?qū)⒚媾R巨大變革。”傅盛強(qiáng)調(diào),o3的編程能力已超越全球99.9%的程序員。在Codeforces的激烈競爭中,o3位列前175名,要知道這是從17萬名程序員中脫穎而出的成績,而o1僅能戰(zhàn)勝約90%的參與者,早期的GPT-4則僅勝過11%。
據(jù)悉,OpenAI o3將于明年1月底正式面世。傅盛警告說,雖然聲稱“程序員不存在”或許略顯夸張,但不可否認(rèn)的是,程序員的工作內(nèi)容正面臨深刻變化。未來的程序員將更多聚焦于理解用戶需求、構(gòu)建宏觀邏輯,而具體的編碼實(shí)現(xiàn)工作,將越來越多地交由AI助手高效完成。