亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

邁出“登月”第二步：Kimi比肩OpenAI o1最新技術(shù)，楊植麟聚焦做減法

每日經(jīng)濟(jì)新聞 2024-11-17 18:39:33

根據(jù)月之暗面的介紹，k0-math模型采用了全新的強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù)，這也是業(yè)內(nèi)普遍認(rèn)為OpenAI o1系列的技術(shù)關(guān)鍵所在，行業(yè)范式也在因此發(fā)生著改變。

每經(jīng)記者楊昕怡每經(jīng)編輯張海妮

正如這家公司的名字一般，月之暗面，總是一個(gè)令人好奇的存在。11月16日下午，在Kimi Chat上線一周年之際，公司創(chuàng)始人楊植麟罕見現(xiàn)身，在多家媒體面前走出了“登月”第二步。

“如果說長(zhǎng)文本是月之暗面‘登月’的第一步，那么提升模型深度推理能力則是第二步。”身穿一件黑色公司文化衫的楊植麟發(fā)布了新一代數(shù)學(xué)能力可對(duì)標(biāo)OpenAI o1系列的數(shù)學(xué)推理模型k0-math。

當(dāng)新模型在眾人面前進(jìn)行數(shù)學(xué)題“測(cè)試”時(shí)，這位原本略顯羞澀的90后“創(chuàng)業(yè)明星”終于來到了自己的主場(chǎng)，看著數(shù)字、公式一行行地彈出，興奮地講解著其中的原理。

據(jù)介紹，該款模型是Kimi推出的首款推理能力強(qiáng)化模型，采用了全新的強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù)——這與楊植麟對(duì)行業(yè)技術(shù)發(fā)展的判斷方向一致，“接下來最重點(diǎn)的東西會(huì)在強(qiáng)化學(xué)習(xí)上，范式上會(huì)產(chǎn)生變化，它還是Scaling（擴(kuò)展），只是通過不同的方式去Scale”。

在k0-math的表現(xiàn)方面，月之暗面方面披露，在中考、高考、考研以及包含競(jìng)賽題的MATH等數(shù)學(xué)基準(zhǔn)測(cè)試中，k0-math初代模型成績(jī)已經(jīng)超過o1-mini和o1-preview模型。

“（k0-math的發(fā)布）大概率能說是，在OpenAI o1發(fā)布后，國(guó)內(nèi)首個(gè)摸索出并實(shí)現(xiàn)o1思路的公司。”一位國(guó)內(nèi)頭部互聯(lián)網(wǎng)公司的大模型技術(shù)人員在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，“現(xiàn)在國(guó)內(nèi)想要趕超o1的大模型團(tuán)隊(duì)都會(huì)以數(shù)學(xué)領(lǐng)域?yàn)榈谝徊剑驗(yàn)椴恍枰罅康臉?biāo)注數(shù)據(jù)，成本最低，而且有可驗(yàn)證的標(biāo)準(zhǔn)答案。”

月之暗面的下一步是什么？“Kimi目前最核心的任務(wù)是提升留存。”楊植麟在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，“基本上它跟你的技術(shù)成熟度或者技術(shù)水平也是一個(gè)正相關(guān)的關(guān)系，所以對(duì)我們當(dāng)前來說是最重要的。假設(shè)我們以最后AGI這個(gè)目標(biāo)作為衡量，我覺得現(xiàn)在還在初級(jí)階段。”

發(fā)布會(huì)數(shù)據(jù)顯示，截至今年10月，Kimi的月活已超3600萬人，而且數(shù)據(jù)在持續(xù)增長(zhǎng)。

發(fā)布會(huì)現(xiàn)場(chǎng) 圖片來源：公司提供

“接下來重點(diǎn)在強(qiáng)化學(xué)習(xí)”，Kimi發(fā)布對(duì)標(biāo)o1系列數(shù)學(xué)模型

發(fā)布會(huì)上，月之暗面公布了k0-math的目前測(cè)評(píng)得分：在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測(cè)試MATH中，k0-math模型得分93.8分，超過o1-mini的90分和o1-preview的85.5分，且k0-math這一成績(jī)僅次于o1完全版的94.8分。

“什么樣的場(chǎng)景最適合讓AI鍛煉思考能力？我們認(rèn)為是數(shù)學(xué)場(chǎng)景。”發(fā)布會(huì)現(xiàn)場(chǎng)，楊植麟表示，在訓(xùn)練該模型的過程中，最重要的是看其是否真正具備深度思考的能力。

據(jù)介紹，相較于以盡快提供答案為關(guān)鍵目標(biāo)的常規(guī)模型，k0-math模型在做題過程中會(huì)花更長(zhǎng)的時(shí)間來推理，包括思考和規(guī)劃思路，并且在必要時(shí)自行反思改進(jìn)解題思路，提升答題的成功率。

不過，楊植麟也指出，雖然k0-math模型擅長(zhǎng)解答大部分很有難度的數(shù)學(xué)題，但是當(dāng)前版本還無法解答LaTeX格式難以描述的幾何圖形類問題。此外，它可能會(huì)存在對(duì)“1+1=？”這樣過于簡(jiǎn)單的數(shù)學(xué)問題進(jìn)行過度思考，對(duì)于高考難題和IMO（國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽試題）依然有一定概率做錯(cuò)、猜答案之類的局限性。

根據(jù)月之暗面的介紹，k0-math模型采用了全新的強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù)，這也是業(yè)內(nèi)普遍認(rèn)為OpenAI o1系列的技術(shù)關(guān)鍵所在，行業(yè)范式也在因此發(fā)生著改變。

“AI的發(fā)展就像蕩秋千，我們會(huì)在兩種狀態(tài)之間來回切換：有時(shí)候，算法、數(shù)據(jù)都很ready了，但是算力不夠，我們要做的就是加算力；但今天我們發(fā)現(xiàn)，不斷擴(kuò)大算力規(guī)模已經(jīng)不一定能直接解決問題了，所以這時(shí)就需要通過改變算法，來突破這個(gè)瓶頸。”楊植麟表示。

對(duì)于業(yè)內(nèi)對(duì)Scaling Law（規(guī)模定律）逐漸放緩的看法，楊植麟認(rèn)為，預(yù)訓(xùn)練還有空間，大概半代到一代的模型，這個(gè)空間會(huì)在明年釋放出來，“明年，我覺得領(lǐng)先的模型會(huì)把預(yù)訓(xùn)練做到一個(gè)比較極致的階段”。

“但我們判斷，接下來最重點(diǎn)的東西會(huì)在強(qiáng)化學(xué)習(xí)上，就是范式上會(huì)產(chǎn)生一些變化。本質(zhì)上，它還是Scaling，并不是不用Scale，只是說你會(huì)通過不同的方式去Scale，這是我們的判斷。”他表示。

同時(shí)，他指出，該數(shù)學(xué)推理模型的推出，一方面在教育產(chǎn)品、Kimi整體的流量里有非常大的價(jià)值；另一方面，該模型上的技術(shù)可以放在更多場(chǎng)景里，比如讓Kimi探索版去做更多的搜索。

“最核心的是提升留存”，Kimi選擇做減法

在今年6月的一次媒體采訪中，楊植麟多次以“聚焦”作為對(duì)創(chuàng)業(yè)思路、成功經(jīng)驗(yàn)的回應(yīng)，“在技術(shù)和產(chǎn)品上可能我們都希望更加聚焦”，“因?yàn)槟闳绻裁礀|西都做了，可能最后也很難做好”。

不久前，有消息稱月之暗面幾位出海產(chǎn)品負(fù)責(zé)人已于近期離職創(chuàng)業(yè)。此外，今年9月，月之暗面決定停止更新兩款已上線的出海產(chǎn)品——Ohai和Noisee，暫時(shí)收縮了出海to C應(yīng)用。

在發(fā)布會(huì)現(xiàn)場(chǎng)，楊植麟間接回應(yīng)了上述市場(chǎng)傳言：“我們沒有人才流失，我們主動(dòng)做了業(yè)務(wù)減法。”

這一思路的確定在今年春天，楊植麟觀察了月之暗面的具體發(fā)展并對(duì)美國(guó)市場(chǎng)進(jìn)行了判斷，得出結(jié)論：的確得做減法，而不是瘋狂做加法。

“我們一開始嘗試過幾個(gè)產(chǎn)品一塊做，這在一定時(shí)期內(nèi)奏效，但后來發(fā)現(xiàn)，這樣就活生生把自己變成大廠了，沒有任何優(yōu)勢(shì)。”楊植麟將鎖定“聚焦”視為過去一年較大的課題，“砍業(yè)務(wù)本質(zhì)上也是在控制人數(shù)。這幾個(gè)大模型創(chuàng)業(yè)公司里，我們始終保持人數(shù)最少，始終保持（顯）卡和人的比例最高，這非常關(guān)鍵。我們不希望團(tuán)隊(duì)擴(kuò)那么大，（擴(kuò)大）對(duì)創(chuàng)新有致命性傷害。另外我們也會(huì)根據(jù)美國(guó)市場(chǎng)的情況，判斷哪個(gè)業(yè)務(wù)做大的概率更高。”

聚焦Kimi，當(dāng)下楊植麟認(rèn)為最為核心的任務(wù)是什么？他在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)給出了答案：提升留存，“（令自己滿意的留存）永無止境”。

“因?yàn)榱舸媸羌夹g(shù)成熟的重要指標(biāo)，并且（現(xiàn)在的留存）還有非常大的提升空間。我們的模型能力跟產(chǎn)品指標(biāo)是高度相關(guān)的。”他解釋，“目前我們的模型可能思考能力還不夠強(qiáng)，交互還不夠豐富，我們把這些東西做得更好之后，留存會(huì)進(jìn)一步上升。”

第三方機(jī)構(gòu)QuestMobile發(fā)布的《中國(guó)移動(dòng)互聯(lián)網(wǎng)2024年秋季報(bào)告》顯示，截至2024年9月AIGC App月度活躍用戶同比增長(zhǎng)393.9%，豆包、文小言、Kimi智能助手App月活用戶分別達(dá)到4197.6萬人、1191.5萬人和1024.8萬人，活躍用戶3日留存率分別為39.1%、31.2%和32.2%。

在發(fā)布會(huì)上，楊植麟表示，截至2024年10月，Kimi的月活已超3600萬人，而且數(shù)據(jù)在持續(xù)增長(zhǎng)。

在行業(yè)的多模態(tài)進(jìn)展方面，界面新聞曾報(bào)道，Runway聯(lián)合創(chuàng)始人曾在11月9日公開表示，OpenAI計(jì)劃在大約兩周內(nèi)發(fā)布Sora。

對(duì)此，楊植麟透露，內(nèi)部幾個(gè)多模態(tài)的能力在內(nèi)測(cè)，“關(guān)于多模態(tài)，我覺得AI接下來最重要的是思考和交互這兩個(gè)能力。思考的重要性遠(yuǎn)大于交互，不是說交互不重要，我覺得思考會(huì)決定上限，交互是一個(gè)必要條件，比如說vision（視覺）的能力，如果沒有vision的能力沒法做交互”。

在Open AI出新牌后，Kimi又一次成為國(guó)內(nèi)第一個(gè)“跟牌者”，在這場(chǎng)焦灼的牌局中，楊植麟和月之暗面拿出了留到最后的野心。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型 Kimi Ai OpenAI 月之暗面

上一篇文章

東吳證券給予百濟(jì)神州買入評(píng)級(jí)，2024年三季報(bào)點(diǎn)評(píng)：海外銷售快速放量，血液瘤行業(yè)領(lǐng)先

返回每經(jīng)網(wǎng)首頁

下一篇文章

南寧百貨：南寧富天擬減持南寧百貨股份合計(jì)不超過約400萬股

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn