PG(中國大陸)官方網(wǎng)站-電子AI輔助平臺

久久久久久国产精品无码下载,极品粉嫩嫩模大尺度无码

国产成人无码专区,国产亚洲精品久久久久蜜臀,色琪影院八戒无码,午夜精品白在线观看

PG新聞
分類

上海AI企業(yè)發(fā)布首個混合架構(gòu)開源模型

發(fā)布時間:2025-06-23 17:10:44    瀏覽:

[返回]

  

上海AI企業(yè)發(fā)布首個混合架構(gòu)開源模型

  6月17日凌晨,總部位于上海的AI獨(dú)角獸企業(yè)MiniMax(上海稀宇科技有限公司),發(fā)布了自主研發(fā)的“全球首個開源的大規(guī)?;旌霞軜?gòu)推理模型”MiniMax-M1(以下簡稱“M1”)。M1支持100萬token(語言中具有獨(dú)立意義的最小單位)上下文窗口,訓(xùn)練成本僅為53.74萬美元,約合380萬元人民幣,其長文本處理、代碼生成等核心性能填補(bǔ)了開源領(lǐng)域長上下文技術(shù)的空白,展現(xiàn)出比肩甚至超越業(yè)界頂尖模型的實(shí)力。

  記者登錄MiniMax自有的App和Web端看到,M1模型保持不限量免費(fèi)使用。“M1如同用經(jīng)濟(jì)型轎車的成本造出了豪華超跑”“M1是我們眼中的性價比新王”互聯(lián)網(wǎng)上,一些AI行業(yè)觀察者給出這樣的評價。

  作為國內(nèi)PG電子官方平臺入口“AI六小虎”之一的MiniMax,此次發(fā)布的M1大模型何以擁有巨大的成本優(yōu)勢?資深人工智能專家、高級工程師丁成剛認(rèn)為,這主要源于企業(yè)的兩大技術(shù)創(chuàng)新。一是采用閃電注意力機(jī)制為主的混合架構(gòu),使得模型在計(jì)算長上下文輸入以及深度推理時更加高效;二是運(yùn)用CISPO強(qiáng)化學(xué)習(xí)算法,優(yōu)化重要性采樣權(quán)重,訓(xùn)練效率超越其他大模型。得益于CISPO的高效,M1模型的整個強(qiáng)化學(xué)習(xí)階段僅使用了512塊英偉達(dá)H800 GPU,耗時3周,成本僅為53.74萬美元。這一成本顯著低于企業(yè)最初的預(yù)期。

  在進(jìn)行8萬token的深度推理時,M1所需的算力僅PG電子官方平臺入口為國內(nèi)另一款大模型的約30%;生成10萬token時,推理算力只需要另一款大模型的25%。當(dāng)較低成本訓(xùn)練出頂尖模型,實(shí)現(xiàn)“性能躍升、成本腰斬”的雙重突破,用戶再也不用擔(dān)心百萬token上下文成為高昂服務(wù),這將為市場提供了一個高性能、低門檻的新選擇。可以預(yù)見,M1或?qū)蔀橹悄荏w時代的首選開源基座模型。

  行業(yè)觀察人士認(rèn)為,面對多個核心生產(chǎn)力場景,M1于同類模型中率先實(shí)現(xiàn)了技術(shù)突破與架構(gòu)創(chuàng)新,它的核心競爭力在于將線性注意力與標(biāo)準(zhǔn)Softmax注意力有機(jī)融合,形成獨(dú)特的“閃電注意力”機(jī)制。這一設(shè)計(jì)讓M1在保持長序列處理效率的同時,解決了純線性注意力在信息檢索上的固有缺陷。

  記者了解到,MiniMax在業(yè)內(nèi)公認(rèn)的17個主流評測集上對M1進(jìn)行了技術(shù)“檢閱”。結(jié)果顯示,在軟件工程、長上下文理解以及工具使用等復(fù)雜且對生產(chǎn)力要求較高的場景中,M1展現(xiàn)出絕對實(shí)力。在SWE-bench基準(zhǔn)測試?yán)?,M1-40k和M1-80k分別取得55.6%和56.0%的高分。憑借其百萬級的上下文窗口,M1在長上下文理解任務(wù)中具有壓倒性優(yōu)勢,不僅超越所有開源模型,還在部分指標(biāo)上接近OpenAI o3和Claude4Opus,在全球范圍內(nèi)位居第二。

  在代理工具使用場景TAU-bench的評測中,M1不僅在所有開源模型中脫穎而出,還戰(zhàn)勝了Gemini-2.5Pro。此外,M1-80k在多數(shù)基準(zhǔn)測試中的表現(xiàn)都優(yōu)于M1-40k,表明增加計(jì)算資源對提升模型性能有顯著作用。在處理400頁技術(shù)文檔或10萬行代碼庫時,傳統(tǒng)模型需反復(fù)切分上下文,而M1可以做到整體消化、連貫推理,為智能體發(fā)展提供了開創(chuàng)性范例。

  “M1打破了算力+資本的競爭模式,將對全球AI大模型市場產(chǎn)生深遠(yuǎn)影響。不過,對于更多AI領(lǐng)域企業(yè)來說,要從技術(shù)流派轉(zhuǎn)向市場應(yīng)用,以解決問題、實(shí)現(xiàn)任務(wù)為出發(fā)點(diǎn),開拓醫(yī)療、健康、旅游、傳媒等領(lǐng)域垂直類應(yīng)用場景,才能在AI的規(guī)模化應(yīng)用方面擁有更多想象空間和發(fā)展機(jī)遇?!辟Y深創(chuàng)投專家、江蘇投資人中心秘書長吳峰認(rèn)為。

  時值周末,許多市民和游客來到北京市海淀區(qū)三山五園文化藝術(shù)中心,參觀這里舉辦的2025亞洲數(shù)字藝術(shù)展、薪傳國粹——“萬印樓”新藏當(dāng)代國際篆刻精品展,感受藝術(shù)魅力,樂享周末美好時光。

  本屆年會將以“互聯(lián)助力發(fā)展,合作共創(chuàng)繁榮”為主題,預(yù)計(jì)將有來自近100個國家和地區(qū)的3500余名嘉賓參會。

  文化和旅游部6月3日公布2025年端午節(jié)假期文化和旅游市場情況。經(jīng)測算,假期3天,全國國內(nèi)出游1.19億人次,同比增長5.7%;國內(nèi)出游總花費(fèi)427.30億元,同比增長5.9%。

  由中國鐵建大橋局承建的渝萬高鐵珍溪河雙線大橋順利合龍,為全線按期通車奠定了堅(jiān)實(shí)基礎(chǔ)。

搜索