(資料圖片)
這周,字節(jié)跳動(dòng)旗下云計(jì)算服務(wù)火山引擎推出方舟大模型平臺(tái),引入了智譜 AI、MiniMax 等 7 家創(chuàng)業(yè)公司 / 研究機(jī)構(gòu)的大模型,對(duì)外出售服務(wù)。相關(guān)公司和機(jī)構(gòu)在火山引擎活動(dòng)會(huì)場(chǎng)開(kāi)設(shè)展臺(tái),創(chuàng)始人或聯(lián)合創(chuàng)始人到場(chǎng)宣布未來(lái)會(huì)和火山引擎有更深入的合作。
為了吸引創(chuàng)業(yè)公司把模型放在火山引擎上,字節(jié)跳動(dòng)把抖音等業(yè)務(wù)的空閑計(jì)算資源極速調(diào)度給火山引擎,并比同行更低的價(jià)格出售算力服務(wù)。火山引擎總裁譚待說(shuō)中國(guó)大多數(shù)大模型公司都用火山引擎訓(xùn)練,在火山引擎上做推理也順理成章。
今年初,為了抓住人工智能大模型的機(jī)會(huì),字節(jié)跳動(dòng)組建了至少三個(gè)團(tuán)隊(duì)開(kāi)發(fā)大模型,找英偉達(dá)下單超 10 億美元的 GPU,兩年前卸任 CEO 的創(chuàng)始人張一鳴也開(kāi)始看相關(guān)論文,與一些團(tuán)隊(duì)交流心得。
投入大量資源的字節(jié)跳動(dòng),目標(biāo)不只是像 OpenAI 那樣開(kāi)發(fā)出大模型,還希望憑借豐富的 GPU 儲(chǔ)備建立一個(gè)平臺(tái),作為中間商幫創(chuàng)業(yè)公司訓(xùn)練、出售大模型。
按照譚待的說(shuō)法,他們將來(lái)還會(huì)引入更多大模型,字節(jié)跳動(dòng)自研的大模型,除了應(yīng)用到業(yè)務(wù)中,也會(huì)放在平臺(tái)里對(duì)外銷(xiāo)售。他說(shuō)這么做基于兩個(gè)判斷:大模型市場(chǎng)不會(huì)出現(xiàn)少數(shù)幾個(gè)大模型通吃的局面、企業(yè)會(huì)用多個(gè)模型開(kāi)發(fā)應(yīng)用或改造業(yè)務(wù)。
“超級(jí)大模型效果好,性?xún)r(jià)比不高,不是所有問(wèn)題都需要超級(jí)模型”,譚待接受采訪(fǎng)時(shí)說(shuō),再加上不同行業(yè)解決問(wèn)題不同,模型訓(xùn)練數(shù)據(jù)也不一樣,因此會(huì)有針對(duì)特定行業(yè)或者不同參數(shù)量(決定成本)的大模型存在。
大模型是中國(guó)云計(jì)算公司的機(jī)會(huì)已經(jīng)形成行業(yè)共識(shí)。但它們抓機(jī)會(huì)的方式有差別——百度和阿里都是先自研大模型,然后對(duì)外提供服務(wù)。騰訊現(xiàn)在還沒(méi)有發(fā)布自研模型,馬化騰說(shuō) “不急于一時(shí)”,騰訊先做的是建立平臺(tái),吸引行業(yè)方向的大模型進(jìn)駐,對(duì)外提供服務(wù)。(賀乾明)
關(guān)鍵詞: