(資料圖片)
這周,字節(jié)跳動旗下云計算服務(wù)火山引擎推出方舟大模型平臺,引入了智譜 AI、MiniMax 等 7 家創(chuàng)業(yè)公司 / 研究機構(gòu)的大模型,對外出售服務(wù)。相關(guān)公司和機構(gòu)在火山引擎活動會場開設(shè)展臺,創(chuàng)始人或聯(lián)合創(chuàng)始人到場宣布未來會和火山引擎有更深入的合作。
為了吸引創(chuàng)業(yè)公司把模型放在火山引擎上,字節(jié)跳動把抖音等業(yè)務(wù)的空閑計算資源極速調(diào)度給火山引擎,并比同行更低的價格出售算力服務(wù)?;鹕揭婵偛米T待說中國大多數(shù)大模型公司都用火山引擎訓練,在火山引擎上做推理也順理成章。
今年初,為了抓住人工智能大模型的機會,字節(jié)跳動組建了至少三個團隊開發(fā)大模型,找英偉達下單超 10 億美元的 GPU,兩年前卸任 CEO 的創(chuàng)始人張一鳴也開始看相關(guān)論文,與一些團隊交流心得。
投入大量資源的字節(jié)跳動,目標不只是像 OpenAI 那樣開發(fā)出大模型,還希望憑借豐富的 GPU 儲備建立一個平臺,作為中間商幫創(chuàng)業(yè)公司訓練、出售大模型。
按照譚待的說法,他們將來還會引入更多大模型,字節(jié)跳動自研的大模型,除了應(yīng)用到業(yè)務(wù)中,也會放在平臺里對外銷售。他說這么做基于兩個判斷:大模型市場不會出現(xiàn)少數(shù)幾個大模型通吃的局面、企業(yè)會用多個模型開發(fā)應(yīng)用或改造業(yè)務(wù)。
“超級大模型效果好,性價比不高,不是所有問題都需要超級模型”,譚待接受采訪時說,再加上不同行業(yè)解決問題不同,模型訓練數(shù)據(jù)也不一樣,因此會有針對特定行業(yè)或者不同參數(shù)量(決定成本)的大模型存在。
大模型是中國云計算公司的機會已經(jīng)形成行業(yè)共識。但它們抓機會的方式有差別——百度和阿里都是先自研大模型,然后對外提供服務(wù)。騰訊現(xiàn)在還沒有發(fā)布自研模型,馬化騰說 “不急于一時”,騰訊先做的是建立平臺,吸引行業(yè)方向的大模型進駐,對外提供服務(wù)。(賀乾明)
關(guān)鍵詞: