最近,一個(gè)數(shù)據(jù)火了。
2月9日—2月15日這周,中國(guó)人工智能大模型以4.12萬(wàn)億Token的調(diào)用量,首次超過(guò)同期美國(guó)模型的2.94萬(wàn)億Token。
什么是Token?和大模型又有什么關(guān)系?
Token中文可譯為“詞元”,是AI理解人類(lèi)語(yǔ)言的最小單位。好比教嬰兒說(shuō)話(huà),不會(huì)一開(kāi)始就教他讀整篇文章,而是拆成一個(gè)個(gè)句子,再把句子拆成字、詞。AI理解人類(lèi)語(yǔ)言,也需要把句子段落先“打碎”。通常來(lái)說(shuō),一個(gè)漢字≈1個(gè)Token;一個(gè)英文單詞≈1至2個(gè)Token;標(biāo)點(diǎn)符號(hào)也算Token。比如“今天天氣很好。”這句話(huà),可以被AI拆分成“今”/“天”/“天”/“氣”/“很”/“好”/“。”共約7個(gè)Token。
用個(gè)更直觀的類(lèi)比,AI大模型就像給人類(lèi)做飯的廚師,人類(lèi)的提問(wèn)是食材,回答是菜品,但是他有個(gè)規(guī)矩:只能一盤(pán)一盤(pán)把食材往后廚里運(yùn),做好了菜也只能一盤(pán)一盤(pán)端出來(lái)。
當(dāng)前的大模型,一次能處理文字量是有限的,比如用戶(hù)輸入一段話(huà),模型生成一段回答,兩者加起來(lái)不能超過(guò)一定數(shù)量的Token。有些AI工具會(huì)按照使用的Token數(shù)量收費(fèi),就像打電話(huà)按分鐘計(jì)費(fèi)一樣,輸入輸出的文字量越多,收費(fèi)就越高。
“Token調(diào)用量”的本質(zhì)是真實(shí)使用量,背后反映的是AI大模型在真實(shí)場(chǎng)景中的滲透深度、應(yīng)用的頻率和廣度。中國(guó)AI大模型被實(shí)際使用的文字處理量,首度超過(guò)了美國(guó)模型,這是一個(gè)很有分量的信號(hào),意味著國(guó)產(chǎn)大模型正受到越來(lái)越多的認(rèn)可,被全球各地用戶(hù)高頻使用。2月16日—2月22日,中國(guó)大模型調(diào)用量達(dá)?5.16?萬(wàn)億Token,美國(guó)則為2.7萬(wàn)億Token,也是進(jìn)一步的佐證。
背后的原因是什么?一方面,我國(guó)有著超大規(guī)模市場(chǎng)優(yōu)勢(shì)和豐富應(yīng)用場(chǎng)景,持續(xù)為人工智能大模型技術(shù)迭代提供“試驗(yàn)場(chǎng)”。截至2025年6月,我國(guó)生成式人工智能用戶(hù)規(guī)模達(dá)5.15億人,較2024年12月增長(zhǎng)2.66億人。用戶(hù)基數(shù)快速擴(kuò)大,帶動(dòng)AI從互聯(lián)網(wǎng)領(lǐng)域加速向辦公協(xié)同、工業(yè)設(shè)計(jì)等更深層場(chǎng)景延伸,讓AI從“技術(shù)嘗鮮”變成“日常工具”;應(yīng)用滲透率不斷提升,也為模型迭代持續(xù)提供數(shù)據(jù)反饋,提升處理復(fù)雜任務(wù)的能力,為未來(lái)發(fā)展打開(kāi)空間。
另一方面,從算力基礎(chǔ)設(shè)施到開(kāi)源生態(tài)、從高校科研到企業(yè)創(chuàng)新協(xié)同發(fā)力,我國(guó)創(chuàng)新體系不斷完善。當(dāng)前,我國(guó)人工智能企業(yè)數(shù)量超過(guò)6000家,2025年核心產(chǎn)業(yè)規(guī)模預(yù)計(jì)突破1.2萬(wàn)億元。廠(chǎng)商持續(xù)降低調(diào)用成本,在擴(kuò)大用戶(hù)群的同時(shí),也為創(chuàng)新生態(tài)注入更多活力。
可以預(yù)見(jiàn),在技術(shù)突破和應(yīng)用場(chǎng)景雙向驅(qū)動(dòng)下,我國(guó)人工智能大模型將在“好用”向“常用”的這條路上持續(xù)邁進(jìn),為科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合打開(kāi)更廣闊空間,也為全球人工智能發(fā)展貢獻(xiàn)更多中國(guó)智慧。
本期責(zé)編:王浩、蔣雪鴻、王東輝
【未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載!聯(lián)系電話(huà)028-86968276】
