川觀智庫(kù)研究員 黃愛林
本月初,繼OpenAI發(fā)布醫(yī)療開源大模型后,百川智能也發(fā)布了第二款醫(yī)療增強(qiáng)大模型Baichuan-M2,并迅速反超OpenAI。醫(yī)療大模型的價(jià)值凸顯,正成為科技巨頭爭(zhēng)搶的重要賽道。螞蟻集團(tuán)研究院與中國(guó)信通院聯(lián)合發(fā)布的《人工智能大模型在醫(yī)療健康領(lǐng)域發(fā)展態(tài)勢(shì)研究報(bào)告》(下簡(jiǎn)稱“報(bào)告”)指出,基礎(chǔ)層數(shù)據(jù)問題正成為醫(yī)療大模型發(fā)展的最大瓶頸,高質(zhì)量數(shù)據(jù)短缺與“孤島效應(yīng)”,讓醫(yī)療大模型陷入“無米之炊”的困境。
中國(guó)醫(yī)療大模型的規(guī)模迅速擴(kuò)張。畢馬威指出,據(jù)不完全統(tǒng)計(jì),在全球范圍內(nèi)已發(fā)布的醫(yī)療大模型里中國(guó)發(fā)布數(shù)量占比超70%,其中按模型類別來看,大語(yǔ)言模型數(shù)量最多占比近65%。報(bào)告顯示,截至2025年5月1日,我國(guó)新發(fā)布醫(yī)療大模型133個(gè),遠(yuǎn)超2024年全年的94個(gè)、2023年全年的61個(gè)。同時(shí),根據(jù)億歐智庫(kù)數(shù)據(jù),2025年醫(yī)療大模型市場(chǎng)規(guī)模接近20億元,在行業(yè)爆發(fā)期間,預(yù)計(jì)以高達(dá)140%的年平均增長(zhǎng)率擴(kuò)張,于2028年突破百億元。
盡管規(guī)模在迅速擴(kuò)張,醫(yī)療大模型仍在技術(shù)上深陷雙重困境。首先是醫(yī)療模型在學(xué)習(xí)階段面臨“數(shù)據(jù)貧瘠與知識(shí)鴻溝”挑戰(zhàn)。高度專業(yè)化的醫(yī)療任務(wù)需要特定知識(shí)支撐,但高質(zhì)量、覆蓋全疾病譜系的標(biāo)注數(shù)據(jù)集極其匱乏。主要因?yàn)闃?biāo)準(zhǔn)化缺失,各級(jí)醫(yī)療機(jī)構(gòu)數(shù)據(jù)編碼、字段命名混亂;質(zhì)量參差不齊,病歷、影像等非結(jié)構(gòu)化數(shù)據(jù)存在大量缺失、重復(fù)和人工錄入錯(cuò)誤;標(biāo)注成本高昂,專業(yè)醫(yī)學(xué)標(biāo)注需臨床專家參與,罕見病、復(fù)雜病例數(shù)據(jù)尤為稀缺。而且這些數(shù)據(jù)來源往往單一(比如主要來自大城市大醫(yī)院),導(dǎo)致醫(yī)療大模型到了小醫(yī)院或者面對(duì)不同人群就容易“蒙圈”,診斷可能不靠譜。
即使模型訓(xùn)練好了,部署落地仍面臨“算力饑渴與系統(tǒng)孤島”的阻礙。一方面,訓(xùn)練和運(yùn)行需要巨額算力投入,推理速度難以滿足臨床實(shí)時(shí)需求,龐大的模型和硬件要求令基層醫(yī)院望而卻步;另一方面,缺乏統(tǒng)一標(biāo)準(zhǔn)的醫(yī)療信息系統(tǒng)(如HIS/EMR)形成孤島,換言之醫(yī)療大模型更像一個(gè)“外來戶”,和醫(yī)院既有的老系統(tǒng)完全“語(yǔ)言不通”,難以直接融合。而大模型與醫(yī)院系統(tǒng)集成需要大量定制開發(fā),成本高昂且復(fù)雜,嚴(yán)重阻礙了其融入實(shí)際診療流程。這些困境相互交織,共同制約著醫(yī)療大模型從規(guī)模擴(kuò)張邁向真正的臨床應(yīng)用和價(jià)值釋放。
【未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載!聯(lián)系電話028-86968276】