鋼鐵行業需要什麼樣的大模型？

2026-05-03 00:42:46

中國冶金報中國鋼鐵新聞網

記者樊三彩報道

　　繼ChatGPT大模型後，國內智譜AI的ChatGLM、百度的文心一言、科大訊飛的星火等國產大模型如雨後春筍般湧現，被稱為“百模大戰”。zaitabeihou，bujinshigejiajishushilidebipin，yeshiyingyongchangjingluodinenglidejiaoliang。lingshichangkuangrededamoxingjiujingyouhemoli？danggangtiexingyeyujiandamoxing，youhuipengzhuangchuzenyangdehuohua？jinri，《中國冶金報》記者專訪了智譜AI CEO張鵬，圍繞當前的“大模型熱”進行了對話。

　　智譜AI於2019年由清華大學計算機係技術成果轉化而成立，於次年便開始了GLM預訓練架構的研發，是國內最早從事大模型相關研究的機構之一。“麵對‘大模型熱’，如果用一個詞來形容我的想法，那就是篤信。”張鵬指出，“信”當然就是相信這件事情，大模型一定是通往AGI（通用人工智能）的必經之路，能創造更大的價值；“篤”是一種踏實、審慎的態度，相信是基於對這件事情的理解和鑽研，而不是狂熱、沒有根基的。

　　從紙上談兵到實踐躬行，大模型為什麼這麼“熱”？

　　大模型的起源可以追溯到2017年，Transformer算法架構的誕生，開啟了大模型演化的曆史進程。雖然在接下來的幾年內，BERT、GPT-1、GPT-2也先後出現，甚至BERT在十多個自然語言理解任務上大大超過傳統算法的精度，但依舊沒有在業界引起太多的火花，直至2020年的到來。“這一年是大模型元年。”張鵬表示。

　　GPT-3的問世大大提高了模型的內容生成和邏輯推理能力，它在上下文學習和知識（常識）理解等方麵展現出驚人能力。隨後在全球範圍內掀起了一股基礎模型研究的熱潮，國外如 Meta、微軟、穀歌等，國內如清華大學、北京智源人工智能研究院、百度、華為、阿裏巴巴、智譜AI等，都競相追趕，提出包括Gopher、Chinchilla、PaLM、GLM-130B等在內的多個千億元級模型。

　　然(ran)而(er)，複(fu)雜(za)的(de)研(yan)發(fa)技(ji)術(shu)以(yi)及(ji)高(gao)昂(ang)的(de)訓(xun)練(lian)成(cheng)本(ben)，也(ye)讓(rang)不(bu)少(shao)人(ren)望(wang)而(er)卻(que)步(bu)。在(zai)當(dang)時(shi)，並(bing)不(bu)是(shi)所(suo)有(you)人(ren)都(dou)能(neng)夠(gou)看(kan)清(qing)技(ji)術(shu)發(fa)展(zhan)脈(mai)絡(luo)，而(er)大(da)模(mo)型(xing)對(dui)資(zi)金(jin)投(tou)入(ru)的(de)要(yao)求(qiu)很(hen)高(gao)，貿(mao)然(ran)投(tou)入(ru)風(feng)險(xian)頗(po)大(da)。“當時，我們邀請了一些學界的教授對未來技術的演進方向進行研討，大家都認為這是大模型到達了一個臨界點的信號，AI開始真正進入了可用階段。但是我們在尋找算力、模型工程問題等方麵遇到了很多困難，最後猶豫了很久才決定all in（全部投入）大模型，開始自研算法框架。”張鵬表示。

　　直至2022年底，ChatGPT發布才真的激起了“百模大戰”的開始，與過往的機器學習技術不同，ChatGPT不再是枯燥的技術理論，它能夠在各領域的應用場景反複驗證，人們才真正感受到大模型“智能湧現”的魅力。ChatGPT實現全球用戶破億僅用了短短兩個月，而電話用戶破億用了75年，手機用了16年，網站用了7年，此前用戶增長最快的應用TikTok也用了9個月。

　　百家爭鳴、百花齊放，對“大模型熱”要注意什麼？

　　ChatGPT的(de)發(fa)布(bu)激(ji)發(fa)了(le)更(geng)多(duo)機(ji)構(gou)和(he)公(gong)司(si)的(de)研(yan)發(fa)鬥(dou)誌(zhi)和(he)熱(re)情(qing)，眾(zhong)多(duo)資(zi)本(ben)紛(fen)紛(fen)投(tou)入(ru)到(dao)大(da)模(mo)型(xing)研(yan)發(fa)的(de)藍(lan)海(hai)之(zhi)中(zhong)，相(xiang)關(guan)部(bu)門(men)也(ye)關(guan)注(zhu)到(dao)了(le)這(zhe)一(yi)重(zhong)要(yao)的(de)技(ji)術(shu)創(chuang)新(xin)，給(gei)予(yu)了(le)非(fei)常(chang)多(duo)的(de)政(zheng)策(ce)支(zhi)持(chi)，進(jin)一(yi)步(bu)促(cu)進(jin)了(le)大(da)模(mo)型(xing)的(de)研(yan)發(fa)和(he)優(you)化(hua)升(sheng)級(ji)，形(xing)成(cheng)了(le)“百家爭鳴、百花齊放”的科技發展新態勢。這也讓已經積累了兩年技術實力的智譜AI從幕後走到了台前。

　　但麵對“大模型熱”絕不能盲目。大模型的開發和應用雖然會助推產業和經濟發展，但如果不加以合理管控，也會給產業安全帶來風險。一方麵是芯片的“卡脖子”問(wen)題(ti)。算(suan)力(li)是(shi)大(da)模(mo)型(xing)的(de)基(ji)礎(chu)之(zhi)一(yi)，如(ru)何(he)保(bao)證(zheng)算(suan)力(li)的(de)持(chi)續(xu)穩(wen)定(ding)供(gong)應(ying)是(shi)產(chan)業(ye)安(an)全(quan)必(bi)須(xu)關(guan)注(zhu)的(de)問(wen)題(ti)。另(ling)一(yi)方(fang)麵(mian)，產(chan)業(ye)所(suo)使(shi)用(yong)的(de)基(ji)座(zuo)模(mo)型(xing)是(shi)否(fou)安(an)全(quan)可(ke)控(kong)也(ye)是(shi)一(yi)個(ge)重(zhong)要(yao)的(de)問(wen)題(ti)。模(mo)型(xing)的(de)訓(xun)練(lian)數(shu)據(ju)是(shi)否(fou)安(an)全(quan)合(he)規(gui)，模(mo)型(xing)是(shi)否(fou)自(zi)主(zhu)可(ke)控(kong)，會(hui)不(bu)會(hui)像(xiang)“芯片進口”一樣遇到各種限製？這些都是影響產業長遠發展的重要問題。

　　麵(mian)對(dui)風(feng)險(xian)挑(tiao)戰(zhan)，張(zhang)鵬(peng)指(zhi)出(chu)，作(zuo)為(wei)一(yi)家(jia)創(chuang)業(ye)公(gong)司(si)，做(zuo)大(da)語(yu)言(yan)模(mo)型(xing)要(yao)有(you)很(hen)大(da)的(de)決(jue)心(xin)，除(chu)了(le)研(yan)究(jiu)層(ceng)麵(mian)上(shang)的(de)挑(tiao)戰(zhan)，還(hai)有(you)模(mo)型(xing)訓(xun)練(lian)工(gong)程(cheng)層(ceng)麵(mian)上(shang)涉(she)及(ji)到(dao)的(de)資(zi)源(yuan)投(tou)入(ru)、團隊、訓練數據等一係列的事情。在芯片問題上，智譜AI在(zai)研(yan)發(fa)之(zhi)初(chu)便(bian)製(zhi)訂(ding)了(le)國(guo)產(chan)硬(ying)件(jian)適(shi)配(pei)計(ji)劃(hua)，目(mu)前(qian)已(yi)經(jing)與(yu)十(shi)餘(yu)家(jia)國(guo)產(chan)芯(xin)片(pian)廠(chang)商(shang)合(he)作(zuo)，希(xi)望(wang)可(ke)以(yi)在(zai)全(quan)方(fang)位(wei)適(shi)配(pei)的(de)同(tong)時(shi)，提(ti)升(sheng)模(mo)型(xing)在(zai)國(guo)產(chan)硬(ying)件(jian)上(shang)的(de)訓(xun)練(lian)推(tui)理(li)效(xiao)率(lv)。此(ci)外(wai)，智(zhi)譜(pu)AI也選擇了從底層算法開始自研，以實現基座模型安全可控的目標。

　　“國產大模型與國外大模型之間的差距依然存在，但我們有信心去追趕這個差距，我們一直在不斷創新的路上。”張鵬表示。

　　傳統產業+大模型，如何放大應用價值？

　　當前，隨著人工智能的快速發展，大模型的應用已經逐漸從研究領域擴展到工業實踐中，形成工業大模型。從“通用”到“應用”，大模型正在叩響工業製造的大門。

　　從研發難度來看，無論是通用大模型，還是工業大模型，研發投入、核心人才和應用場景都是不可或缺的，也構成了市場的核心壁壘。而工業大模型對算法模型的有效性、高質量的數據、suanlidezhichengnengliyoujigaoyaoqiu，moxingdeyouhuadiedaiyiyoulaiyuzijinherencaidechixutouru。yinci，damoxingdeshijiluodihexingyeyingyongnenglichengweileshichangjianyandezhongyaobiaozhun。

　　“工業大模型的普適性商業應用尚需探索。”張鵬認為，一是工業大模型需與其他數字化產品進一步整合，滿足工業企業對網絡、算suan力li以yi及ji數shu據ju管guan理li的de一yi體ti化hua要yao求qiu，實shi現xian即ji買mai即ji用yong。二er是shi工gong業ye企qi業ye使shi用yong門men檻kan仍reng然ran較jiao高gao，比bi如ru需xu要yao基ji於yu提ti示shi詞ci進jin行xing應ying用yong開kai發fa，把ba問wen題ti解jie決jue的de長chang線xian邏luo輯ji和he相xiang關guan案an例li融rong入ru進jin去qu，使shi大da模mo型xing能neng按an照zhao預yu設she步bu驟zhou、思考鏈路和回答格式來產生答案。三是工業各領域已存在大量工業軟件、gongyehulianwangpingtai，ruheliyongdamoxingxingchengxietongshengtaijiangshenkeyingxiangyonghuganzhijichanpinshengmingli，yunxubinggulidisanfangkaifazhejiyugongyedamoxingkaifachajianshizhongyaolujing，ruOpenAI正基於ChatGPT+插件加快構建自己的生態圈。

　　dayuyanmoxinghuizhongsuqianxingbaiyedeyetai，danxuyaozaijutidexingyeluodifangmiantourugengduoziyuan。renheyixiangjishufazhandaoyidingchengduzhihou，doubiranhuichanshenggengduoshijijiazhi。ruheshixianjiazhi，changjiandeyizhongshuofashibingbuxuyaotongyongdejizuodamoxing，zhixuyaoxiaode、中量級的、合he適shi的de行xing業ye模mo型xing。但dan大da語yu言yan模mo型xing能neng力li突tu破po的de根gen本ben原yuan因yin在zai於yu，它ta對dui世shi界jie知zhi識shi的de學xue習xi和he建jian模mo，使shi得de它ta具ju備bei了le接jie近jin人ren的de理li解jie推tui理li和he更geng進jin階jie的de認ren知zhi能neng力li。張zhang鵬peng表biao示shi，最zui理li想xiang的de狀zhuang態tai是shi，行xing業ye模mo型xing並bing不bu是shi完wan全quan獨du立li於yu基ji座zuo模mo型xing和he通tong用yong模mo型xing，而er是shi生sheng長chang在zai基ji座zuo模mo型xing之zhi上shang，基ji於yu它ta進jin行xing進jin一yi步bu的de訓xun練lian和he微wei調tiao。

　　當前，我國傳統產業正麵臨智能化轉型，加入行業特色數據與知識、精準匹配真實應用場景的行業大模型，能夠極大地提升業務流程效率和水平，驅動產業轉型升級。鋼鐵工業具有生產流程連續、工藝體係複雜、產品中間態多樣化、大型高溫高壓設備集中、人員安全要求高等特征，屬於典型的流程型製造業，麵臨著嚴峻的資源、市場、環保、競爭等挑戰。“鋼鐵工業亟需通過大模型等先進技術及場景化創新應用，提升行業的綠色環保、安全保障水平和生產效率。”張鵬說。

　　對於大模型如何在鋼鐵行業應用，張鵬表示，可以打造鋼鐵工業人工智能解決方案，以具備通用基礎能力的AI大模型作為智能底座，結合行業知識和場景數據進行訓練和微調，從而有效應對碎片化和多樣化需求，並大幅縮減研發、定製、部署、調優等工程化過程中的人力、時間、費用等成本投入，也能解決好數據安全問題，促進人工智能在鋼鐵行業大規模應用，促進鋼鐵行業智能化升級。

來源：中國冶金報-中國鋼鐵新聞網

編輯：張雨恬

下一篇：安米哈薩克斯坦煤礦火災造成46人死亡

版權說明

【1】凡本網注明"來源：中國冶金報—中國鋼鐵新聞網"的所有作品，版權均屬於中國鋼鐵新聞網。媒體轉載、摘編本網所刊作品時，需經書麵授權。轉載時需注明來源於《中國冶金報—中國鋼鐵新聞網》及作者姓名。違反上述聲明者，本網將追究其相關法律責任。
【2】凡本網注明"來源：XXX（非中國鋼鐵新聞網）"的作品，均轉載自其它媒體，轉載目的在於傳遞更多信息，並不代表本網讚同其觀點，不構成投資建議。
【3】如果您對新聞發表評論，請遵守國家相關法律、法規，尊重網上道德，並承擔一切因您的行為而直接或間接引起的法律責任。
【4】如因作品內容、版權和其它問題需要同本網聯係的。電話：010—010-64411649