鋼鐵行業需要什麼樣的大模型?
2026-05-03 00:42:46
中國冶金報 中國鋼鐵新聞網
記者 樊三彩 報道
繼ChatGPT大模型後,國內智譜AI的ChatGLM、百度的文心一言、科大訊飛的星火等國產大模型如雨後春筍般湧現,被稱為“百模大戰”。zaitabeihou,bujinshigejiajishushilidebipin,yeshiyingyongchangjingluodinenglidejiaoliang。lingshichangkuangrededamoxingjiujingyouhemoli?danggangtiexingyeyujiandamoxing,youhuipengzhuangchuzenyangdehuohua?jinri,《中國冶金報》記者專訪了智譜AI CEO張鵬,圍繞當前的“大模型熱”進行了對話。
智譜AI於2019年由清華大學計算機係技術成果轉化而成立,於次年便開始了GLM預訓練架構的研發,是國內最早從事大模型相關研究的機構之一。“麵對‘大模型熱’,如果用一個詞來形容我的想法,那就是篤信。”張鵬指出,“信”當然就是相信這件事情,大模型一定是通往AGI(通用人工智能)的必經之路,能創造更大的價值;“篤”是一種踏實、審慎的態度,相信是基於對這件事情的理解和鑽研,而不是狂熱、沒有根基的。
從紙上談兵到實踐躬行,大模型為什麼這麼“熱”?
大模型的起源可以追溯到2017年,Transformer算法架構的誕生,開啟了大模型演化的曆史進程。雖然在接下來的幾年內,BERT、GPT-1、GPT-2也先後出現,甚至BERT在十多個自然語言理解任務上大大超過傳統算法的精度,但依舊沒有在業界引起太多的火花,直至2020年的到來。“這一年是大模型元年。”張鵬表示。
GPT-3的問世大大提高了模型的內容生成和邏輯推理能力,它在上下文學習和知識(常識)理解等方麵展現出驚人能力。隨後在全球範圍內掀起了一股基礎模型研究的熱潮,國外如 Meta、微軟、穀歌等,國內如清華大學、北京智源人工智能研究院、百度、華為、阿裏巴巴、智譜AI等,都競相追趕,提出包括Gopher、Chinchilla、PaLM、GLM-130B等在內的多個千億元級模型。
然(ran)而(er),複(fu)雜(za)的(de)研(yan)發(fa)技(ji)術(shu)以(yi)及(ji)高(gao)昂(ang)的(de)訓(xun)練(lian)成(cheng)本(ben),也(ye)讓(rang)不(bu)少(shao)人(ren)望(wang)而(er)卻(que)步(bu)。在(zai)當(dang)時(shi),並(bing)不(bu)是(shi)所(suo)有(you)人(ren)都(dou)能(neng)夠(gou)看(kan)清(qing)技(ji)術(shu)發(fa)展(zhan)脈(mai)絡(luo),而(er)大(da)模(mo)型(xing)對(dui)資(zi)金(jin)投(tou)入(ru)的(de)要(yao)求(qiu)很(hen)高(gao),貿(mao)然(ran)投(tou)入(ru)風(feng)險(xian)頗(po)大(da)。“當時,我們邀請了一些學界的教授對未來技術的演進方向進行研討,大家都認為這是大模型到達了一個臨界點的信號,AI開始真正進入了可用階段。但是我們在尋找算力、模型工程問題等方麵遇到了很多困難,最後猶豫了很久才決定all in(全部投入)大模型,開始自研算法框架。”張鵬表示。
直至2022年底,ChatGPT發布才真的激起了“百模大戰”的開始,與過往的機器學習技術不同,ChatGPT不再是枯燥的技術理論,它能夠在各領域的應用場景反複驗證,人們才真正感受到大模型“智能湧現”的魅力。ChatGPT實現全球用戶破億僅用了短短兩個月,而電話用戶破億用了75年,手機用了16年,網站用了7年,此前用戶增長最快的應用TikTok也用了9個月。
百家爭鳴、百花齊放,對“大模型熱”要注意什麼?
ChatGPT的(de)發(fa)布(bu)激(ji)發(fa)了(le)更(geng)多(duo)機(ji)構(gou)和(he)公(gong)司(si)的(de)研(yan)發(fa)鬥(dou)誌(zhi)和(he)熱(re)情(qing),眾(zhong)多(duo)資(zi)本(ben)紛(fen)紛(fen)投(tou)入(ru)到(dao)大(da)模(mo)型(xing)研(yan)發(fa)的(de)藍(lan)海(hai)之(zhi)中(zhong),相(xiang)關(guan)部(bu)門(men)也(ye)關(guan)注(zhu)到(dao)了(le)這(zhe)一(yi)重(zhong)要(yao)的(de)技(ji)術(shu)創(chuang)新(xin),給(gei)予(yu)了(le)非(fei)常(chang)多(duo)的(de)政(zheng)策(ce)支(zhi)持(chi),進(jin)一(yi)步(bu)促(cu)進(jin)了(le)大(da)模(mo)型(xing)的(de)研(yan)發(fa)和(he)優(you)化(hua)升(sheng)級(ji),形(xing)成(cheng)了(le)“百家爭鳴、百花齊放”的科技發展新態勢。這也讓已經積累了兩年技術實力的智譜AI從幕後走到了台前。
但麵對“大模型熱”絕不能盲目。大模型的開發和應用雖然會助推產業和經濟發展,但如果不加以合理管控,也會給產業安全帶來風險。一方麵是芯片的“卡脖子”問(wen)題(ti)。算(suan)力(li)是(shi)大(da)模(mo)型(xing)的(de)基(ji)礎(chu)之(zhi)一(yi),如(ru)何(he)保(bao)證(zheng)算(suan)力(li)的(de)持(chi)續(xu)穩(wen)定(ding)供(gong)應(ying)是(shi)產(chan)業(ye)安(an)全(quan)必(bi)須(xu)關(guan)注(zhu)的(de)問(wen)題(ti)。另(ling)一(yi)方(fang)麵(mian),產(chan)業(ye)所(suo)使(shi)用(yong)的(de)基(ji)座(zuo)模(mo)型(xing)是(shi)否(fou)安(an)全(quan)可(ke)控(kong)也(ye)是(shi)一(yi)個(ge)重(zhong)要(yao)的(de)問(wen)題(ti)。模(mo)型(xing)的(de)訓(xun)練(lian)數(shu)據(ju)是(shi)否(fou)安(an)全(quan)合(he)規(gui),模(mo)型(xing)是(shi)否(fou)自(zi)主(zhu)可(ke)控(kong),會(hui)不(bu)會(hui)像(xiang)“芯片進口”一樣遇到各種限製?這些都是影響產業長遠發展的重要問題。
麵(mian)對(dui)風(feng)險(xian)挑(tiao)戰(zhan),張(zhang)鵬(peng)指(zhi)出(chu),作(zuo)為(wei)一(yi)家(jia)創(chuang)業(ye)公(gong)司(si),做(zuo)大(da)語(yu)言(yan)模(mo)型(xing)要(yao)有(you)很(hen)大(da)的(de)決(jue)心(xin),除(chu)了(le)研(yan)究(jiu)層(ceng)麵(mian)上(shang)的(de)挑(tiao)戰(zhan),還(hai)有(you)模(mo)型(xing)訓(xun)練(lian)工(gong)程(cheng)層(ceng)麵(mian)上(shang)涉(she)及(ji)到(dao)的(de)資(zi)源(yuan)投(tou)入(ru)、團隊、訓練數據等一係列的事情。在芯片問題上,智譜AI在(zai)研(yan)發(fa)之(zhi)初(chu)便(bian)製(zhi)訂(ding)了(le)國(guo)產(chan)硬(ying)件(jian)適(shi)配(pei)計(ji)劃(hua),目(mu)前(qian)已(yi)經(jing)與(yu)十(shi)餘(yu)家(jia)國(guo)產(chan)芯(xin)片(pian)廠(chang)商(shang)合(he)作(zuo),希(xi)望(wang)可(ke)以(yi)在(zai)全(quan)方(fang)位(wei)適(shi)配(pei)的(de)同(tong)時(shi),提(ti)升(sheng)模(mo)型(xing)在(zai)國(guo)產(chan)硬(ying)件(jian)上(shang)的(de)訓(xun)練(lian)推(tui)理(li)效(xiao)率(lv)。此(ci)外(wai),智(zhi)譜(pu)AI也選擇了從底層算法開始自研,以實現基座模型安全可控的目標。
“國產大模型與國外大模型之間的差距依然存在,但我們有信心去追趕這個差距,我們一直在不斷創新的路上。”張鵬表示。
傳統產業+大模型,如何放大應用價值?
當前,隨著人工智能的快速發展,大模型的應用已經逐漸從研究領域擴展到工業實踐中,形成工業大模型。從“通用”到“應用”,大模型正在叩響工業製造的大門。
從研發難度來看,無論是通用大模型,還是工業大模型,研發投入、核心人才和應用場景都是不可或缺的,也構成了市場的核心壁壘。而工業大模型對算法模型的有效性、高質量的數據、suanlidezhichengnengliyoujigaoyaoqiu,moxingdeyouhuadiedaiyiyoulaiyuzijinherencaidechixutouru。yinci,damoxingdeshijiluodihexingyeyingyongnenglichengweileshichangjianyandezhongyaobiaozhun。
“工業大模型的普適性商業應用尚需探索。”張鵬認為,一是工業大模型需與其他數字化產品進一步整合,滿足工業企業對網絡、算suan力li以yi及ji數shu據ju管guan理li的de一yi體ti化hua要yao求qiu,實shi現xian即ji買mai即ji用yong。二er是shi工gong業ye企qi業ye使shi用yong門men檻kan仍reng然ran較jiao高gao,比bi如ru需xu要yao基ji於yu提ti示shi詞ci進jin行xing應ying用yong開kai發fa,把ba問wen題ti解jie決jue的de長chang線xian邏luo輯ji和he相xiang關guan案an例li融rong入ru進jin去qu,使shi大da模mo型xing能neng按an照zhao預yu設she步bu驟zhou、思考鏈路和回答格式來產生答案。三是工業各領域已存在大量工業軟件、gongyehulianwangpingtai,ruheliyongdamoxingxingchengxietongshengtaijiangshenkeyingxiangyonghuganzhijichanpinshengmingli,yunxubinggulidisanfangkaifazhejiyugongyedamoxingkaifachajianshizhongyaolujing,ruOpenAI正基於ChatGPT+插件加快構建自己的生態圈。
dayuyanmoxinghuizhongsuqianxingbaiyedeyetai,danxuyaozaijutidexingyeluodifangmiantourugengduoziyuan。renheyixiangjishufazhandaoyidingchengduzhihou,doubiranhuichanshenggengduoshijijiazhi。ruheshixianjiazhi,changjiandeyizhongshuofashibingbuxuyaotongyongdejizuodamoxing,zhixuyaoxiaode、中量級的、合he適shi的de行xing業ye模mo型xing。但dan大da語yu言yan模mo型xing能neng力li突tu破po的de根gen本ben原yuan因yin在zai於yu,它ta對dui世shi界jie知zhi識shi的de學xue習xi和he建jian模mo,使shi得de它ta具ju備bei了le接jie近jin人ren的de理li解jie推tui理li和he更geng進jin階jie的de認ren知zhi能neng力li。張zhang鵬peng表biao示shi,最zui理li想xiang的de狀zhuang態tai是shi,行xing業ye模mo型xing並bing不bu是shi完wan全quan獨du立li於yu基ji座zuo模mo型xing和he通tong用yong模mo型xing,而er是shi生sheng長chang在zai基ji座zuo模mo型xing之zhi上shang,基ji於yu它ta進jin行xing進jin一yi步bu的de訓xun練lian和he微wei調tiao。
當前,我國傳統產業正麵臨智能化轉型,加入行業特色數據與知識、精準匹配真實應用場景的行業大模型,能夠極大地提升業務流程效率和水平,驅動產業轉型升級。鋼鐵工業具有生產流程連續、工藝體係複雜、產品中間態多樣化、大型高溫高壓設備集中、人員安全要求高等特征,屬於典型的流程型製造業,麵臨著嚴峻的資源、市場、環保、競爭等挑戰。“鋼鐵工業亟需通過大模型等先進技術及場景化創新應用,提升行業的綠色環保、安全保障水平和生產效率。”張鵬說。
對於大模型如何在鋼鐵行業應用,張鵬表示,可以打造鋼鐵工業人工智能解決方案,以具備通用基礎能力的AI大模型作為智能底座,結合行業知識和場景數據進行訓練和微調,從而有效應對碎片化和多樣化需求,並大幅縮減研發、定製、部署、調優等工程化過程中的人力、時間、費用等成本投入,也能解決好數據安全問題,促進人工智能在鋼鐵行業大規模應用,促進鋼鐵行業智能化升級。

來源:中國冶金報-中國鋼鐵新聞網
編輯:張雨恬
相關文檔
版權說明
【1】 凡本網注明"來源:中國冶金報—中國鋼鐵新聞網"的所有作品,版權均屬於中國鋼鐵新聞網。媒體轉載、摘編本網所刊 作品時,需經書麵授權。轉載時需注明來源於《中國冶金報—中國鋼鐵新聞網》及作者姓名。違反上述聲明者,本網將追究其相關法律責任。
【2】 凡本網注明"來源:XXX(非中國鋼鐵新聞網)"的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,並不代表本網 讚同其觀點,不構成投資建議。
【3】 如果您對新聞發表評論,請遵守國家相關法律、法規,尊重網上道德,並承擔一切因您的行為而直接或間接引起的法律 責任。
【4】 如因作品內容、版權和其它問題需要同本網聯係的。電話:010—010-64411649
【2】 凡本網注明"來源:XXX(非中國鋼鐵新聞網)"的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,並不代表本網 讚同其觀點,不構成投資建議。
【3】 如果您對新聞發表評論,請遵守國家相關法律、法規,尊重網上道德,並承擔一切因您的行為而直接或間接引起的法律 責任。
【4】 如因作品內容、版權和其它問題需要同本網聯係的。電話:010—010-64411649
地址:北京市朝陽區安貞裏三區26樓 郵編:100029 電話:(010)64442120/(010)64442123 傳真:(010)64411645 電子郵箱:
中國冶金報/中國鋼鐵新聞網法律顧問:大成律師事務所 楊貴生律師 電話: Email:
中國鋼鐵新聞網版權所有,未經書麵授權禁止使用 京ICP備07016269號 京公網安備11010502033228




























