1 引言
標準在國民經(jīng)濟和社會發(fā)展中擔任重要的角色。在宏觀層面,標準對社會經(jīng)濟發(fā)展全局起到重要作用,是國家基礎(chǔ)性制度的重要組成部分,是可持續(xù)發(fā)展的重要保障。同樣,當前“得標準者得天下”,標準影響市場的控制權(quán)。因而,通過標準與技術(shù)的融合,實現(xiàn)技術(shù)標準化、標準壟斷化,可以最大限度地獲取市場份額。在微觀層面,標準作為重要技術(shù)創(chuàng)新成果的匯集,其事關(guān)企業(yè)的生存和發(fā)展,是企業(yè)組織生產(chǎn)和經(jīng)營的依據(jù),高標準將助力企業(yè)高質(zhì)量發(fā)展。
為了適配數(shù)字經(jīng)濟發(fā)展,發(fā)揮標準化的引領(lǐng)作用需要其進行數(shù)字化轉(zhuǎn)變。標準在數(shù)字經(jīng)濟時代將有效推動企業(yè)和行業(yè)之間的質(zhì)量信息協(xié)調(diào),是促進生產(chǎn)商、供應(yīng)商、銷售商、消費者甚至包括競爭對手在內(nèi)的全產(chǎn)業(yè)鏈生態(tài)配合的必要基石。在推動數(shù)字經(jīng)濟發(fā)展過程中,高質(zhì)量數(shù)字化標準有效實施是提升質(zhì)量基礎(chǔ)設(shè)施能力、串聯(lián)改造產(chǎn)業(yè)價值鏈的核心要素,也將促進標準與數(shù)字化轉(zhuǎn)型的生產(chǎn)應(yīng)用緊密結(jié)合。數(shù)字化將會進一步助推標準化的發(fā)展。利用數(shù)字化技術(shù)對標準化工作和標準本身賦能,創(chuàng)建標準結(jié)構(gòu)和內(nèi)容的新形式,實現(xiàn)靈活、高效、交互的標準實施過程,推動標準管理體系與管理能力智能化。
2
標準數(shù)字化發(fā)展歷程
國際上具有影響力的標準化機構(gòu)為實現(xiàn)多國標準互換性和標準通用性,制定標準數(shù)字化轉(zhuǎn)型相關(guān)戰(zhàn)略。2017年,ISO副秘書長在“標準與數(shù)字化:擁抱變革”的報告中提出數(shù)字化影響下的未來標準化;2018年,ISO通過技術(shù)管理委員會94號決議,建立了機器可讀標準的戰(zhàn)略咨詢小組,提出了機器可讀標準(SMART)概念,發(fā)布了實施路線圖;2021年,ISO發(fā)布《ISO戰(zhàn)略2030》,認為數(shù)字技術(shù)是ISO變革的驅(qū)動因素之一。IEC作為世界上成立最早的國際性電工標準化機構(gòu),2017年在發(fā)展規(guī)劃中提出IEC將繼續(xù)為其核心業(yè)務(wù)的根本性改變做準備,其中包括可直接由機器使用的新型數(shù)字標準。
2020年IEC SMB重啟SG12“數(shù)字化轉(zhuǎn)型和系統(tǒng)方案”戰(zhàn)略組,其工作范圍包括數(shù)字化轉(zhuǎn)型有關(guān)內(nèi)容、國際標準的數(shù)字化轉(zhuǎn)型方法等。2021年IEC CB成立“SMART標準化與合格評定”任務(wù)組。各國為提高國家產(chǎn)品和技術(shù)的國際市場占有率和國際競爭力,出臺多項標準數(shù)字化轉(zhuǎn)型政策。美國航空航天工業(yè)協(xié)會于2005年提出未來標準將作為一系列數(shù)據(jù)單元進行管理和控制;2021年,ANSI正式發(fā)布《美國標準戰(zhàn)略》,提出數(shù)字化工具可以有效地用于優(yōu)化全球標準的制定。俄羅斯于2019年在《2019—2027年俄羅斯標準化發(fā)展措施方案》提出將國家標準轉(zhuǎn)換為“機器可讀格式”。德國DIN/DKE為支持企業(yè)數(shù)字化轉(zhuǎn)型于2017年將“未來機器可執(zhí)行標準的結(jié)構(gòu)和格式”作為其重點領(lǐng)域。英國BSI于2019年啟動在數(shù)字化環(huán)境中進行標準協(xié)作開發(fā)的敏捷流程。
我國為標準數(shù)字化轉(zhuǎn)型進行一系列行動。2009年,中國航空領(lǐng)域相關(guān)機構(gòu)將標準處理、存儲為數(shù)據(jù)單元形式,并與工業(yè)軟件、操作系統(tǒng)等結(jié)合,使得標準使用形式能夠基本滿足標準使用需求。2021年10月我國發(fā)布《國家標準化發(fā)展綱要》,其為我國標準化事業(yè)的發(fā)展提供了可遵循的綱領(lǐng)性文件,其中對標準數(shù)字化給出了明確的方向:“推動標準化工作向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型”。2022年,籌建全國標準數(shù)字化工作組,負責標準數(shù)字化基礎(chǔ)通用、建模與實現(xiàn)共性技術(shù)、應(yīng)用技術(shù)等領(lǐng)域國家標準制修訂工作。
3
工業(yè)生產(chǎn)標準數(shù)字化轉(zhuǎn)型的路徑
當前,工業(yè)生產(chǎn)均在進行數(shù)字化轉(zhuǎn)型,但是標準使用與其適配性存在問題。工程技術(shù)人員獲取標準嚴重依賴專業(yè)經(jīng)驗和標準使用背景,因此在選用標準時易出現(xiàn)誤區(qū)。同時,傳統(tǒng)標準無法與工業(yè)生產(chǎn)數(shù)字化升級協(xié)調(diào)統(tǒng)一,因而無法實時掌握貫標效果,難以即時發(fā)現(xiàn)標準制修訂中的指標不完善、不齊全等問題。
國家工信部發(fā)布《原材料工業(yè)兩化深度融合推進計劃(2015-2018年)》,“以公共平臺建設(shè)、智慧工廠示范、技術(shù)推廣普及為著力點,努力實現(xiàn)流程工業(yè)全鏈條全系統(tǒng)智能化”。伴隨著新技術(shù)手段不斷涌現(xiàn)及應(yīng)用水平不斷提升,高新數(shù)字化技術(shù)在工業(yè)生產(chǎn)領(lǐng)域開始覆蓋全產(chǎn)業(yè)鏈,進而促進實時洞察各方需求與定制化生產(chǎn)新模式有機結(jié)合。正在進行數(shù)字化轉(zhuǎn)型的工業(yè)生產(chǎn)領(lǐng)域,最終目標是將人的知識經(jīng)驗通過系統(tǒng)進行固化,減少人的干預(yù),直至實現(xiàn)無人干預(yù)的目標。
在生產(chǎn)經(jīng)營全流程中,通過數(shù)字化技術(shù)實現(xiàn)最優(yōu)生產(chǎn),系統(tǒng)會自動進行生產(chǎn)優(yōu)化組合,選擇最優(yōu)化的方案執(zhí)行。在此過程中無法離開標準的規(guī)范化作用,然而目前標準普遍處于紙質(zhì)或PDF版,在標準選擇階段,需通過具有一定專業(yè)背景及相關(guān)儲備的標準使用者經(jīng)過對標準內(nèi)容比對和分析,選擇適合應(yīng)用場景的標準進行使用。在標準使用階段,傳統(tǒng)標準的使用只能依靠人工輸入的方式與數(shù)字化轉(zhuǎn)型的產(chǎn)業(yè)鏈進行聯(lián)通。
隨應(yīng)用環(huán)境復(fù)雜程度提升,標準使用過程的效率相應(yīng)降低。根據(jù)ISO/IEC提出的SMART標準數(shù)字化路徑,實現(xiàn)工業(yè)生產(chǎn)應(yīng)用中標準數(shù)字化轉(zhuǎn)型主要分為機器可識別標準、機器可執(zhí)行標準和機器可決策標準三個階段。
第一個階段需實現(xiàn)將傳統(tǒng)標準文本轉(zhuǎn)化為機器可識別的文檔類型,為接下來進行標準的數(shù)字化技術(shù)處理奠定基礎(chǔ)。目前,對于標準文本的轉(zhuǎn)化分為如下幾步:(1)基于PDF文本進行處理,通過OCR技術(shù),利用文檔中的暗亮,確定其形狀;(2)利用字符識別方法將形狀翻譯成計算機文字;(3)通過文字軟件,結(jié)合上下文對最終矢量化文檔進行編輯加工。
第二個階段重點為可根據(jù)應(yīng)用場景選擇性地訪問附有語義的標準內(nèi)容,主要實現(xiàn)按照需求獲取標準內(nèi)容。國家標準、行業(yè)標準、團體標準等各級標準之間存在技術(shù)要求的差異。同時,各領(lǐng)域標準目前已形成體系,各標準范圍之間存在關(guān)聯(lián),標準內(nèi)容本身也存在聯(lián)系。在該階段,需將機器可處理的文檔進行數(shù)字化加工,賦予其語義,選擇最貼合應(yīng)用環(huán)境的知識顆粒度進行標準離散化處理,深度挖掘內(nèi)容中的相互關(guān)聯(lián)性和系統(tǒng)性,使標準不再以文檔的形式獨立存在,而是將標準所包含的知識點形成一個屬于該領(lǐng)域的知識網(wǎng)絡(luò),一個屬于該領(lǐng)域標準的“知識大腦”。根據(jù)需求輸入,經(jīng)知識網(wǎng)絡(luò)的分析和匹配,輸出與之相關(guān)的標準內(nèi)容,使得標準的內(nèi)容更具有靈活性和實用性。在該階段,首先結(jié)合具體應(yīng)用場景對標準中的關(guān)鍵元素進行比對分析,對重要指標內(nèi)容的限定類和限定項進行總結(jié)歸納,獲得對接應(yīng)用場景的基礎(chǔ)模型?;诖?,對標準信息的實體、實體關(guān)系以及屬性進行抽取,通過對實體的鏈接和重復(fù)項的合并進行標準知識圖譜的融合。最后,借助對標準知識的推理和知識圖譜質(zhì)量評估進行標準知識圖譜的加工以及優(yōu)化。基于標準知識圖譜,根據(jù)具體應(yīng)用場景進行智能對接,實現(xiàn)智能問答、適用標準推送等一系列標準服務(wù)。
最后一個階段,機器能夠以更為復(fù)雜的方式執(zhí)行或解析與標準相關(guān)內(nèi)容。前兩階段主要基于現(xiàn)有標準,進行標準的數(shù)字化,而該階段覆蓋面已不局限于現(xiàn)有標準內(nèi)容,而是基于大數(shù)據(jù)等數(shù)字化智能化技術(shù),實現(xiàn)標準數(shù)字化執(zhí)行與數(shù)字化標準的形成。關(guān)聯(lián)服務(wù)于生產(chǎn)現(xiàn)場管控的物聯(lián)網(wǎng)平臺,通過IOT協(xié)議、智能傳感技術(shù)和無線網(wǎng)絡(luò)通訊協(xié)議等技術(shù),對生產(chǎn)現(xiàn)場的設(shè)備運行數(shù)據(jù)、巡檢作業(yè)數(shù)據(jù)、安全環(huán)保數(shù)據(jù)、物流數(shù)據(jù)等進行全面采集。同時,面向企業(yè)提供的生產(chǎn)運行綜合管理平臺,通過對生產(chǎn)過程數(shù)據(jù)、實時數(shù)據(jù)、化驗分析、計量等生產(chǎn)數(shù)據(jù)的集成,實現(xiàn)對生產(chǎn)執(zhí)行、調(diào)度、運行等業(yè)務(wù)領(lǐng)域全覆蓋,達到生產(chǎn)信息集成、業(yè)務(wù)管理協(xié)同。
綜合采集上層和下層的數(shù)據(jù),實現(xiàn)獲取不中斷的數(shù)據(jù)流,并通過自學習的方式改善內(nèi)容處理及訪問方式,使用方可通過自動問答或智能推送獲取目標標準內(nèi)容。
標準數(shù)字化不僅是標準存在 形式的“數(shù) 字化”,還包括標準化的數(shù)字化,后者主要是利用數(shù)字化技術(shù)推動標準化工作的生命周期全過程的發(fā)展,更好地實現(xiàn)標準的“管、查、用、編”。如果在生產(chǎn)過程中出現(xiàn)標準的缺失,將在數(shù)據(jù)鏈條中得到即時的反饋。同時,隨著技術(shù)、設(shè)備等的發(fā)展,標準的技術(shù)指標也需進行修訂,結(jié)合各標準的執(zhí)行情況和反饋,標準的適配情況也將得到即時預(yù)警?;诂F(xiàn)有標準知識覆蓋及使用情況進行信息收集,依據(jù)實際情況進行標準的制修訂,以開源的方式進行標準的編寫,實現(xiàn)快速迭代和動態(tài)更新。針對已形成的標準,工廠可比對已有標準技術(shù)指標等相關(guān)數(shù)據(jù),通過邊緣計算技術(shù)實現(xiàn)前端狀態(tài)監(jiān)控、診斷分析和預(yù)警報警等功能,為實現(xiàn)生產(chǎn)現(xiàn)場智能化設(shè)備監(jiān)控維護、生產(chǎn)操作管控、安全環(huán)保管控等提供數(shù)據(jù)支持,促進業(yè)務(wù)模式提升和變革,為智能生產(chǎn)建設(shè)奠定基礎(chǔ)。
4
標準數(shù)字化關(guān)鍵技術(shù)
▍4.1 光學字符識別技術(shù)
字符作為標準中占比最大的形式,是實現(xiàn)傳統(tǒng)標準向機器可識別標準轉(zhuǎn)型的關(guān)鍵。進行字符的識別需先進行字符特征的機器學習,基于識別系統(tǒng)儲備的相關(guān)字符信息,可針對輸入字符的明暗特征等信息進行儲備知識的調(diào)用,得到字符的識別結(jié)果。當前識別方法分為統(tǒng)計特征字符識別技術(shù)、結(jié)構(gòu)字符識別技術(shù)和基于神經(jīng)網(wǎng)絡(luò)的識別技術(shù)。在識別字符后,根據(jù)原排版的格式進行版面恢復(fù)。最后根據(jù)特定的語言上下文關(guān)系,對識別結(jié)果進行校正。標準的結(jié)構(gòu)和起草規(guī)則嚴格按照GB/T 1.1《標準化工作導(dǎo)則 第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》進行編寫,與光學字符識別技術(shù)結(jié)合使用,對識別結(jié)果的準確性有一定程度的推動作用。
▍4.2 知識圖譜
傳統(tǒng)標準知識數(shù)據(jù)庫常以傳統(tǒng)關(guān)系性數(shù)據(jù)庫為基礎(chǔ),冗余性高,分布分散,關(guān)聯(lián)性較弱,較少從語義層面挖掘知識的關(guān)聯(lián)性,其與成體系且具有高關(guān)聯(lián)性的標準知識本身相矛盾。為打破標準知識的“孤島”,借助知識圖譜將其關(guān)聯(lián)。構(gòu)建標準知識圖譜首先需要獲取數(shù)據(jù),它們可以以表格、文本等不同結(jié)構(gòu)化程度的知識為來源,對實體識別、關(guān)系和屬性進行抽取后,需要對數(shù)據(jù)進行知識融合,解決來源不同導(dǎo)致的數(shù)據(jù)交叉、重疊等問題,將來源不同的知識融合成一個知識集合體。為實現(xiàn)結(jié)構(gòu)化、網(wǎng)絡(luò)化的知識體系,還需進行本體構(gòu)建、知識推理和質(zhì)量評估,以此保障最終標準知識庫的質(zhì)量。
▍4.3 自然語言處理
標準存在初期是以人為使用對象,為實現(xiàn)從人使用到機器使用的跨越,需要搭建人與計算機之間用自然語言進行有效通信的理論和方法。自然語言處理本質(zhì)上是基于詞典,通過詞頻統(tǒng)計,上下文語義分析等方式方法進行語料分詞。在標準文本領(lǐng)域中的自然語言處理就是將完整的標準碎片化為最小詞性且富含語義的詞項單元。面對大量標準,一般情況需借助機器學習對其進行處理,除了借助人工標注的傳統(tǒng)機器學習方法還可借助深度學習模型,進而實現(xiàn)不同層次特征的自然語言處理。針對不同的應(yīng)用場景和專業(yè)背景,標準的自然語言處理存在一定的差異性,充分融合領(lǐng)域知識以及專業(yè)概念,對關(guān)鍵信息進行分解、標注和重組尤為重要。在進行模型訓練的過程中,需將算法的準確度置于合理區(qū)間。在標準數(shù)字化過程中,標準文本的自然語言處理貫穿全過程,需緊密結(jié)合其應(yīng)用場景和專業(yè)領(lǐng)域,以此獲得合適的模型。
5 結(jié)語
標準數(shù)字化已成為適應(yīng)全球數(shù)字經(jīng)濟發(fā)展下工業(yè)生產(chǎn)發(fā)展的重要組成部分。我國大部分標準仍處于紙質(zhì)標準或PDF版,與基本實現(xiàn)機器可識別標準的ISO、IEC等標準化機構(gòu)存在距離,各領(lǐng)域開始聚焦標準本身,結(jié)合應(yīng)用場景,進行標準數(shù)字化轉(zhuǎn)型,構(gòu)建覆蓋標準“管、查、用、編”全生命周期的數(shù)字生態(tài)系統(tǒng),為我國數(shù)字經(jīng)濟發(fā)展保駕護航。標準數(shù)字化在未來的發(fā)展中存在如下四方面的挑戰(zhàn):
第一,在技術(shù)層面,標準數(shù)字化涉及一系列當下最先進的技術(shù),包括數(shù)字化加工、自然語言處理,知識圖譜構(gòu)建技術(shù)等,如何攻破各項技術(shù)在標準數(shù)字化方面的應(yīng)用是轉(zhuǎn)型的關(guān)鍵;
第二,在數(shù)據(jù)層面,標準數(shù)字化涉及國家標準、行業(yè)標準、團體標準、企業(yè)標準以及企業(yè)內(nèi)部的技術(shù)規(guī)范書等文件,存量數(shù)據(jù)多,由于標準數(shù)字化對離散化程度要求高,加工難度大,需根據(jù)重要程度進行差異化加工標引,打好數(shù)據(jù)基礎(chǔ)從而保證將來的應(yīng)用;
第三,在業(yè)務(wù)層面,標準數(shù)字化建設(shè)最終是服務(wù)于各公司的工業(yè)生產(chǎn)需求,因此在建設(shè)過程中應(yīng)有相關(guān)業(yè)務(wù)專家參與,分析并獲得最適宜的標準知識顆粒度,推動標準及其應(yīng)用場景的智能對接;
第四,在標準化工作的管理方面,數(shù)字化技術(shù)將推動標準的全周期更為高效、便捷,隨著線上、開源等多種方式的出現(xiàn),標準化的管理體制還需要進行調(diào)整,且與國家標準、行業(yè)標準、團體標準等各級標準相關(guān)的制度應(yīng)根據(jù)實際情況和標準本身的特點進行差異化制定。
本文作者:中國石油集團工程材料研究院有限公司 陳心怡 張華 賈君君 楊揚&西安交通大學 謝軍太
-THE END-
素材來源 | 新工業(yè)網(wǎng)