區塊鏈在檔案系統中應用(區塊鏈技術在文件檔案管理中的應用初探)
區塊鏈技術在文件檔案管理中的應用初探 |
【摘要】迅猛發展的區塊鏈正在構成文件檔案管理的一種新技術環境。本文采用文獻研究法,對區塊鏈技術在文件檔案管理中的應用及影響進行探索性研究。在對區塊鏈技術進行簡單的介紹之后,首先分析其在文件檔案真實性保障方面的突破;其次結合區塊鏈技術在文件檔案管理中的應用類型,探討其對文件檔案管理的沖擊;最后根據電子文件管理的既有經驗,就區塊鏈環境中的文件檔案管理研究提出建議。 1背景 隨著比特幣的巨幅升值,其底層技術——區塊鏈(Blockchain)的價值不斷凸顯,甚至被認為是可能觸發新一輪信息技術革命的核心技術。當前英、美、澳、新、印等多個國家和地區紛紛出臺政策,促進其應用[1]。我國也采取了積極行動,《國務院關于印發“十三五”國家信息化規劃的通知》(國發[2016]73號)中,區塊鏈被當作戰略性技術提前布局;《國務院關于進一步擴大和升級信息消費持續釋放內需潛力的指導意見》(國發[2017]40號)將開展基于區塊鏈的試點應用作為重點任務之一。目前,該項技術的應用已經在金融、合同管理、資產管理、供應鏈、公共服務等領域迅速鋪開。 迅猛發展的區塊鏈正在構成文件檔案管理的一種新技術環境。2017年和2018年國家檔案局科技項目立項選題指南以及2018年國家社科基金項目立項指南中,均設有區塊鏈技術在文件檔案領域應用的相關選題,彰顯出研究的迫切性。 2文獻綜述 區塊鏈環境下形成的文件將以一種永不刪除的方式保存,并通過鏈式數據結構、摘要、時間戳、數字簽名等技術保證文件內容不被更改[2],因此在文件檔案真實性保護方面具有突出優點。然而文件檔案管理領域對區塊鏈的專門研究極其有限[3],我國僅有少數學者初步研究了區塊鏈技術在電子證照管理[4]、高校檔案管理[5]、電子健康檔案[6]中應用的可行性和基本設想,探討了其在電子檔案管理中的適用性[7]。加拿大不列顛哥倫比亞大學(UBC)Victoria Louise Lemieux的相關研究一枝獨秀。她根據文獻研究和訪談調研,得出區塊鏈技術本質上是一種文件檔案管理技術的結論[8]。她還立足于ISO15489、ISO 14721、ISO 16363等國際標準中可信數字文件保存的需求,分析了應用區塊鏈技術管理數字文件的局限性和風險,包括區塊鏈技術不能確保文件的準確性、可靠性,其安全風險可能導致真實性受損,格式轉換、遷移等其他長期保存要求未被考慮等[9];并根據檔案學理論構建了區塊鏈技術評價框架,進一步分析了該技術的不足之處[10]。此外,她基于案例研究,總結了不同區塊鏈文件管理模式及其對檔案保存領域的影響[11],并針對區塊鏈中數字文件有機聯系揭示不足的缺點,定義了一種數據模型及其語法[12]。 既有國內相關成果主要探索區塊鏈給特定領域文件檔案管理帶來的好處,較少涉及其不足,也很少進行總結和反思,總的來說研究相對簡單。而國外研究較為深入,有實踐的追蹤和總結,也有基于檔案學基本理論的剖析。不過,其側重點主要是從檔案管理的角度分析區塊鏈技術的不足和影響,未從與其他技術對比的角度分析區塊鏈技術在文件檔案管理方面的突破,新技術應用背景下檔案界的反思和發展謀劃也有所不足。 3研究思路 本文采用文獻研究法,對區塊鏈技術在文件檔案管理中的應用及影響進行探索性研究。在對區塊鏈技術進行簡單的介紹之后,鑒于業界已經公認區塊鏈在可信數據維護方面的貢獻,本文首先分析其在文件檔案真實性保障方面的突破;其次結合區塊鏈技術在文件檔案管理中的應用類型,探討其對文件檔案管理的沖擊,闡述檔案部門可能面臨哪些區塊鏈技術應用帶來的挑戰;最后根據電子文件管理的既有經驗,就區塊鏈環境中的文件檔案管理研究提出建議。 4區塊鏈技術簡介 區塊鏈有狹義和廣義兩種理解。狹義上的區塊鏈是一種鏈式數據結構,鏈上的每個數據單元即數據區塊,這些區塊按照時間順序依次相連,并以密碼學方式保證其不可篡改和不可偽造,區塊鏈同時存儲在多個節點上,也稱為分布式賬本。廣義上的區塊鏈代表的是一種技術,是利用塊鏈式數據結構來驗證與存儲數據、利用分布式節點共識算法來生成和更新數據、利用密碼學的方式保證數據傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約來編程和操作數據的一種全新的分布式基礎架構與計算范式[13]。本文使用的是廣義區塊鏈概念,主要著眼于區塊鏈技術的一般性特征展開研究,并不討論區塊鏈技術的細節。 區塊鏈不是單一的技術,而是分布式數據存儲、點對點傳輸、共識機制、加密算法等多重技術的創新集成,且處于不斷發展中。區塊鏈體系架構包括網絡、共識、數據、智能合約、應用等層次,上述技術分別工作在不同層次上,如圖1所示。根據筆者的理解,區塊鏈在更多時候代表著一種底層技術架構,其上層的應用可以千變萬化。 圖1:區塊鏈技術參考架構圖[14] 按照網絡節點進出的自由程度,區塊鏈分為公有鏈和許可鏈。公有鏈中,任何節點都可以加入并查看網絡上的任意信息;許可鏈則只允許授權節點加入,其查看信息的權限也受到規制。多個機構共同運維管理的許可鏈稱為聯盟鏈,所有節點歸某一個機構所有的許可鏈即私有鏈[15]。許可鏈是區塊鏈商業應用的主流[16]。 5區塊鏈技術在文件檔案真實性保障方面的突破 業界指出,區塊鏈最大的作用就是解決數據的信任問題,甚至有人認為這是其唯一的作用[17],由此可見這種技術對于文件檔案真實性保護的價值。而在區塊鏈之前,已有多種維護文件檔案真實性的技術,最典型的莫過于后來在區塊鏈中得到整合應用的三大技術:數字簽名、時間戳和數字摘要。數字簽名用來識別文件責任者,防止偽造、抵賴和篡改;時間戳用來記錄文件創建或簽署時間,防止時間上作假;數字摘要是將文件經哈希函數運算后獲得一個值,該值被稱為摘要,也稱數字指紋、哈希值,原文若有變化,哈希值則隨之不同,常用來檢驗文件是否被破壞。相比這些傳統真實性保障技術,區塊鏈至少在以下兩個方面有了創新性突破: 5.1將所有文件的真實性維護任務綁定在一起 在區塊鏈中,文件通過非對稱加密機制簽名,打上時間戳,計算了哈希值。更為精妙的是,為了防止事后造假、抵賴和篡改,它將業務記錄按時間逐條串接成鏈式結構,前一個區塊鏈的哈希值放入第二個區塊鏈中。這樣一來,實現了區塊鏈的“塊塊相扣”,對任何文件的任何非法修改,勢必引發其他所有數據塊中哈希值的改變,正所謂“牽一發而動全身”,一份文件真實性有變,則所有文件的真實性均受到影響,如圖2所示。 圖2:區塊鏈鏈式結構示意圖[18] 業務記錄一旦登記進區塊鏈,永遠不能被刪除。如果確實存在合法修改某條業務記錄的必要,則只能在鏈上新增修改后的記錄,原記錄不得被覆蓋。用戶可以通過區塊鏈追溯整個業務過程。這使得鏈上文件的真實性因業務流程的不可逆與業務記錄的不可篡改而得到保障。 5.2實現了去中心化的真實性維護機制 區塊鏈網絡中的各個節點保存同樣的區塊鏈數據,且每個節點都參與數據的驗證和維護。只有超過半數以上的節點都同意故意修改數據,才能達到篡改數據的效果,而在實際場景中幾乎是不可能的。這種發揮每個參與方作用的信任機制被稱為去中心化的信任機制,第一次依靠技術而不是某個權威機構的方式實現了跨節點的信任。傳統的數字簽名技術,依賴認證中心(CA)給用戶頒布數字證書,用戶的身份及其簽名文件最終需要CA背書。區塊鏈通過簽名算法給每一個用戶頒布一對密鑰,其公鑰即為身份,無需權威機構認證。區塊鏈中時間戳技術同樣也是分布式的,并不一定需要授時中心等第三方機構的時間服務。全節點參與的共同治理模式,開啟了信任保障的新機制。因此,京東認為區塊鏈不僅是技術,更是理念,是“信任經濟”的技術基礎[19]。其真實性維護能力如此之強,以至于2016年6月美國佛蒙特州通過一項法案,確認了區塊鏈中的電子文件具有法律可采性,且無需另行證明其真實性[20]。 6 6.1按照應用場景劃分 按照應用的場景,區塊鏈技術在文件、檔案管理中的應用有三種類型:一是基于區塊鏈的業務系統,用以支持文件的創建和保存。這是目前最為普遍、也是最引人關注的一種應用。比如互聯網保險公司眾安保險采用區塊鏈電子保單系統處理健康險業務,將計費、客戶及理賠信息添加到區塊鏈上,截至2017年2月,已處理電子保單 21.27萬份,涉及保費收入 3736.36 萬元[21]。 二是基于區塊鏈的電子文件管理系統(Electronic Records Management System/ERMS,國內也翻譯為電子檔案管理系統,如GB/T29194-2012《電子文件管理系統通用功能要求》將ERMS翻譯為電子文件管理系統,而GB/T 18894-2016《電子文件歸檔與電子檔案管理規范》則將其翻譯為電子檔案管理系統——筆者注),用來支持電子文件的歸檔管理。此類應用很少,筆者看到的僅有一例,即美國特拉華州公共檔案館牽頭實施的“智能文件”項目,州政府機關的文件捕獲登記進入區塊鏈中,并利用智能合約技術來實現電子文件的到期自動處置[22]。 三是基于區塊鏈的電子檔案保存系統(也稱數字檔案館系統,是檔案最終歸宿地,主要應用在檔案館。我國也有電子檔案管理系統的說法,如國家檔案局2017年底印發的《電子檔案管理系統基本功能規定》——筆者注),用來支持電子檔案的接收、長期保存和利用服務。已有一些國家的檔案館先行先試,比如韃靼斯坦國家檔案館、英國國家檔案館都在開展區塊鏈應用實驗,在接收電子檔案時,將其哈希值登記進區塊鏈中[23]。無獨有偶,石化盈科于2017年底也提出了基于區塊鏈的電子檔案征信體系的設想方案,要在不同地方、單位的檔案部門構建檔案聯盟鏈,電子檔案移交進館時其哈希值同步存入各節點的區塊鏈中,鏈中各節點相互為電子檔案的真實性背書[24]。 6.2按照存儲對象劃分 Victoria Louise Lemieux按照區塊鏈中所存數據對象的不同,將區塊鏈系統分為三種類型[25]:一是鏡像型(Mirror)。此類區塊鏈主要作為電子文件哈希值的存儲庫,電子文件本身并不進入區塊鏈中,其首要目的是為保護電子文件的完整性。由于區塊鏈存在訪問效率的瓶頸,因此大部分區塊鏈都只存文件的哈希值,并不保存文件本身,下文中提到的法鏈即屬此類。 二是數字文件型(Digital Record)。此類系統中,除了數字文件的哈希值之外,其本身也通過智能合約的方式保存在區塊鏈中。上文中提到的眾安保險區塊鏈電子保單系統即屬此類。 三是資產憑據型(Token)。此類系統中,不僅文件內容數據及其哈希值保存在鏈上,文件記載的資產(如土地、珠寶等)被編碼為憑據(或譯為通證)也記載在區塊鏈上,成為文件的一部分。如巴西土地文件局基于UBITQUITY平臺開發的登記系統,采用SaaS模式,通過應用程序接口(API)將Web客戶端捕獲的土地信息與事務處理信息登記到比特幣區塊鏈上,該系統使用彩色幣(Colored Coins)協議表示土地憑據。Victoria認為資產憑據型是最具創新性的解決方案,檔案館若接收此類檔案,將在保存文件的同時也保存資產,成為真正的寶藏。 7區塊鏈對文件檔案管理的沖擊 7.1進一步加劇了文件檔案管理技術環境的復雜性 從社交媒體、云計算到大數據、物聯網,每一種新技術的產生和應用都對文件的形成和管理產生影響,給文件檔案管理工作帶來新機遇和新挑戰。如大數據技術一方面給海量數據的分析處理創造條件,另一方面也帶來篩選具有長期保存價值數據的難題;又如云計算在為文件檔案保管機構分擔責任、分享算力、分攤成本的同時,也使其面對由于分散帶來的合規性風險、技術風險和管理風險。區塊鏈的應用進一步加劇了文件檔案管理技術環境的復雜性,智能合約、資產憑據等新型管理對象浮出水面,分布式管理機制也將引發跨機構、跨司法轄區的管理問題。而一個機構可能同時應用上述多種技術,文件的形態、結構、格式、存儲方式、管理主體各不相同,復雜技術環境將日益成為文件檔案管理的一種常態。 7.2將專業的文件檔案管理功能變為一種可能泛在的信息基礎設施 傳統數字環境下,歷史數據并不能也不適合長期保存在原系統中,否則將極大影響業務系統的運行效率,歸檔不僅是長遠謀劃,也是現實需要。區塊鏈以一種不可篡改、可追溯、全歷史的方式存儲業務處理記錄,從而實現了ERMS的固化入庫、電子檔案保存系統的長期存儲及真實性保障功能。這意味著原來由專業文件檔案管理應用系統承擔的部分功能,在底層技術架構上實現了。基于區塊鏈的業務系統,自然而然地具備了上述文件檔案管理專業能力。這些系統的使用者,很可能不再另外使用ERMS和電子檔案保存系統管理區塊鏈文件。而專業功能納入底層信息基礎設施的結果是專業的泛化。隨著區塊鏈的發展,它很有可能成為一種泛在的信息基礎設施,文件檔案管理的專業性將面臨更大范圍的挑戰。 7.3對鑒定等檔案業務的必要性提出挑戰 文件一旦存入區塊鏈,便永不刪除。使用基于區塊鏈的業務系統,采取的是“有文必檔”的策略。如果系統使用單位不再采用其他文件檔案管理系統,那么鑒定這項檔案核心業務就不會提上議事日程。可以說,在大數據和區塊鏈的雙重夾擊下,檔案鑒定工作正面臨前所未有的挑戰。 7.4檔案部門集中管理文件檔案的中心地位受到沖擊 如果文件自創建之后起一直存放在原區塊鏈中,那么其管理和維護是去中心化的,主要依賴各網絡節點,并不需要檔案部門的參與。與此同時,一些社會機構借助于區塊鏈開展了存證、公證的服務,比如成立于2016年8月的全球首個商用電子存證區塊鏈聯盟“法鏈”,目前每天存入約80萬份來自第三方合同平臺“法大大”的電子合同、“阿里郵箱”的郵件等文件的簽署時間、簽署主體、哈希值等[26]。這些聯盟鏈及其背后機構正在成為新型文件檔案保存和服務者,檔案部門集中管理文件檔案的中心地位面臨進一步沖擊。 長期以來,檔案部門憑借公權信用,承擔重要憑證信息的集中保管和利用服務。婚姻登記、學籍學歷、工齡職稱、土地房產等民生檔案的查詢利用一直是檔案部門的特色服務。隨著電子政務的推進,許多憑證性材料正以數字形式產生,不少地方政府推出了以電子證照為代表的憑證文件共享服務,這些數字憑證共享服務系統中的信息是否歸檔以及如何歸檔尚未提上議事日程。2017年7月,廣東佛山禪城區發布全國首個區塊鏈政務應用[27],國外政府也正工商注冊、土地登記、基金分配等領域應用區塊鏈技術[28],政府內外多個機構參與建設。區塊鏈技術一旦推開,鏈上節點、第三方機構很有可能繼續瓜分文件檔案管理的地盤。 7.5國家和社會的信息資產和集體記憶面臨實存風險 區塊鏈只是底層技術,并不具備ERMS和電子檔案保存系統這兩類應用系統的完整功能,它在造成檔案部門專業職能弱化風險的同時,并不會承擔所有的文件檔案管理功能。而基于區塊鏈的業務系統通常不會考慮鑒定、遷移、格式轉換等其他重要的文件檔案管理功能,當軟硬件環境變更時,其中數據很可能面臨不可用的境地。如果我們意識不到這一點,從長遠來看,很可能導致業務系統和檔案管理雙輸的局面,最終受損的是國家和社會的信息資產與集體記憶。 8區塊鏈技術環境中文件檔案管理研究建議 區塊鏈技術受到日益廣泛的關注,也有炒作過熱的嫌疑。對于這樣一種不容忽視的外部存在,研究是采取有效應對措施的前提,就相關研究提出以下建議。 8.1加強區塊鏈技術的認識和研究 Victoria Louise Lemieux根據InterPARES項目“可信文件”的研究成果,即可信文件必須具備三個方面的特征:準確性、可靠性和真實性,且這些特性在長期保存中一直得以維護,將準確性、可靠性、真實性和持久性作為評估區塊鏈技術的指標。該研究認為,除了真實性之外,可信文件的其他質量要求都不能實現[29]。筆者認為,一方面,任何技術都不能完全防備文件形成者有意或無意地在內容上偏離客觀事實,ISO15489告訴我們,文件形成者而非形成技術要對文件本身的準確性、可靠性負責,所以區塊鏈在準確性、可靠性方面的不足是可以接受的,這正是管理需要發揮作用的地方。用評估整個文件檔案管理體系的指標來評估一項特定的技術固然有些不妥,但上述研究能讓我們清楚地看到區塊鏈技術環境下本專業的不可或缺。另一方面,區塊鏈技術正處于發展初期,在性能、隱私、安全、技術升級等方面面臨諸多挑戰[30],我們應關注并跟蹤其發展,并從文件檔案管理的角度提出完善建議,比如技術領域應當關注區塊鏈服務變更、鏈上文件讀取環境變化時區塊鏈數據的遷移問題。 8.2開展區塊鏈平臺下電子文件法律可采性研究 面對區塊鏈技術的發展,美國多個地方政府不約而同地首先對其法律條款進行修改,以體現對新技術、新事物和創新發展的接納和歡迎[31]。區塊鏈牽涉范圍廣,涉及多個方面的法律問題,其中在證據領域就面臨可采性問題,如智能合約是否屬于正式合同。文件檔案管理領域可就此提出專業化建議。 8.3加強區塊鏈解決方案的案例研究 隨著區塊鏈技術在應用領域的不斷探索,實踐部門的解決方案將成為學習和理解區塊鏈的生動素材,也是我們研究區塊鏈如何改變文件檔案管理的一手資料。當我們對區塊鏈下的文件檔案管理沒有太多思路的時候,收集、跟蹤并挖掘這些案例,分析不同方案中文件構成及其管理要點,是我們獲取理論和方法的重要源頭。 8.4開展區塊鏈環境下的文件檔案管理適用性和需求研究 雖然世界上已有檔案部門嘗試應用區塊鏈,但是對文件檔案管理是否適合采用這種技術,業界尚有爭論。比如美國伊利諾伊州的研究指出,使用區塊鏈管理公共文件有很多好處;但是佛蒙特州的區塊鏈研究小組認為,目前公共文件管理使用區塊鏈成本太高,收益很少[32]。那么,那些在區塊鏈中產生的業務文件,究竟該以何種方式歸檔管理呢?是繼續留在原環境中,將檔案部門這個傳統中心機構排除在外,還是需要走一條中心結構和新技術聯姻的新路?應如何利用區塊鏈底層技術實現更為完備的文件檔案管理功能?這是我們無法回避的問題。傳統數字環境下,ERMS功能需求規范在引導市場產品發展方面積累了富有成效的經驗。新的技術環境下,我們可在此基礎上,開展更有針對性的研究,推動基于區塊鏈的文件檔案管理專業系統的問世。 圍繞區塊鏈技術和應用,UBC建立了跨學科研究的虛擬社區Blockchain@UBC,包括計算機科學、商學、法學、檔案學在內的眾多學者展開了多個項目的研究。我國區塊鏈技術發展并不慢,有全球首個商用電子存證聯盟鏈、首個云平臺和區塊鏈結合的安鏈云,相關技術專家也在區塊鏈國際合作組織中擔任要職,希望我們在文件檔案管理研究方面也不落后。 |