基于區塊鏈的電子檔案系統(區塊鏈技術在檔案管理中應用路徑研究)
大家好,今天兌觀科技小編又為大家分享檔案管理干貨了,本篇分享主要內容為——區塊鏈技術在檔案管理中應用路徑研究。
研究背景
在國家層面,區塊鏈已被納入新型基礎設施(新基建)建設。區塊鏈技術的應用從金融領域迅速向房地產交易、政務服務、司法存證、版權保護等眾多領域擴展。
2019年,中石化開展了電子文件歸檔管理區塊鏈應用試點,拉開了實踐層面的探索序幕。中科院合肥分院、沈陽市檔案館等多家單位緊隨其后,開展了各有特色的應用。從2020年國家檔案局科技項目申報情況來看,涉及區塊鏈技術的推薦項目占信息化和現代化項目總數的24.4%。從立項情況看,涉及區塊鏈技術的立項項目共14項,占信息化與現代化項目立項總數的17.5%,占各類科技項目立項總數的11.7%。獲得立項的14個具體項目中,除了1個軟課題外,其余均聚焦具體的應用場景或系統建設。可以預計,檔案界的區塊鏈應用將在未來一段時間內迅速發展。
盡管檔案界對區塊鏈技術在檔案管理中的適用性與適用場景已做了不少的理論與實踐探索,但站在單個檔案部門的角度,在如何應用區塊鏈技術,如何將區塊鏈技術與現有管理體系、管理系統工具相結合等方面仍存在較為普遍的困惑。本文在對近年來國內外相關案例進行歸納和分析的基礎上,嘗試提出可能的應用路徑,為各單位選擇適用的區塊鏈應用方案提供一定的參考。
檔案部門應用區塊鏈技術的可能路徑
檔案部門并不必然使用區塊鏈技術,但必然要使用一定的技術來證明、提高其維護電子文件、電子檔案的能力,這種技術可能是區塊鏈,也可能是電子簽名、時間戳、數字摘要等其他技術。在若干技術中作出選擇的過程,也是考察技術本身的能力、成熟度、風險及適用性,以及各單位信息系統建設基本條件的過程。因此,檔案部門應用區塊鏈技術必須在知己知彼的基礎上作出選擇,其可能的應用路徑包括:明確應用意圖、選擇應用對象、選擇應用策略、審查應用環境、制定風險預案。
明確應用意圖
檔案部門使用區塊鏈技術必須先明確自己為什么要使用區塊鏈技術,要使用區塊鏈技術來解決什么問題。區塊鏈作為一種建立和提供信任的基礎設施,最本質的功能就是為應用者及其運用區塊鏈存儲和保管的數據(或數據憑證)增信。美國咨詢公司Gartner在歸納4類區塊鏈計劃時指出,應用區塊鏈技術的驅動因素包括促進共享、增加信任度、提高效率等。國內外多個檔案管理部門將區塊鏈應用在文件歸檔、移交接收、交換共享、保存維護等業務場景中。國家檔案局蔡盈芳處長結合電子檔案管理應用指出,區塊鏈技術在解決長期保存、降低管理成本、促進協同管理、促進共享利用等方面有應用價值。
中國信息通信研究院2018年發布白皮書指出,區塊鏈技術適用于“新型數據庫、多業務主體、彼此不信任、業務強相關”的場景,其中至少體現3個基本條件,即分布式環境、多主體交互、主體間信任度低。檔案部門作為傳統可信中心機構,并非工作在封閉系統中,而是需要和其他機構、人員發生頻繁的互動,在互動過程中很可能出現不信任、弱信任的情況。如檔案部門出具的檔案材料將面臨稅務系統、工商系統、司法系統等外部系統的檢閱,這些互動場景也是區塊鏈技術發揮作用的領域。
區塊鏈技術在檔案管理中所發揮的作用,有的是在應用前預設的,有的是在部署和應用過程中發現的。因此,檔案部門在應用區塊鏈技術解決其管理上的需求和痛點時,不需要在一開始求全求多,而應當找到最大的痛點,并能夠證明區塊鏈解決該痛點的優勢,同時在技術實施上具備可行性。
2.選擇應用對象
檔案部門在明確意圖的同時,應該選定應用區塊鏈技術管理的對象,即劃定需要通過區塊鏈管理的檔案范圍或類型。劃定的策略可能以文件類型為單位,也可能以現有管理系統為單位。
從文件類型來看,主要可以考量以下3種類型:需要跨機構形成或處理的文件,如與外部客戶簽訂的合同、招投標文件等;需要外部調用的文件,如上市公司財報、政府信息公開目錄中的文件,可能要接受外部審計、核查的會計檔案等;需要跨機構利用的文件,主要側重于憑證類文件,如電子發票、電子證照、電子學籍等。
從文件檔案的管理系統來看,實施區塊鏈技術的系統主要包括3種情形:一是檔案管理系統單獨實施區塊鏈技術,這種應用主要著眼于后端檔案管理和共享的需要;二是形成文件的業務系統(如財務系統、合同管理系統)和檔案管理系統共同部署區塊鏈解決方案。在這種情況下,業務系統中區塊鏈技術的應用隨著文件的形成而觸發,即文件一經形成即上鏈,或者說文件產生于鏈上,文件管理主體責任在歸檔交接時能夠通過區塊鏈驗證其真實性和完整性;三是繼承了檔案管理功能的業務系統(可以理解為文檔一體化管理系統)實施區塊鏈技術,國外多個土地管理系統即為此種應用。后兩種情況支持文件檔案的全程可信管理,受到較多的關注。
一般而言,考慮到系統運行速度、承載容量等因素,大部分文件,尤其是非結構化文件,不會對全文進行上鏈,而部分內容相對單一的半結構化文件,如土地契約等權證類文件,可以以結構化的形式進行全文上鏈,并且上鏈后的權證類文件可以與交易行為綁定,進而擁有資產屬性。
3.選擇應用策略
檔案部門根據自身的建設部署能力,在充分考量應用場景、建設運營成本、風險等因素的情況下,選擇適合的應用策略,至少包括以下3類:購買區塊鏈平臺服務、加入成熟的區塊鏈、自建區塊鏈。
(1)購買區塊鏈平臺服務
云計算的出現和發展衍生出基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)等新型技術服務模式。隨著越來越多的軟件廠商建立起區塊鏈技術平臺,提供一站式的應用平臺開發服務也產生了區塊鏈即服務(BaaS)的模式。用戶無須單獨購買硬件、開發平臺,只需選擇服務提供商,使用平臺中內嵌的共識機制,并配置所需的應用程序,即可實現管理意圖。服務提供商通常還提供分布式賬本治理的模板,為用戶開展鏈下節點治理提供參考依據。
直接購買區塊鏈平臺服務適合缺乏系統開發部署能力、應用對象或應用場景單一(如只用來管理電子合同或者電子發票)或業務規模有限的中小微企業。市面上已出現了許多服務平臺甚至最終產品,如東港瑞云與北京市經開區建立的區塊鏈電子檔案平臺,利用區塊鏈技術打通電子會計從憑證入賬到報銷歸檔過程中的關鍵環節,實現單套制歸檔,為中小微企業節省會計檔案管理成本。
(2)加入或部署到成熟的區塊鏈中
相比直接購買平臺服務,加入或部署到成熟的區塊鏈中可以更好地實現定制化、個性化需求,但要求機構自身具備一定的系統開發部署能力。根據部署方案,機構可以選擇加入聯盟鏈、部署到公鏈或部署到區塊鏈網絡中。加入或部署到成熟的區塊鏈以機構或聯盟為單位,加入或部署的實體通常為機構自建或購買的信息系統,以及已經建立的私有鏈或聯盟鏈。
①加入聯盟鏈(開放許可鏈)
從應用現狀來看,加入聯盟鏈(開放許可鏈)是國內采取較多的形式,其路徑為機構先取得聯盟內各主體的許可,再將系統部署到聯盟鏈中,成為其節點。聯盟鏈的建立通常是為了服務某一特定領域或達成某一特定目的,因此,選擇加入聯盟鏈的目的往往需要與聯盟鏈建立的特定目的相契合。
如北京互聯網法院建立“天平鏈”的目的主要是為了提升法官采信電子證據的效率,加入該聯盟鏈的各類組織、機構或服務平臺接入平臺的主要考量也是確保其電子文件作為電子證據的有效性,通過上鏈存證保障其文件的可信性及作為證據時驗證的高效性。為增加對聯盟鏈的了解,在全球范圍內,已有許多信息管理學院將實現聯盟鏈解決方案的開源項目HyperLedger Fabric納入其課程中。HyperLedger是Linux基金會發起的一個區塊鏈跨行業應用開源項目,關注區塊鏈開發開源標準、架構和工具,HyperLedger Fabric是HyperLedger的一個子項目。
聯盟鏈雖然應用較廣,技術與方案較為成熟,但其先建立信任合作,再進行系統建設或節點接入的模式與區塊鏈期望實現多主體間去信任協作的意圖或多或少有所出入。
②部署到公鏈中
在國外,一些項目實施者也將成熟的公鏈(如比特幣、以太坊)作為其選擇對象。以巴西土地登記系統為例,根據土地類型和用途,巴西土地的行政管理權分散在不同層級的政府機構中,一塊土地可能分別登記在由房地產登記辦公室管理的地籍數據庫和登記數據庫中,土地存在產權負擔(指土地所有人以外的人對于該土地所擁有的任何權利或利益,包括留置權、抵押、限制等)也無法查驗。這種缺乏整合和系統化的管理狀況使得腐敗逐漸滋生,大地主有時會通過賄賂土地登記辦公室把別人的土地登記在自己名下。
2017年,一家位于美國特拉華州的區塊鏈初創公司Ubitquity與巴西佩洛塔斯(Pelotas)和莫羅雷東多市(Morro Redondo)的房地產登記辦公室共同發起了一個區塊鏈項目,Ubitquity建立了一個前端網頁,可從房地產登記辦公室的系統中捕獲地產的登記號碼、所有者姓名、地產地址以及地產圖片、相冊和產權證書,前端網頁通過網頁服務器與后臺存儲器連接。Ubitquity的后臺存儲器管理著地產的圖像以及與地產有關的契約(PDF格式或其他系統支持的格式)。這些關于巴西公民的信息雖然由巴西當地的土地登記機構生成,但存儲在美國,由Ubitquity所有并負責運作。Ubitquity通過彩色幣(Colored Coins)協議把地產的詳細信息分散嵌入到比特幣區塊鏈中,使得土地和房地產登記在了一個透明的、不可更改的賬本上。
公鏈項目在性能、隱私、安全等方面還不能滿足大規模商用要求,激勵模型尚不成熟,尚難窺見其未來實現大規模應用的時間表,在國內的應用案例較為少見。
③部署到區塊鏈網絡中
隨著各類私有鏈、聯盟鏈、公有鏈及區塊鏈服務平臺的建立與應用,重復建設、跨鏈交互成為新的問題。2019年,國家信息中心牽頭搭建了名為區塊鏈服務網絡(Block-chain-based ServiceNetwork,BSN)的跨鏈基礎設施,旨在為中小微企業乃至個人提供一個低成本開發、部署、運維、互通和監管聯盟鏈應用的公共基礎設施網絡。BSN整合了云資源、底層框架、運行環境、密鑰管理、開發SDK和網關API等一站式區塊鏈部署和運行服務,開發者無須自建和維護系統環境,服務網絡由統一的運維中心平臺負責,從而實現節省區塊鏈部署與運維成本、降低應用開發門檻和提高參與便利程度、提供靈活接入方式及快速組網機制等優勢。目前,BSN已經適配或正在適配HyperLedger Fabric、FISCO BCOS等聯盟鏈及以太坊、EOS等公有鏈,讓開發者擁有更多選擇。
(3)自建區塊鏈
自建區塊鏈是成本最高但又最為靈活的方式,一般包含由單個主體建立的私有鏈與多個主體建立的聯盟鏈。
私有鏈適合于體量巨大、業務龐雜、內部協同頻繁的大型機構,如中石化將區塊鏈技術應用到電子文件管理實踐中探索,基于Fabric的聯盟鏈解決方案,在石化內部選取5個城市的分支機構作為節點,基于Fabric底層架構在企業內網中搭建了私有鏈,通過對文件的特征信息和相關元數據的哈希值上鏈,重點針對有跨機構調閱或者是跨機構形成的檔案進行上鏈存證和驗證。
如上文所述,聯盟鏈的建立通常是為了服務某一特定領域或達成某一特定目的,根據形成聯盟的不同場景,聯盟鏈的建設可以在以下幾類關聯方中發生:具有協同關系的機構或部門,如產業鏈的上下機構/業務流的上下部門,飛機制造中的電子檔案協作即是一例;具有信息共享關系的各個機構或部門,如跨境金融區塊鏈服務平臺應用區塊鏈技術管理出口報關單;具有特定出證/驗證需求的各個機構或部門,如需要提供民生檔案跨館出證的各個檔案館,需要出具電子學籍、電子成績單、畢業證書的各大高校,需要出具資格證書、執照的各類資質審批機構等。
4.審查應用環境
在選好應用策略及正式實施文件上鏈或系統建設與部署前,還需做好應用環境的審查工作。
一是對現有文件檔案管理政策及資源狀況進行審查,如文件歸檔范圍及保管期限表、文件的保密密級等。由于區塊鏈上的信息具有不可刪除的特性,在保管期限到期后必須刪除或最好刪除的文件(如可能會引起法律風險和審計風險的文件)檔案不宜上鏈,盡管實踐中可使用密碼學手段對信息進行永久性擦除,但隨著密碼學的發展,能否真正實現永久性擦除還有待驗證;又如信息上鏈意味著要將該信息對所有節點乃至外部世界公開,因而涉密信息不宜上鏈。此外,還需對機構外部的文件檔案政策進行審查,如果區塊鏈節點分散在其他國家和地區,還需遵從外部法規。
二是對上鏈的系統及管理措施進行審查。如加入聯盟鏈前,需取得加入聯盟鏈的實體資格并滿足文件上鏈或系統接入的技術標準。接入聯盟鏈的對象可能是電子文件管理系統(ERMS),也可能是數字檔案長期保存系統(TDR),還有可能是一條私鏈。無論接入實體是什么,都需要滿足系統安全性、電子數據合規性、區塊鏈安全性等方面的要求,即證明原系統具備維護文件上鏈前的真實性、安全性、可靠性等能力。北京互聯網法院為解決上鏈前數據的質量,出臺了《天平鏈應用接入管理規范》和《天平鏈應用接入技術規范》,前者規定了申請節點接入管理流程的具體內容,后者則規定了申請節點接入天平鏈的技術測評要求。
5.制定風險預案
鑒于區塊鏈技術目前仍處于發展態勢,部分使用問題可能尚未暴露,檔案部門在應用過程中應制定相應的風險預案,如聯盟鏈內各主體發生分歧造成區塊鏈分叉的風險、聯盟鏈運行不穩定遭遇解散的風險、區塊鏈技術本身存在的風險、應用區塊鏈的系統發生重要變更等。此外,在去中心化環境里,檔案保管權、所有權、利用權重新分配帶來的風險也需進入我們的視野。
在中心化的系統中,檔案的保管權、所有權、利用權都是高度集中的,而在完全去中心化的環境中,檔案的保管權、所有權和利用權可以被認為是分別控制在個體手中的。以電子病歷為例,傳統管理模式下,電子病例的保管權與事實上的利用權都掌握在醫院方。雖然國家衛健委公開表示電子病歷的所有權歸患者所有,即便隱去個人信息后形成海量大數據使用,也需要官方授權,但本質上個人仍缺乏對其個人健康數據的掌控力。
在理想的區塊鏈環境下,通過去中心化的網絡加密層,患者能夠通過密鑰實現對電子病歷的控制權,這意味著個體能夠成為電子病歷的潛在保管人,可以將個人健康數據保存在私人加密錢包中;個體能夠有選擇性地對利用電子病歷的行為進行授權,并可控制其顆粒度,如招聘時雇主要求提供身高、體重、血壓等數據,可以在不泄露其他健康數據的前提下,提供經院方體檢中心認證的個別健康數據;同時,還意味著個人可以通過交換個人健康數據獲得獎勵,即可以通過向研究機構出售電子病歷或其中部分信息獲利。
但事實上,現有區塊鏈應用并不能達到上述理想化的去中心化程度,保管權、所有權、利用權呈現的是更為復雜的狀態。現有的區塊鏈解決方案往往沒有內置分布式身份管理層將個人數字簽名與現實世界中的身份聯系起來,患者可以通過密鑰授權別人訪問其個人健康數據,卻沒有手段證明這份電子病歷確實是自己的。又如,醫院不愿讓渡電子病歷的控制權或不愿意接受其他醫院認證的電子病歷信息(如體檢結果)往往并非技術原因,這將對電子病歷的跨機構利用造成阻礙。
對于上述風險,應用方需要采取額外的管理手段和技術手段來加以應對。
小結
區塊鏈技術在檔案管理領域中的應用會越來越多,本文總結的應用路徑可能存在不全面、不準確的情況,相信日益夯實的創新實踐會不斷對之加以修正和完善。面對這樣的應用趨勢,區塊鏈技術在檔案管理中規范化應用也應提到議事日程上來。