近年來,政府數據開放成為政府信息化領域的熱門話題,我國很多地方也已經建成或正在積極建設政府數據開放平臺。政府數據開放是政府數據資源內部生成、協同共享和開放利用的過程。推進政府數據開放,是全面推進政務公開,打造廉潔政府、創新政府和服務型政府,增強“互聯網+”政務服務能力的重要途徑。當前,我國政府數據開放工作還面臨一些問題、存在一些挑戰。
數據基礎不牢,缺乏高質量的政府數據體系
政府數據開放平臺中的數據格式多樣,既有機器可處理的格式,也有非機讀格式,格式多樣使得相關人員在處理數據前需要耗費大量的精力進行格式轉換。在數據平臺上以非標準化的方式發布政府數據,會導致政府各平臺數據不兼容,容易產生“數據孤島”,給政府數據關聯帶來難度,使語義、標準等方面存在很大的異質性,從而降低政府數據的利用率。
數據質量包括用戶對數據是否滿足其需求的主觀感知、數據本身及數據活動過程等。根據相關調查表明,很多政府機構認為,他們提供的卓越用戶體驗能力是被不準確的數據削弱的。如果政府數據本身質量低,會嚴重影響決策和政策制定過程,導致數據分析結 果不準確。從主觀方面來說,用戶自身及其數據利用類型決定著數據質量。對于數據利用者來說,如果政府數據沒有良好的質量,不但會增加對政府數據分析的投入,還會影響數據集的再利用過程,導致政府數據難以得到充分利用,甚至會影響政府公信力。
在全世界范圍內,政府數據開放面臨的一個首要問題就是元數據(中介數據)質量問題。一方面,收集、處理元數據能夠提升數據的適用性。但在數據平臺上,元數據體系的缺乏會增加公眾發現和理解數據集的難度。而通過元數據收集和處理開放數據,則易于提升政府數據的利用率。另一方面,較高質量的元數據能夠拓寬數據的獲取渠道。但如果數據標準不一致,對數據的描述不夠準確、完整,就無法達到數據開放的目的。因此,在政府數據開放過程中,我們需要引入公共政策理論、法律法規來規范、約束政府數據開放過程,解決政府數據基礎不牢,數據質量低的問題。
優化數據管理,確保政府數據的真實性、時效性
政府數據開放要求明確數據的出處:由誰創建或生成、數據來源于何處,要求政府部門必須對其生產和收集的數據負責。因此,政府數據生產、開放重在規范數據的采集、存儲、利用和傳播環節,數據內容管理重在確保數據的準確性、一致性和時效性。在數據生產和收集階段,要實現跨部門、跨機構的數據整合與分析,從源頭上保證數據質量,解決數據生產和收集部門的工作難度。同時,應解決數據出處不明確、產權歸屬不清晰等問題,提升發布或共享的數據質量,及時更新、修改生成的數據,盡量避免政府部門橫向、縱向數據匯集產生 不同程度的交叉重復。另外,還應明確政府數據分類標準,不斷更新清理數據,對有效數據歸檔存儲、過期失效數據標示清楚。
政府數據應由政府統一發布、管理,按照數據類型統一數據口徑,確保數據的一致性、真實性,并采用優化統計方法、監控數據質量等方式提升數據質量。同時,政府部門內部應進行數據一致性分析與梳理,在技術上統一數據采集和共享發布平臺,拓展數據傳播和利用渠道,制定各類數據發布、數據更新標準。另外,必須要遵循數據標準規范,減少數據格式轉換,促進各業務部門、技術機構統一理解和規劃政府數據資源,保證高效共享。
目前,為了滿足用戶數據需求,發達國家在中央政府和地方政府間,普遍建立了政府數據集中管理和整合利用模式,通過多種途徑整合前后臺數據資源,并以集中的方式提供給用戶,實現跨區域、跨平臺的數據服務。我國在頂層設計、利用流程管理、資產化管理等方面,需要進行前瞻性戰略布局,建立相應的政策法規體系、統一的政府數據共享開放平臺,大力增進行業與行業之間、地區與地區之間數據資源的交流和互動。同時應由相關單位協調提供相應的技術服務,借助數據共享交換平臺,強化政府數據社會化利用的收費規定,明確政府數據的使用是否收費、如何收費等問題。
注重數據安全和隱私問題,加強知識產權保護力度
數據安全問題。數據具有開放性、關聯性等特征,在大數據時代,數據安全屬于非傳統安全。因此,政府數據開放應高度重視數據安全。當前,世界各國都非常注重數據安全和隱私問題。如美歐一些國家資助大數據安全技術研發項目,借助互聯網手段和信息技術對數據情報進行監控。相較之下,我國對數據非傳統安全的重視程度還不夠高。因此,在數據跨國流通中,我們應注重數據安全,妥善解決數據安全問題,降低國家安全威脅。比如,包括云服務提供商在內的第三方托管政府數據時,要控制數據安全的輻射面,強化數據主權意識。
個人隱私保護問題。目前,個人數據正在成為一種新的資產,在大數據環境下,政府能夠收集不同類型的個人數據。但同時,政府采用數據挖掘技術大規模地實施數據開發利用,極有可能會威脅到個人隱私,增加個人信息泄露的可能性。在數據聚合過程中,通過不同數據集屬性的組合、抽取等途徑,還可能使個人數據面臨安全風險,即使數據在發布前匿名化,也可能導致敏感數據的產生。另外,目前隨著新媒體時代的來臨,人們每次信息活動都會留下數字痕跡,個別科技公司濫用社交媒體上的個人數據,導致個人隱私嚴重泄漏。目前,在個人信息保護上,我國相關規定分散于各種法律法規中,還沒有獨立完整的數據保護法。因此,應從法律層面上規定、明確個人數據分類標準,并將個人信息保護納入相關法律法規。
知識產權問題。數據開放許可是政府數據開放的一項重要原則,而數據共享造成的產權不清,則會阻礙數據的發布和共享過程。同時,數據知識產權可能會在未經明確許可的情況下,限制第三方重新利用數據。因此,只有在政府數據受版權保護的情況下,才能允許公眾獲取、重用和傳播數據。如,歐盟委員會鼓勵“使用開放許可,最終應成為整個歐盟的管理”,并發布了推薦許可的指南。目前,我國政策對數據知識產權的規定不多,政府數據開放許可的實施具有一定的難度。在制度層面上,部門信息資源的所有權尚不明確,數據管理權、使用權以及信息共享的責任主體尚未理清。政府數據開放網站的許可協議應用情況也存在一些問題,采用許可的平臺規定還不夠詳細,一定程度上限制了政府數據的利用和再分配,這些情況都是亟需解決的重要問題。