《復旦大學:2019年下半年地方政府數據開放報告(54頁).pdf》由會員分享,可在線閱讀,更多相關《復旦大學:2019年下半年地方政府數據開放報告(54頁).pdf(54頁珍藏版)》請在三個皮匠報告上搜索。
1、1 2 3 引言 數林概貌 數林指數 數林近觀 數林建言 評估方法 附錄 004 008 012 023 038 041 050 4 5 6 中國地方政府數據開放報告和“中國開放數林指數”是我國首個專注于評估政府數據開放水平的專業報 告和指數,由復旦大學數字與移動治理實驗室制作出品,由復旦大學和國家信息中心數字中國研究院聯合發布。 “開放數林”意喻我國政府數據開放利用的生態體系。開放數據,蔚然成林,一棵棵地方開放“數木”由最 初的叢然并生、成蔭如蓋,直至枝繁葉茂、花開結果,終將成長為一片繁盛多樣、枝杈相連、持續循環的中國“開 放數林”。 引 言 7 “中國開放數林指數”自 2017 年 5 月
2、首次發布以來,每半年發布一次,定期對我國地方政府數據開放水平 進行綜合評價, 精心測量各地 “開放數木” 的繁茂程度和果實價值, 助推我國政府數據開放生態體系的建設與發展。 2018 年以來,“中國開放數林指數”為國家互聯網信息辦公室信息化發展局監測我國公共信息資源開放情況提 供數據支撐。 8 9 1.1 總體態勢 截至 2019 年 10 月,我國已有 102 個省級、副省級和地級政府上線了數據開放平臺,平臺總數首次超過 100 個。與 2019 年上半年相比,新增 20 個地方平臺。 目前, 我國51.61%的省級行政區、 66.67%的副省級和24.21%的地級行政區已推出了政府數據開放
3、平臺。 地級以上平臺數量逐年翻番,從 2017 年的 20 個,到 2018 年的 56 個,再到 2019 年的 102 個,“開放數據, 蔚然成林”已從愿景成為現實,政府數據開放平臺已日漸成為一個地方數字政府建設的“標配”。 東南沿海地區的省級平臺已逐漸相連成片,并向內陸地區不斷擴散。廣東省和山東省內的各地市都已推出 了數據開放平臺,形成我國最為密集的省級“開放數林”。在長三角地區的江蘇、安徽、浙江和西南地區的貴州 和四川,地級平臺不斷上線并相連成片,已形成長三角和西南地區的“開放數林”。 指數分值較高的地方主要集中在東南部沿海地區,與此同時,位于西部和東北部地區的貴州省、貴陽市、 哈爾濱
4、市、成都市、銀川市也表現優秀,成為所在地區的優質“數木”。 在準備度、平臺層和數據層等維度上,全國整體表現與上半年相比均有進步,但在利用層上各地仍有很大 提升空間。 在 2019 年下半年的開放數林指數省級排名中,上海和浙江的綜合表現最優,廣東總體進步幅度最大。在 地級(含副省級)排名中,貴陽、深圳、哈爾濱和濟南綜合表現最優,福州市在半年來新上線平臺的地方中總體 表現最佳。在四個單項維度上,在全國所有 102 個地方中,上海在準備度上排名第一,浙江在數據層上排名全 國第一,深圳在平臺層和利用層上排名全國第一。 1.2 數根:準備度 在法規與政策上,上海出臺了我國首部專門針對數據開放的地方政府規
5、章,另有八個地方出臺了專門針對 數據開放的規范性文件。 在組織和執行上,各地陸續組建了專門的政府數據管理部門,其中,超七成地方的政府數據管理部門是省 一、數林概貌 10 (市)政府的組成部門、工作部門或政府辦公廳(室)管理的行政機構,數據開放工作的組織基礎進一步穩固。 但僅有 4 個地方的黨政主要領導在公開講話中明確要求推進政府數據開放,地方黨政領導對數據開放的重視力 度有待進一步加強。 在標準規范上,只有廣東、山東、上海制定了專門針對數據開放的地方標準,僅上海市連續制定和公布了 專門針對政府數據開放的年度工作計劃。 1.3 數干:平臺層 在數據發現上,只有不足兩成的平臺能從用戶視角出發,按用
6、戶使用場景和標簽分類提供數據導引,幫助 用戶迅速發現其需要的數據。 在數據獲取上,僅有不到四分之一的地方平臺提供了開放數據目錄。超過七成的地方平臺要求用戶注冊登 陸后才能獲取無條件類開放數據,提高了獲取無條件類數據的門檻。僅有五個地方平臺開通了可申請有條件類 開放數據的功能。雖然有近六成的地方平臺提供了對未開放數據提交請求的功能,但僅有不足一成的地方平臺 公開了用戶的數據請求和平臺的回復。 在利用成果上,超過七成的平臺未標明利用成果來源。 在互動反饋上,只有約一成地方平臺提供了數據發布者聯系方式。雖然超過七成的地方平臺開通了意見建 議和數據糾錯功能,但對用戶的意見建議和數據糾錯進行及時有效回復
7、的地方分別僅占 8% 和 2.3%,僅有深圳 和東莞的數據開放平臺能對用戶提出的數據糾錯信息進行及時回復。 在賬戶體驗上,超過五成地方平臺的注冊過程較為繁瑣,要求用戶提供的個人信息較多。 1.4 數葉:數據層 在開放數據總量上,全國開放數據集總量從 2019 上半年的 62801 個增長到 71092 個,增幅一成多。開 放數據集的容量與 2019 上半年相比,增幅約 27%。 各地平臺在數據數量上差異顯著,超三成的地方平臺上開放的數據集總量超過了一千個,有一成多的平臺 上開放的數據容量超過 1 億,但仍有近兩成的平臺上開放的數據容量在 10 萬及以下。 11 在開放數據質量上,約 35% 的
8、地方平臺提供了優質數據集,但優質 API 接口仍屈指可數,各地提供的 API 接口普遍存在調用難度高,能調取到的數據容量小、更新頻率低等問題。 在開放數據標準上,開放授權協議仍未得到足夠重視,超四成的地方平臺缺少專門的數據開放授權協議, 僅有 26% 的地方平臺在提供的授權協議中明確授予了用戶免費獲取、不受歧視、自由利用、自由傳播和分享數 據的權利。不到兩成的地方平臺為數據集標示了多種開放類型,例如普遍開放和有條件開放類。只有不到兩成的 地方平臺上開放的數據集全部符合非專屬格式的標準。 在開放數據覆蓋面上,只有不到一成的地方平臺開放的數據集覆蓋了所有重要主題,只有不到一成的地方 平臺上開放了所
9、有的常見數據集。來自市場監管部門的數據集總數最多,首次超過統計部門。 在開放數據持續性上,能持續新增數據和保持動態更新的地方平臺仍然偏少,只有不足一成的地方平臺能 在近兩年半以來的每個季度都持續上線新增數據集。在 2019 年第二、三季度內,近四成的地方沒有更新數據集。 1.5 數果:利用層 在促進數據利用上,有一成多的地方舉辦過類似開放數據創新利用比賽,但只有上海市和北京市兩個地方 連續舉辦。 在利用成果產出上,各地平臺上展示的利用成果數量少,類型單一,覆蓋面小,質量不高,僅在 5.62% 的平臺上發現了少量的利用開放數據產生的有效服務應用,主要關于交通出行、教育科技、衛生健康和城建住房 等
10、主題。近七成的平臺展示的是由政府部門自身開發,而不是社會利用政府開放的數據所產生的應用。 在數據利用上,目前被利用的數據集數量較少,主要來自交通運輸、統計、教育、市場監管、人力資源與 社會保障、農業農村、公安、衛生健康和文化旅游等 9 類政府部門。近九成的地方平臺展示的利用成果未標注 開放數據來源,即使在標注了數據來源的地方平臺上,也普遍存在數據鏈接無效、數據搜索不到或數據不完整等 情況。 12 13 表 1-1 省級準備度排名 2.1 準備度指數 各地在準備度上的指數分值與排名如表 1-1、表 1-2 所示,在省級行政區中,上海、貴州和北京名列前三, 在地級 (含副省級) 地方中, 貴陽、
11、連云港和濟南名列前三。 上海在所有地方的準備度排名中位列第一。 近半年來, 北京、連云港、南京等地在準備度上的進步幅度最大。 二、數林指數 14 表 1-2 地級(含副省級)準備度前五十強 15 2.2 平臺層指數 各地在平臺層上的指數分值與排名如表 2-1、表 2-2 所示,在省級行政區中,浙江、上海和廣東名列前三, 在地級(含副省級)地方中,深圳、貴陽和哈爾濱名列前三。深圳在平臺層總排名中位列第一。 表 2-1 省級平臺層排名 16 表 2-2 地級(含副省級)平臺層前五十強 17 2.3 數據層指數 各地在數據層上的指數分值與排名如表 3-1、表 3-2 所示,在省級行政區中,浙江、廣東
12、和山東名列前三, 在地級(含副省級)地方中,貴陽、廣州和東莞名列前三。浙江在數據層總排名中位列第一。近半年來,廣東省 在數據層上進步迅猛。 表 3-1 省級數據層排名 18 表 3-2 地級(含副省級)數據層前五十強 19 2.4 利用層指數 各地在利用層上的指數分值與排名如表4-1、 表4-2, 在省級行政區中, 北京、 貴州和上海名列前三, 在地級 (含 副省級)地方中,深圳、貴陽和濰坊名列前三。深圳在利用層總排名中位列第一。 表 4-1 省級利用層排名 20 表 4-2 地級(含副省級)利用層前五十強 21 2.5 綜合指數 省級與地級(含副省級)開放數林綜合指數的分值、排名與等級如表
13、5-1、表 5-2 所示。在 2019 年下半年 的省級排名中,上海和浙江的綜合表現最優,進入第一等級“五棵數”。貴州、北京和廣東也總體表現優秀,進 入第二等級“四棵數”。近半年來,廣東綜合指數進步幅度最大。 在 2019 年下半年的地級(含副省級)排名中,貴陽、深圳、哈爾濱和濟南綜合表現最優,進入第一等級“五 棵數”。福州市在半年來新上線平臺的地方中綜合指數表現最佳。 在四個單項維度上,在全國所有 102 個地方中,上海在準備度上排名第一,浙江在數據層上排名全國第一, 深圳在平臺層和利用層上排名全國第一。 表 5-1 省級綜合排名 22 表 5-2 地級(含副省級)綜合排名 23 24 3.
14、1 時間分布 截至 2019 年下半年,我國已有 102 個省級、副省級和地級政府數據開放平臺上線(如圖 1 所示),平臺總 數首次超過 100 個。與 2018 年報告同期相比,增長接近一倍,與 2019 年上半年相比,新增了 3 個省級平臺 和 17 個地級(含副省級)平臺。各地平臺上線時間如表 6 所示。 三、數林近觀 圖 1 歷年地方平臺總數 25 表 6 各地平臺上線時間一覽表 26 3.2 空間分布 截至 2019 年 10 月底,全國各地上線的省級政府數據開放平臺的地區分布如圖 2 所示,副省級和地級政府 數據開放平臺的地區分布如圖 3 所示,顏色越深代表平臺上線時間越早。從整體
15、上看,我國地方政府數據開放 平臺的擴散呈現出從東南沿海地區向內陸地區不斷發展的趨勢,東南沿海地區的省級平臺已經逐漸相連成片。 廣東和山東省內的各地市都推出了數據開放平臺,形成我國最為密集的省級“開放數林”。 在長三角地區的 江蘇、安徽、浙江和西南地區的貴州和四川,地級平臺不斷上線并相連成片,已形成長三角和西南地區的“開放 數林”。相比之下,有些上線數據開放平臺的地方則在其所處地區成為孤獨的“綠洲”,在其四周均未上線平臺。 圖 2 各地平臺上線時間的地理空間分布(省級) 27 從省級地方指數分值的空間分布情況來看(圖 4),目前分值較高(在圖中顏色較深)的省份主要集中在東 部沿海,但西部的貴州省
16、也表現優異。 圖 3 各地平臺上線時間的地理空間分布(副省級和地級) 28 圖 4 開放數林指數空間分布(省級平臺) 從地級(含副省級)的空間分布來看(圖 5),目前分值較高(在圖中顏色較深)的地市主要集中在山東省 和廣東省等沿海地區,但貴陽市、哈爾濱市、成都市、銀川市等位于中西部和東北部地區的城市也表現搶眼。 29 圖 5 開放數林指數空間分布(副省級、地級平臺) 30 圖 6 82 個地方指數分值與排名變化分析 3.3 長勢分析 報告對 2019 上半年評估報告中的 82 個地方半年以來的指數分值和排名變化情況進行了分析。圖 6 中的橫 坐標代表這 82 個地方 2019 下半年的指數分值
17、,縱坐標代表這些地方與 2019 上半年相比的名次變化情況,正 數表示名次上升位數,負數表示下降位數。2019 下半年新上線平臺的地方,由于缺少上半年的指數分值和名次 可做對比,故未在圖中出現。 圖中用排名不變(即為 0)與指數均值作為兩條分界線,將各地分為四種類型。右上方的區域為“竹林”, 表現為指數分值較高且進步迅速,如廣東和深圳等地;右下方的區域為“喬木林”,表現為指數分值穩定或小幅 下降,但仍維持在較高水平,如貴陽、浙江、貴州等地;左上方的區域為“藤蔓”,表現為指數分值不高但進步 較塊,如陽江、南京等地;左下方的區域為“灌木叢”,表現為指數分值下滑且指數處于中下水平,目前有大量 地方處
18、于該區域。 31 3.4 法規與政策的文本效力 與數據開放相關的法規與政策的等級直接決定了其約束力的強弱。報告將各地有關政府數據開放的法規與政 策的等級從高到低劃分為地方性法規、地方政府規章、一般規范性文件、部門規范性文件四級。目前,我國還沒 有地方出臺了專門針對數據開放的地方性法規,但已有少量地方以政府令的形式發布了與政府數據開放相關的地 方政府規章,或制定了相關的一般規范性文件和部門規范性文件。 專門性是指法規與政策是否專門為政府數據開放而制定,這也是衡量其效力的重要指標。目前,我國大多數 地方尚未出臺專門針對數據開放的地方性法規、地方政府規章或規范性文件,已出臺的法規與政策在內容上主要
19、分為五類:專門針對數據開放、針對公共數據資源共享和開放、針對公共數據資源管理或大數據發展應用促進以 及針對公共數據和一網通辦(或電子政務)管理。 各地出臺的專門針對數據開放的法規與政策的效力等級分布情況如表 7 所示。 表 7 各地法規與政策的效力等級分布 32 3.5 標準規范 標準規范是為了在一定的范圍內獲得最佳秩序,經協商一致制定并由公認機構批準,共同使用的和重復使用 的一種規范性文件。制定開放數據標準和規范指南,有利于數據開放工作的標準化和規范化實施。目前只有廣東、 山東、上海制定了專門針對數據開放的標準規范。 3.6 數據集總量 數據集是指由數據組成的集合,通常以表格形式出現,每一“
20、列”代表一個特定變量,每一“行”則對應一 個樣本單位。政府數據開放平臺通常以下載或 API 接口的方式提供數據集,數據集總量統計的是平臺上可通過 下載或 API 接口獲取的數據集總數。 截至 2019 下半年,全國的開放數據集總量為 71092 個,相比 2019 上半年,增長約 13%(如圖 7 所示)。 表 8 各地專門針對數據開放的標準規范 33 3.7 數據容量 數據容量是指將一個地方平臺中可下載的、結構化的、各個時間批次的數據集的字段數(列數)乘以條數(行 數)后得出的數據總量。數據容量體現的是平臺上開放的可下載數據集的數據量大小。相比上半年,2019 年下 半年全國開放數據集的總容
21、量增幅約 27%(如圖 8 所示)。 圖 7 全國開放的數據集總數 圖 8 全國開放的總數據容量(單位:萬) 34 3.8 優質數據 數據容量大、社會需求高的優質數據集是開放數據的重點。報告對國內各地平臺上所有可下載的數據集(共 約 54067 個)按照數據容量進行排序,在數據容量相同的情況下再按照下載量排序,最終選出排名居于前 1% 的數據集作為優質數據集(共約 540 個)。優質數據集數量前十的地區如圖 9 所示。 圖 9 國內各地平臺優質數據集數量(前十名) 表 9 是排在前十位的優質數據集列表,這些數據集普遍具有較高的條數、字段數和下載量,內容主要涉及商 事主體、司法、氣象、藥品和道路
22、等方面。 35 3.9 主題覆蓋面 開放多個主題領域的數據集有利于提高數據開放的廣度和覆蓋面,也有利于數據利用者獲取來自多個領域的 數據集進行融合利用。圖 10 展現了各地開放數據集的主題分布情況。其中,社保就業主題遙遙領先,在該主題 下開放的數據集在總數上是排在第二位的教育科技主題的兩倍多。 表 9 前十位優質數據集列表 圖 10 開放數據集主題分布 36 3.10 部門覆蓋面 開放數據的部門覆蓋面反映了各個政府部門開放數據的參與程度,也體現了數據集來源的豐富程度。由于不 同地方相同職能的政府部門在名稱上存在差異,報告對這些部門的名稱做了相應的合并與調整。各地平臺上開放 的數據集的部門分布情
23、況如圖 11。目前,來自市場監管(包括工商、質監、食藥監)部門的數據集總數最多, 首次超過了統計部門。 與統計部門提供的經過加工歸總后的宏觀統計數據相比, 業務部門提供的數據更具原始性, 容量更大, 再利用價值也更高, 應成為數據開放的主力部門。 此外, 住房和城鄉建設、 教育、 文化旅游、 農業農村、 衛生健康等部門也開放了較多的數據集。 圖 11 開放數據集的部門分布 37 3.11 利用促進 利用促進是指政府為了推動開放數據的社會化利用而組織的各類活動。開展開放數據利用促進活動有利于提 升社會利用政府數據的積極性和創造力,也有助于政府部門更好地了解社會的數據需求,開放更多的優質數據, 從
24、而通過促進數據提供者與數據利用者之間的雙向互動,營造有利于政府數據開放利用的生態體系和社會氛圍。 組織開放數據創新利用比賽是一種常見的利用促進活動,各地自 2017 年以來舉辦的部分開放數據創新利用 比賽如表 10 所示。 表 10 各地舉辦開放數據創新利用比賽一覽表 38 39 政策供給與組織保障 在法規與政策方面,制定與政府數據開放相關的地方性法規、地方政府規章或規范性文件,并對開放數據的 范圍、 開放數據質量、 開放方式中的分級分類開放、 利用促進、 安全保護、 保障機制等方面做出明確的規定和要求。 在組織與執行方面,提升政府數據開放主管部門的層級,制定和公開專門針對數據開放的工作計劃,
25、地方黨 政主要領導應提高對數據開放的重視程度,更多公開表態推進政府數據開放工作。 在標準與規范方面,制定有關數據開放的標準規范。 平臺優化與持續運營 在數據發現方面,注重及時更新數據動態,提供按照用戶使用場景和標簽分類進行數據導引的方式,利用多 種篩選條件提供和強化高級檢索功能。 在數據獲取方面,提供可下載的開放數據目錄,實現開放數據的分級分類獲取,公開用戶對未開放數據的請 求并提供及時優質的回復,對有條件開放類數據開通提交申請的入口。 在工具提供方面,結合平臺數據資源提供多樣且實用的分析工具。 在利用展示方面,開通多種利用成果的提交和展示功能,并提供利用成果來源信息。 在互動反饋方面,提供數
26、據發布者聯系方式和智能客服,公開用戶的評價、意見建議和糾錯信息,并提供及 時優質的回復。 在公眾傳播方面,加大數據開放工作的宣傳力度,探索新媒體等傳播渠道。 在賬戶體驗方面,提供自然人和法人分類注冊功能,并提升賬戶注冊的便捷程度。 總體上,保障平臺的持續性運營,使其成為政府數據管理部門的一項常態化工作,以支撐與用戶之間的日常 互動反饋和數據供需對接。 四、數林建言 40 數量提升與質量保證 在數據數量方面,注重提升數據集的容量。 在數據質量方面,開放更多高容量、高需求的優質數據集,同時減少碎片化和低容量的低質數據集,剔除無 效數據集;增加以 API 接口形式開放的實時動態的、大容量的數據集,清
27、理碎片化 API 接口、限制型 API 接口 和無效 API 接口。 在數據標準方面,制定和完善開放授權協議,對用戶免費獲取、不受歧視獲取、自由利用、自由傳播與分享 開放數據的權利進行明確授權,對不同類型的數據集分級分類制定開放授權協議。提高非專屬格式、RDF 格式 開放數據的比例,降低申請 API 接口的難度。推進數據的分級分類開放,對數據集標示其開放類型,如無條件 開放或有條件開放等;為 API 接口提供更加詳實的調用說明或操作指南,幫助用戶理解、獲取和利用數據。 在數據覆蓋面方面,鼓勵和吸引更多的部門參與到數據開放工作中來,豐富數據內容的多樣性,不斷提高開 放數據集的主題覆蓋面和部門覆蓋
28、面,開放更多常見數據集。 在數據持續性方面,提高開放數據集的持續增長和動態更新。 數據利用與生態培育 在促進開放數據利用方面 , 持續開展開放數據創新利用比賽等活動 , 以提升社會對政府數據開放工作的知曉 度,提高社會利用政府開放數據的積極性 , 營造有利于政府數據開放利用的生態體系。 在成果產出方面 , 亟需提升有效數據利用成果的類型、數量和主題覆蓋面,清理政府自身開發的應用 , 剔除 無法獲取或正常使用的應用 , 為數據利用成果標明數據來源并提供數據集鏈接。 在數據利用方面 , 鼓勵引導多種類型的數據利用者對政府開放數據進行增值利用,提升被利用數據集的數量、 容量、主題覆蓋面和部門覆蓋面。
29、在開放優質、高價值政府數據的基礎上,進一步推動數據利用。 41 42 5.1 評估指標體系 指數出品方邀請國內外政界、學術界、產業界共七十余位專家共同參與,組成“中國開放數林指數”評估專 家委員會,體現了跨界、多學科、第三方的專業視角。專家委員會基于數據開放的基本原則,借鑒國際數據開放 評估報告指標體系的經驗,立足我國政府數據開放的政策要求與實踐現狀,構建起一個系統、科學、可操作的中 國地方政府數據開放評估指標體系,并為每項指標分配了權重(見圖 12)。 五、 評估方法 圖 12 評估指標體系構建方法 43 評估指標體系共包括準備度、平臺層、數據層、利用層四個維度及下屬多級指標(見圖 13-1
30、、圖 13-2): 準備度是“數根”,是數據開放的基礎,包括法規與政策、組織與執行、標準規范等三個一級指標。 平臺層是“數干”,是政府開放數據和用戶獲取數據的載體,是展示利用成果的中心,也是連接數據開放供 給側和需求端的橋梁,包括數據發現、數據獲取、工具提供、利用展示、互動反饋、公眾傳播和賬戶體驗等七個 一級指標。 數據層是“數葉”,是數據開放的核心,包括數據數量、數據質量、數據標準、數據覆蓋面、數據持續性等 五個一級指標。 利用層是“數果”,是數據開放的成果,旨在促進政府數據開放后的社會化利用,包括利用促進、成果產出 和數據利用等三個一級指標。 44 圖 13-1 中國開放數林指數評估指標體
31、系 45 圖 13-2 中國開放數林指數評估指標體系 46 5.2 評估范圍 指數出品方根據公開報道,以及使用“數據開放”“數據公開”“公共數據”“政務數據”“政府 數據”“地名數據”“地名政府數據”“地名開放數據”等關鍵詞進行搜索,發現了截至 2019 年 10 月 31 日,我國已上線的地方政府數據開放平臺,并從中篩選出符合以下條件的平臺: 1、原則上平臺域名中需出現 ,作為確定其為政府官方認可的數據開放平臺的依據。 2、平臺所代表的地方政府的行政級別為地級及以上。因行政區劃調整,原山東省萊蕪市已于 2019 年 1 月 整體并入山東省濟南市。 3、平臺形式為“集中專有式”或“集中嵌入式”
32、?!凹袑S惺健笔侵搁_放數據集中匯聚在一個專門的平 臺上進行開放;“集中嵌入式”是指開放數據統一匯聚為一個欄目版塊,嵌入在政府門戶網站或政務服務網站上。 各個條線部門建設的非集中式開放數據的平臺不在指數的評估范圍內。 本次評估中,指數出品方共發現符合條件的地方平臺 102 個,其中省級平臺 16 個,地級(含副省級)平臺 86 個,將上線了這些平臺的地方作為本次評估的對象。具體地方、平臺名稱和平臺域名如表 11 所示。 表 11 評估范圍(按行政層級及拼音首字母排序) 47 48 5.3 數據采集與分析方法 準備度評估主要對相關法律法規、政策、意見、計劃、標準規范、新聞報道等資料進行了描述性統
33、計分析和 文本分析。搜索方法主要包括以下兩種:一是在百度搜索引擎以關鍵詞檢索相關法規與政策文本、年度工作計劃、 有關地方黨政領導講話支持的新聞報道以及數據開放主管部門的信息;二是在地方政府門戶網站以及政府數據開 放平臺上通過人工觀察和關鍵詞檢索采集數據。指數出品方對法律法規與政策的篩選標準為至少有一節專門針對 政府數據開放的內容;對標準規范的篩選標準為有關政府數據開放的地方性標準,行業性的標準規范未納入本次 評估范圍。數據采集截止時間為 2019 年 11 月 15 日。 49 平臺層評估主要采用人工觀察法對各地方政府數據平臺上各項功能進行觀測并做描述性統計分析,數據采集 截止時間為2019年
34、10月31日。 同時, 指數出品方還對平臺的回復情況 (包括回復時間和回復質量) 進行了評估, 回復情況采集截止時間為 2019 年 10 月 31 日。 數據層評估主要通過機器自動抓取各地平臺上開放的數據結合人工觀察采集相關信息,然后對數據進行了描 述性統計分析、交叉分析、文本分析和空間分析。數據采集截止時間為 2019 年 10 月 31 日,對“動態更新” 這一指標的評測時段為 2019 年 4 月 1 日至 2019 年 9 月 30 日兩個季度。 利用層評估主要對各地政府數據開放平臺上展示的利用成果進行了人工觀察和測試,對 2017 年以來各地開 展的開放數據創新利用比賽信息進行了網
35、絡檢索,并對采集到的數據進行了描述性統計分析。數據采集截止時間 為 2019 年 10 月 31 日。 5.4 指標計算方法 指數出品方基于各地在各項評估指標上的實際表現從低到高按照 0-5 分共 6 檔分值進行評分,其中 5 分為 最高分,相應數據缺失或完全不符合標準則分值為 0。對于連續型統計數值類數據則使用極差歸一法將各地統計 數據結果換算為 0-5 之分間的數值作為該項得分。 各地平臺在準備度、平臺層、數據層、利用層四個維度上的指數總分等于每個單項指標的分值乘以相應權重 所得到的加權總和。最終,各地開放數林指數等于準備度指數、平臺層指數、數據層指數、利用層指數乘以相應 權重的加權平均分。各地開放數林指數計算公式如下: 各地開放數林指數 50 51 指數出品團隊 觀察員 鄭磊、劉新萍、呂文增、周業光、華蕊、付熙雯、溫祖卿、韓笑、 李傳琪、侯鋮鋮、張宏、黃鐸賓、紀昌秀、劉夢宇、董煜 陳延、杜揚、黃華津、連瑩、劉嘉玉、劉均祿、任冉冉、王佳依、王野然、 王云聰、文可昕、項佳囡、徐丹丹、楊欣怡、鐘澤琪、朱令俊 指數出品方 52 評估專家委員會 53 聯合發布方 合作單位 冥睿(上海)信息科技有限公司中山大學數字治理研究中心 54