1、1City復旦智庫報告中國地方政府數據開放報告城市001001引言 數林概貌 數林指數 數林標桿 數林建言 評估方法附錄 001004009015030034042本報告版權為復旦大學數字與移動治理實驗室(復旦 DMG)所有,如需引用本報告內容,請參照以下規范:復旦大學數字與移動治理實驗室.中國地方政府數據開放報告城市(2021年度)R/OL.(2022-01-20)引用日期,格式為 YYYY-MM-DD.http:/ 2017 年 5 月首次發布以來,定期對我國地方政府數據開放水平進行綜合評價,精心測量各地“開放數木”的繁茂程度和果實價值,助推我國政府數據開放生態體系的建設與發展。2018
2、年以來,“中國開放數林指數”為國家互聯網信息辦公室信息化發展局監測我國公共信息資源開放情況提供數據支持。0022021 年起,指數制作方將原來的“副省級/地級”指數調整為“城市”指數,將直轄市、副省級城市和地級城市,都作為一個“空間”和“聚落”,而不僅僅是一個 層級 來進行評測,并發布中國地方政府數據開放報告城市(以下簡稱報告)。003數林概貌004截至 2021 年 10 月,我國已有 193 個省級和城市的地方政府上線了數據開放平臺,其中省級平臺20個(含省和自治區,不包括直轄市和港澳臺),城市平臺 173 個(含直轄市、副省級與地級行政區)。與 2020 年下半年相比,新增 51 個地方
3、平臺,其中包含 3 個省級平臺和 48 個城市平臺,平臺總數增長超 3 成。如圖 1 所示,全國地級及以上政府數據開放平臺數量增長顯著,從2017 年的 20 個到 2021 下半年的 193 個。一、數林概貌 數林概貌 圖 1 歷年地級及以上平臺數量增長情況005目前,我國 51.33%的城市(包括直轄市、副省級與地級行政區)已上線了政府數據開放平臺。如圖 2 所示,自 2012 年上海市和北京市等地率先上線數據開放平臺以來,城市平臺數量逐年增長,目前已達到 173 個。各城市平臺上線時間如表 1 所示。圖 2 歷年城市平臺數量增長情況 表 1 城市平臺上線時間一覽表(按拼音首字母排序)數林
4、概貌006 數林概貌截至 2021 年 10 月,全國各地上線的城市數據開放平臺的地區分布如圖 3 所示,顏色越深,代表平臺上線時間越早。目前,所有直轄市,以及浙江省、廣東省、山東省、四川省與廣西壯族自治區等?。ㄗ灾螀^)域內的所有下轄城市都已上線了政府數據開放平臺,形成我國最為密集的城市 開放數林。同時,在東中部地區的安徽省、湖北省、湖南省以及西南地區的貴州省、東北地區的黑龍江省等地,城市平臺也不斷上線并逐漸相連成片。然而,部分城市的數據開放平臺仍然是“孤獨的綠洲”,在其四周的城市均未上線平臺。圖 3 城市平臺上線時間的地理空間分布007 圖 4 2017-2021 年城市平臺分布中國開放數林
5、指數自 2017 年首次發布以來,已滿五年。五年來,全國各地的政府數據開放平臺已逐步相連成片、蔚然成林。圖 4 為 2017 年到2021年期間,地級以上城市(含直轄市)數據開放平臺區域分布的變化情況。數據容量是指將一個地方平臺中可下載的、結構化的、各個時間批次發布的數據集的字段數(列數)乘以條數(行數)后得出的數量,體現的是平臺上開放的可下載數據集的數據量和顆粒度。圖 5 列出了城市數據容量排在前十的地方,并反映了地方數據容量和有效數據集總數、單個數據集平均容量之間的關系。數據容量更能體現一個地方的數據開放總量,單個數據集平均容量也更能反映一個地方開放數據集的平均水平。例如,東莞市開放的有效
6、數據集總數并不靠前,但數據容量在全國領先,單個數據集平均容量最高。數林概貌 圖 5 城市數據容量(前十名)、有效數據集總數與單個數據集平均容量比較 008數林指數0092021 年度全國城市開放數林的指數分值、排名和等級如表 2 所示。上海市的綜合表現最優,青島市和煙臺市也總體表現優秀,進入第一等級“五棵樹”。福州市、深圳市、濟南市、杭州市、臨沂市、日照市與濰坊市也表現較優,進入第二等級“四棵樹”。其次是德州市、臺州市、溫州市、貴陽市、無錫市等城市。在四個單項維度上,在全國所有 173 個城市中,上海市在準備度、平臺層和利用層上都排名第一,煙臺市在數據層排名第一。二、數林指數 數林指數010
7、數林指數 表 2 中國開放數林指數城市綜合排名(前五十名)011 數林指數 四個直轄市開放數林指數分值和排名如表 3 所示,上海市綜合表現最優,位列第一,其次是北京市、天津市和重慶市。副省級開放數林指數排名前十的地方如表 4 所示,青島市綜合表現最優,位列第一,深圳市、濟南市和杭州市也表現優異。表 3 直轄市 表 4 副省級城市(前十名)012 數林指數地級開放數林指數排名前十的城市如表 5 所示,煙臺市綜合表現最優,位列第一,福州市、臨沂市、日照市和濰坊市等地也表現優異。表 5 地級城市(前十名)013“數林匹克”指數數據開放是一場馬拉松,而不是速滑賽,不在于一個地方是否跑得早、跑得急,而在
8、于這個地方能否跑得長、跑得穩,能持續、穩定地向社會提供優質數據,并堅持不懈地推動開放數據的開發利用。報告繼續通過“數林匹克”四年累計分值,反映一個地方在過去四年(2018 年-2021 年)開放數據的持續水平。城市“數林匹克”累計分值由 2018 年到 2021 年這四年該城市的年終(即下半年)開放數林綜合指數的分值累加而成,以反映一個城市在過去四年(2018年-2021年)開放數據的持續水平。表6是2018-2021城市“數林匹克”累計分值前二十名的地方,上海市分值最高,其次是貴陽市、青島市、深圳市與濟南市,分值都在 210 分以上。表 6 城市“數林匹克”累計分值(前二十名)數林指數014
9、數林標桿015三、數林標桿3.1 數根:準備度3.1.1 法規政策效力與內容深圳市制定并公布了地方性法規深圳經濟特區數據條例,其中專門針對公共數據開放作出了原則性要求,如圖 6、圖 7 所示。圖 6 深圳經濟特區數據條例 圖 7 深圳經濟特區數據條例中關于“數據開放”的內容條款0163.1.2 領導重視麗水市委常委、常務副市長杜興林于 2021 年 7 月在 2021 麗水數據開放創新應用大賽頒獎典禮上發表了推動政務數據開放相關內容的講話(來源網址:https:/ 8 所示。圖 8 麗水市市委常委、常務副市長杜興林關于推動政務數據開放工作的講話017 圖 10 深圳市平臺公開的有條件開放數據申
10、請結果 圖 9 深圳市平臺的有條件開放數據申請公開欄目3.2 數干:平臺層3.2.1 有條件開放數據申請結果公開深圳市平臺對外公開了用戶申請有條件開放數據的結果,如圖 9、圖10 所示。018 圖 11 麗水市平臺的社會數據提交功能3.2.2 社會數據提交功能麗水市平臺提供了社會數據提交功能,用戶可將其采集、整理的數據提交給平臺,從而擴大了平臺數據的來源范圍,如圖 11 所示。0193.3 數葉:數據層3.3.1 數據容量數據容量更能反映一個地方數據開放的總量,單個數據集平均容量也更能反映一個地方開放數據集的平均水平,東莞市數據開放平臺所開放的無條件數據的數據容量和單個數據集平均容量均在全國領
11、先。東莞市平臺所開放的無條件開放數據的數據容量將近 4 億,單個數據集平均容量超 88萬,如圖 12 所示。圖 12 東莞市數據開放平臺0203.3.2 高容量數據集高容量數據集的利用價值更高,應當成為數據開放的重點。表 7 是2021 下半年城市開放的數據容量最高的前十位數據集列表,這些數據集普遍具有較高的條數、字段數和下載量,內容主要涉及工商、人社、市場監管、行政執法等方面。表 7 城市開放的前 10 個高容量數據集一覽表 表 8 城市優質 API 接口列表3.3.3 優質 APIAPI 接口適用于提供實時動態的高容量數據,以促進高價值數據的開放與利用。優質 API 接口需要滿足接口可調用
12、、至少每日更新、數據集容量高等標準。目前,深圳市平臺提供了多個優質 API 接口,如表 8 所示。0213.3.4 關鍵數據集報告列舉了各地國家政策和地方規章要求重點和優先開放的五項關鍵數據集,如表 9 所示。貴陽市與深圳市開放的數據覆蓋了所有五項關鍵數據集,其中,深圳開放的疫情防控數據在數量、顆粒度與更新及時性等方面都在全國領先,如圖 13 所示。表 9 關鍵數據集列表 圖 13 深圳市開放的疫情防控類數據0223.4 數果:利用層3.4.1 跨域比賽協同深圳市舉辦了 2021 全球開放數據應用創新大賽推動數據跨域跨界融合,參賽者可利用香港、澳門及珠三角其他八個城市開放的來自政府、企業、社會
13、等多種渠道的數據,如圖 14、圖 15 所示。圖 14 深圳市舉辦 2021 全球開放數據應用創新大賽 023 圖 15 深圳市 2021 全球開放數據應用創新大賽利用粵港澳多地開放的數據024 圖 16 北京市組織智慧交通開放創新大賽3.4.2 組織引導賦能活動北京市在交通領域組織了開放數據利用專題比賽,促進交通出行數據的社會利用,如圖 16 所示。025 圖 17 上海市開展數據利用試點項目上海市在交通出行、財稅金融、醫療健康等領域,開展公共數據開放利用試點項目,推動公共數據在各行業的利用,如圖 17 所示。0263.4.3 優質利用成果上海市平臺展示的工商銀行政采貸試點項目,通過對各部門
14、數據的整合利用,為銀行授信提供依據,如圖 18 所示。圖 18 上海市平臺展示的工商銀行政采貸試點項目027青島市、無錫市、煙臺市、杭州市、貴陽市在交通出行領域都產生了比較優質的利用成果。例如,青島市平臺展示的“宜行青島”是一款提供停車充電查詢服務的應用,通過該應用,用戶可以在線尋找附近停車場的空閑車位,以解決停車位難找的問題,如圖 19 所示。用戶還能查找周邊的充電樁信息,以及充電樁的剩余車位數、價格等情況。圖 19 青島市平臺展示的宜行青島應用028杭州市的“車來了”應用通過調用市區公交線路和站點分布數據,為用戶提供公交位置實時查詢服務,如圖 20 所示。圖 20 杭州市平臺展示的車來了應
15、用029數林建言030四、數林建言4.1 制度供給與組織保障在法規政策效力與內容方面,建議各地在制定有關數據開放的地方性法規、地方政府規章或規范性文件時對數據開放要求、數據利用要求、全生命周期安全管理和保障機制作出具體要求。在組織與領導方面,建立數據開放工作的統籌協調機制。建議地方黨政領導在公開場合發表明確支持數據開放工作的講話,加大對政府數據開放的支持力度。制定和公開專門針對政府數據開放的年度工作計劃與方案。數林建言4.2 平臺優化與持續運營在發現預覽方面,建議提供可下載的開放數據目錄,提供覆蓋數據集和利用成果的高級搜索功能,提供同時支持無條件開放數據和有條件開放數據的預覽功能。在數據獲取方
16、面,建議擴大無條件開放數據可直接獲取的范圍,開通有條件開放數據申請功能并列明申請條件,對用戶的有條件開放數據申請和未開放數據請求進行及時有效的回復并公開相關信息。031 數林建言在成果提交展示方面,建議為開發者提供多種類型的開放數據利用成果的提交入口,展示多種利用成果和利用成果的多種來源信息,包括數據集名稱、數據提供部門和利用者信息等。在互動反饋方面,建議提供數據發布者的聯系電話,公開用戶對數據集和利用成果的評價,對用戶的意見建議和數據糾錯進行及時有效的回復并公開相關信息,提供權益申訴功能并對用戶的權益申訴進行及時有效的回復。在用戶體驗方面,建議為用戶訂閱的數據提供更新推送功能。4.3 數量提
17、升與質量保證在數據數量方面,建議持續開放更多有效數據集,重點提升數據容量,開放更多高容量數據集,提高單個數據集的容量,特別是以 API 接口形式開放的、動態的、高容量的數據。在數據質量方面,建議清理高缺失、碎片化、低容量的數據集,保持開放數據集的不斷增長和動態更新。在數據規范方面,建議推進數據的分級分類開放,對數據集標注不同的開放類型和屬性,并相應配備差異化的開放授權協議。提高開放數據集可機讀格式、非專屬格式、RDF 格式的比例,降低申請和調用 API 接口的難度,為開放數據集提供豐富的元數據信息。在開放范圍方面,建議提高開放數據集的主題覆蓋面和部門覆蓋面,開放更多常見數據集和關鍵數據集。03
18、24.4 數據利用與生態培育在大賽舉辦參與方面,建議結合自身特色常態化舉辦開放數據創新利用比賽,或連續參與省級組織的大賽,以提高社會利用開放數據的積極性。在引導賦能方面,建議積極組織多樣化、常態化、專業性的引導賦能活動,營造有利于政府數據開放利用的生態體系。在成果數量與質量方面,建議進一步提高有效利用成果的數量和質量,清理與數據開放無關的、由政府自身開發的、無法獲取或無法正常使用的成果,為展示的利用成果標明其所利用的開放數據集并提供有效鏈接。在利用多樣性方面,建議推動高校、社會組織、公民等主體參與,以提高開放數據利用者類型的多樣性,并通過各行業領域的促進活動提升成果形式與主題覆蓋的多樣性。數林
19、建言033評估方法034五、評估方法5.1 評估指標體系開放數林指數邀請國內外政界、學術界、產業界七十余位專家共同參與,組成“中國開放數林指數”評估專家委員會,以體現跨界、多學科、第三方的專業視角。專家委員會基于數據開放的基本理念和原則,借鑒國際數據開放評估指標體系的經驗,立足我國政府數據開放的政策要求與地方實踐,構建起一個系統、科學、可操作的地方政府數據開放評估指標體系,并為每項指標分配了權重,如圖 21 所示。圖 21 開放數林指數評估指標體系的構建方法035評估指標體系共包括準備度、平臺層、數據層、利用層四個維度及下屬多級指標,如圖 22 所示:準備度是“數根”,是數據開放的基礎,包括法
20、規政策效力與內容、標準規范、組織與領導等三個一級指標。平臺層是“數干”,是數據開放的樞紐,包括發現預覽、數據獲取、成果提交展示、互動反饋、用戶體驗等五個一級指標。數據層是“數葉”,是數據開放的核心,包括數據數量、數據質量、數據規范、開放范圍等四個一級指標。利用層是“數果”,是數據開放的成效,包括利用促進、利用多樣性、成果數量、成果質量等四個一級指標。036 圖 22-1 2021 中國開放數林指數評估指標體系(城市)037利用層數據層平臺層準備度 圖 22-2 2021 中國開放數林指數評估指標體系(城市)0385.2 評估對象 2021 年起,中國開放數林指數將原來的評估對象“副省級/地級”
21、調整為“城市”。此前報告中的評估對象“副省級/地級”更多將城市作為一個“層級”來進行評測。然而,不論城市處于何種行政級別,它都是一個人口集中居住并進行生產生活的密集“空間”和“聚落”。因此,從本年度開始,中國開放數林指數將直轄市、副省級城市和地級城市都作為一個“空間”和“聚落”來進行評估,并注重省域和城市在數據開放上的協同性和互通性。根據公開報道,以及使用“數據開放”“數據公開”“公共數據”“政務數據”“政府數據”“地名數據”“地名政府數據”“地名開放數據”等關鍵詞進行搜索,發現了截至 2021 年 10 月我國已上線的地方政府數據開放平臺,并從中篩選出符合以下條件的平臺:1、原則上平臺域名中
22、需出現 ,作為確定其為政府官方數據開放平臺的依據。2、平臺由行政級別為地級以上的地方政府建設和運營(不含港澳臺)。3、開放形式為開設專門、統一的地方數據開放平臺,或是在政府官網上開設專門欄目進行集中開放,由條線部門建設的開放數據平臺不在評估范圍內。本次評估中,共發現符合以上條件的城市 173 個,并將上線了這些平臺的城市作為評估對象。具體城市、平臺名稱和平臺鏈接如附錄所示。0395.3 數據采集與分析方法準備度評估主要對相關法律法規、政策、年度計劃與工作方案、標準規范、新聞報道等資料進行了描述性統計分析和文本分析。搜索方法主要包括以下兩種:一是在搜索引擎以關鍵詞檢索相關法規與政策文本、標準規范
23、、年度工作計劃、地方黨政領導講話的新聞報道以及數據開放主管部門的信息;二是在地方政府門戶網站以及政府數據開放平臺上通過人工觀察和關鍵詞檢索采集數據。數據采集截止時間為 2021 年 11 月。平臺層評估主要采用人工觀察法對各地政府數據開放平臺上各項功能進行觀測并做描述性統計分析,數據采集截止時間為 2021 年 11 月。同時,還對平臺的回復時效和回復質量進行了評估,回復情況采集截止時間為 2021 年 11 月。數據層評估主要通過機器自動抓取和處理各地政府數據開放平臺上開放的數據,結合人工觀察采集相關信息,然后對數據進行了描述性統計分析、交叉分析、文本分析和空間分析。數據采集截止時間為 20
24、21 年 11 月,對“動態更新”這一指標的評測時段為 2021 年 1 月至 2021 年 11 月。利用層評估主要對各地政府數據開放平臺上展示的利用成果進行了人工觀察和測試,對 2019 年以來各地開展的開放數據創新利用比賽信息進行了網絡檢索,并對采集到的數據進行了描述性統計分析。數據采集截止時間為 2021 年 11 月。此外,為確保采集信息準確,避免遺漏,部分指標采取報告制作方自主采集和向各地征集相結合的方式。各地征集結果經過報告制作方驗證后納入數據范圍。0405.4 指標計算方法指數制作方基于各地在各項評估指標上的實際表現從低到高按照 0-5分共 6 檔分值進行評分,其中 5 分為最
25、高分,相應數據缺失或完全不符合標準則分值為 0。對于連續型統計數值類數據則使用極差歸一法將各地統計數據結果換算為 0-5 分之間的數值作為該項得分。各地平臺在準備度、平臺層、數據層、利用層四個維度上的指數總分等于每個單項指標的分值乘以相應權重所得到的加權總和。最終,各地開放數林指數等于準備度指數、平臺層指數、數據層指數、利用層指數乘以相應權重的加權平均分。城市開放數林指數計算公式如下:同時,本次評估發現,部分已上線的地方平臺出現下線造成數據供給中斷的情況,或雖然平臺仍在線,但實際上無法通過平臺獲取數據的問題。城市開放數林指數15184522041附錄042 城市平臺一覽表(按行政層級及拼音首字
26、母排序)043044045指數制作團隊報告校對組觀察員鄭磊、劉新萍、張忻璐、呂文增、華蕊、張宏、侯鋮鋮紀昌秀、王翔、馬李濱、韓笑、李傳琪蔡伊南、常媛媛、陳美欣、陳 業、程義婷、董萬怡夢、段武鴻、段曉耀、馮會丹、龔小洛、黃河水、黃思雅、蔣 佳 鈺、景宇欣、李行行、梁熠揚、廖月妮、劉 予、盧一鳴、莫 濤、錢宇霆、孫蕭航、王 芮、王艷梅、王野然、尉 葦、溫 順 月、吳海珍、肖姝陽、辛 悅、徐丹丹、許怡婷、郁春江、于 丹、于錦文、翟 瑋、周夢雪、朱鈺謙指數制作方046評估專家委員會047聯合發布方支持單位優刻得科技股份有限公司浪潮集團有限公司浙大城市學院城市大腦研究院048合作單位冥睿(上海)信息科技有限公司 中山大學數字治理研究中心 晴禾(南京)文化有限公司 匯納科技股份有限公司 復旦發展研究院