1 開放數據是什么
‘開放數據基金會”(Open Knowledge Foundation, OKF)把“開放數據”定義為是一種任何人以任何目的都能夠自由免費獲取、修改、使用、再利用和重新發布的數據,唯一可能的限制是要標明數據的來源和保持開放共享性。OKF發布的《開放數據手冊》將開放數據歸納為五個主要步驟,分別是:
(1) 選取數據集( dataset) :
(2) 采用一個開放許可協議(licence) ;
(3) 使數據可獲取(available) :網絡批量下載或通過API訪問
(4)數據能被用戶發現(discoverable),將數據集注冊到中心目錄(catalog)、門戶網站
(5) 便于利用數據。

2 開放數據原則
“開放政府數據”(Open Government Data, OGD)是開放數據的核心,引起了各界人士的關注。早在2007年12月,蒂姆.奧萊理(Tim
O'Reilly)等人制定了OGD的八項原則:
(1)數據必須是完整的,所有開放數據均為可用并且不受有效隱私,安全性或特權限制的數據;
(2)數據必須是原始的,數據是從源頭收集,具有盡可能高的粒度級別,而不是以聚合或修改的形式;
(3)數據必須是及時的,為了保持數據的價值,需要盡快提供數據:
(4)數據必須是可獲取的,數據用于最廣泛的用戶且用途廣泛;
(5)數據必須是機器可處理的,數據的結構合理,可以進行自動化處理;
(6)數據的獲取必須具有無歧視性,任何人獲取數據無需注冊;
(7)數據格式必須是通用非專有的,數據沒有實體且沒有控制權的格式提供:.
(8)數據必須是不需要任何許可的,不受任何專利、版權、商標或商業隱藏法規的束縛。合乎情理的隱私、安全和特權限制是允許的。
2010年陽光基金在以上八項原則的基礎上添加了持久性和使用成本兩個原則。持久性指在一定邊界范圍內,查找信息的能力保持恒定或維持某--特定狀態的持續時間,政府發布出來的信息應該永久地存檔在網上,為了方便公眾的使用,發布的信息應該保持在線狀態,并隨著歲月的推移進行適當的版本跟蹤和歸檔。將使用成本降到最小,公眾獲取訪問的成本是獲取公開可用信息的最大阻礙中的-個,對大多數政府是否收集數據幾乎是沒有影響。
除了以上提到的以外還有其他開放政府數據原則,例美國聯邦首席信息官I5]公開發表了改進數據透明化的10項原則。Tauberer J在《Open
Government Data:The
Book》的第二版中標明了開放政府數據的14項原則。這些原則都為正確的實施政府開放數據,運動指明了方向,部分原則涉及到了數據質量的定義,說明了數據適用于某些特定目的,也可以作為評估開放政府數據的標準。
3 開放數據的特征
于政府而言,開放數據的特征需具備以下幾個方面。
(1)政府數據是公共產品,不涉及個人、機構隱私、國家安全的數據都應該公開。不設限,所有人都可以訪問。
(2)數據若不需要特別加工應該免費。用戶能夠免費獲取。
(3)格式為機器可讀,即,使用計算機或手持終端可以輕松檢索、下載和處理。(4)無版權限制,數據無須授權即可以重復使用和發布。
推薦閱讀:《使用現代網絡理念構造開放數據中心.pdf》
《普華永道:開放數據資產估值白皮書(31頁).pdf》
《上海社會科學院:2020全球重要城市開放數據指數(20頁).pdf》