美國大數據應用狀況分析對實踐的啟示
來源:網易 更新時間:2014-06-12

       美國是最先推出大數據戰略的國家。2012年5月,美國政府宣布投資2億美元提高大數據技術(包括數據的儲存、分析、收集),以加快科學研究、加強國家安全、改革教學和培訓體系以及促進專業人才發展。
  
  大數據與開放政府數據對電子公共服務、開放和透明政府以及政府公眾與企業間的互動,都蘊藏著巨大的變革潛力。大數據與開放政府數據可推動多方協作,為農業、健康和交通運輸等各個領域面臨的挑戰提出實時解決方案,推動更大程度的開放,并引領政策制定走向新時代。
  
  本文以美國為背景,對有關開放政府數據與大數據的關鍵政策問題進行評論,然后為大數據和開放政府數據的實踐提供建議,以推進數據驅動的創新。
  
  大數據應用
  
  2012年3月奧巴馬政府發布了“大數據研究和發展計劃”。作為回應,美國國家科學基金會、美國國家衛生研究院、國防部、能源部和美國地質調查局都在投資大數據創新。美國很多公司正在圍繞大數據的采集和利用能力來開展他們的商業活動,并將這些活動作為其產品或運營后端的一部分。科研群體、政府和私營部門也正在加速生成各種主題的大規模數據集,包括:氣候變化、交通模式、健康和疾病數據、購買行為以及通過社會化媒體互動表現出的社會行為。大數據應用的案例有:
  
  Inrix公司和新澤西州運輸部之間的合作伙伴關系。Inrix公司通過汽車和移動電話GPS裝置上的信號和數據,采集主干道上的車速數據,然后實時向新澤西州運輸部警示任意主干道上的路況險情,同時向司機的車載GPS裝置或移動電話發送警示來提醒司機注意路況險情。
  
  氣候公司(TheClimateCorporation)是一家天氣保險公司,他們制作保單來彌補聯邦農作物保險和因氣候造成的農民損失之間的差額。該公司通過龐大的傳感器網絡分析和預測2000萬美國農田的氣溫、降水、土壤濕度和產量。在知曉高溫天的天數以及土壤濕度數據后,建立的模型來幫助其預判農民需要的天氣保險金額以及公司需要支付的保費。
  
  紐約州能源研究和發展管理局運用一系列的大數據技術來評估氣候變化對紐約州的影響,并為農業、公共衛生、能源和交通運輸等領域提供應對氣候變化的策略。這一應用也被引入美國疾病控制中心,它正與美國其他10個州和城市一起開展“閱讀州和城市計劃”,共同研究和應對氣候變化,而大數據技術是其中一個非常重要的組成部分。
  
  開放政府數據
  
  大數據戰略,往往建立在開放政府數據的基礎上。開放政府數據在美國并不是一個全新的概念。多年來,政府的信息和數據在不斷變化,采集和發布政府數據的方法和途徑也同樣經歷了這些變化。開放政府數據在催生新的科學研究成果、加快經濟增長、為政策制定提供信息以及制定為民服務的新政策方面都深具潛力。有關開放政府數據的政策選擇將對大規模數據集應用的創新和研究、政府開放和透明以及其他眾多領域產生深遠影響。
  
  作為奧巴馬政府開放政府計劃的一部分,2010年美國政府建立data.gov網站,向公眾開放“高價值”的數據集。這一政府開放數據平臺現已可直接為用戶提供海量的原始政府數據,并期待用戶能挖掘這些數據的新的利用價值,從而以過去無法實現的方式加深我們對政府活動和更龐雜的社會事務的認知。這些技術方法推動了數據的可獲取、開放和透明,同時又讓公眾、組織、社區和其他社會成員在現有數據的基礎上產生新的創新性認知。作為一個面向公眾的平臺,它可成為一個促進協作、存儲數據集、推動社區參與和提供參與機會的工具。除此之外,數據還可通過這些平臺以多種格式(如CSV,XML和Excel等)儲存和開放。每種數據格式都有其特定含義,可限制或促進數據的應用。
  
  現行政策分析
  
  關于大數據和開放政府數據的一個關鍵問題是,政府信息和數據的管理、使用、再利用和可獲取政策。美國有一整套復雜且不斷變化的信息政策(法律、法規和備忘錄),用來管理信息的生命周期,從信息的生成、信息的傳播、再到信息處理和歸檔,涉及到如何在數據可獲取、隱私、安全問題、數字資產管理、歸檔和保存等問題上尋求平衡。這個政策框架盡管也不斷調整,但仍落后于技術的進步,這一脫節使人們對美國現行政策框架是否足以應對大數據帶來的問題產生了疑問,并提出以下幾個關鍵問題:
  
  我們能確保數據的可獲取性嗎?在大數據時代我們如何保護隱私?我們如何確保數據的質量和準確性?在目前的歸檔和保存條件下,如何管理我們的數字資產?大數據時代我們能否發展有力的數據再利用政策?
  
  下文將具體分析在大數據和開放政府數據時代,當前美國的信息政策框架的現狀和滯后性,并給出了信息政策調整的建議。
  
  (一)數據可獲取和發布
  
  美國管理和預算辦公室在數據獲取和發布方面為政府機構提供了廣泛的指導,他們確立了以下原則:政府機構必須及時、公平、有效地以適當的方式把信息發布給公眾。政府機構必須建立和維護“信息發布產品清單”。政府機構必須考慮到公民獲取能力的差異,讓那些不能上網的公眾也能獲得重要信息。政府機構應制定多種策略來發布信息。當使用電子媒體時,那些涉及妥善管理和文件歸檔的規定同樣適用。政府機構需要評估并確定最合適的方法來采集和保存文件。
  
  美國管理和預算辦公室也為政府機構網站的信息管理提供廣泛的指導。要求政府機構對提供的所有在線應用進行標準化的風險評估,并要求政府機構執行多項與隱私相關的措施。其他有關信息獲取和傳播的政策工具還包括:1.要求政府機構對英語能力有限的人提供適當的信息獲取方式,涉及所有的“聯邦的項目和活動”。這個政策的目標是為了解決公民使用電子政務的鴻溝,尤其是那些不以英語為母語的人。2.規定殘疾人在公共教育中可平等獲取所有的電子材料。規定政府在提供服務和福利,以及開展政民溝通時,不得將殘疾人排除在外。保證殘疾人平等地參與政府活動和獲取政府信息,并確立了他們獲取信息和使用通信技術的一般權利。3.推進和實施了線上信息和通信技術的可獲取性。4.由聯邦政府采購、維護或使用的電子和信息技術必須滿足特定的獲取性標準,以確保殘疾人能夠獲取在線信息和服務。
  
  (二)隱私、安全、準確性和歸檔
  
  政府網站正變成雙向社區,增加了網絡病毒或其他攻擊載體侵入政府環境的可能性,同時也增加了信息意外泄露的可能性。信息政策框架也做出了相應調整以應對這一變化。比如,管理和預算辦公室要求政府機構盡可能采取足夠的安全措施,以確保信息不被篡改,并確保其準確性、保密性和可獲取性,以符合政府機構的預期和用戶的需求。
  
  然而,當前的相關政策并不能保證解決大數據所帶來的大量使用不當問題。對個人身份信息、政府數據與信息的安全性以及對公開數據的準確性的擔憂,都與大數據相關。大數據的質量、可靠性和權威性是政府、科研群體以及非政府組織和私營部門最關注的問題。未經確認或驗證的數據、或用錯誤方法采集到的低質量數據可能會導致錯誤的研究發現,進而嚴重影響一系列的決策和政策制定。
  
  data.gov的數據管理政策,致力于解決這些問題,具體包括:規定負責采集和發布數據的政府機構要確保數據的準確性、及時性和整體質量。要求政府機構進行版本控制,確保數據集具有明確的標簽。要求政府機構確保data.gov上發布的數據不涉及國家安全。要求政府機構確保發布的數據符合保密和隱私保護的相關規定。
  
  沿著信息的生命周期繼續往下走,大數據的使用、儲存和保存等方面也面臨各種挑戰。推動大數據的開放和可獲取,與促進大數據的利用具有顯著差別。此外,特定領域的數據應用(即只有某個特定領域的科學家們使用)和廣泛的跨學科數據應用(即跨學科領域和跨常見研究領域的應用)之間也有不同。
  
  同時,需要為大規模科研數據集建立專門的數據庫。構建數據社區的一個要素是迫切需要整合和管理來自不同源頭和不同部門的數據。這些數據流必須在政府、私營部門、公共事業公司、各種設備和個人之間流動交匯,才能真正有用,并為社區和國家發展提供信息。因此,有必要在各個實體間建立、采用并遵守一套正式的數據管理標準和操作辦法,以保障數據兼容性、命名規則和組織架構。而且,為確保研究人員們對于數據集的知情使用,也需要制作具有明確定義的數據文件和編碼本。
  
  “聚合”指的是用戶將從不同網站得到的數據結合起來,大數據使當下信息政策環境變得更為復雜。管理和預算辦公室要求各政府機構的公共網站,提供開放且符合業界標準格式的數據,使得用戶能夠整合、分解、操縱或分析數據以滿足他們的需求。目前經過聚合的數據往往缺乏正式的授權和驗證程序。正如data.gov網站所提出的,“一旦數據從該政府機構頁面被下載后,政府不再能保證其質量和即時性。此外,美國政府無法對取自data.gov的數據的任何分析結果做擔保”。雖然這一免責聲明限定了data.gov的責任,但二次數據使用問題仍需要解決。
  
  大數據的監管也是一個不可忽視的問題。數字化監管涉及對電子研究數據的維護、保存和增值,并貫穿其整個生命周期,例如數字資產的概念問題、數字資產的創造、獲取和使用問題,以及數字資產的評價和選擇工作。隨著新的電子數據資產的持續增長,有必要為大數據的整個生命周期制定有效的數據管理策略。
  
  最后,在諸如data.gov社區這樣的數字“開放空間”里,永久的、最終的文件越來越少,而幾乎所有文件管理和歸檔工作都是基于這些文件建立起來的。可現在由于使用非政府的第三方應用程序或軟件,且數據調整和修改不斷發生,使得數據所有權、儲存進度以及歸檔工作都面臨巨大的挑戰。
  
  政策和治理原則
  
  當政策制定者考慮、辯論并制定政策時,當私有部門、非營利部門與政府在進行合作時,我們會發現對開放政府數據和大數據立法或者制定一套政策和治理結構非常困難。政府需要在進行數據開放并利用大數據技術的時候,需要制定一套指導原則。而且這些指導原則只是一個開始,并非結束。隨著對大數據創新的理解不斷深入,我們需要建立并維持一個強有力的政策和治理框架。這些指導原則是:
  
  1.不造成傷害。在政府、私有部門和公眾社會間共享數據可能涉及到私人的、敏感的個人信息,而這些組織中的大多數并不擁有相匹配的數據管理、利用和再利用政策。當非政府組織也是大數據合作項目的參與者時,個人不應該被強制或被要求將政府出于某種目的而采集的數據共享給這些非政府組織。
  
  2.長遠眼光。數據的長期共享、保存、檢索以及獲取將要求超越當前技術水平,具有長遠眼光。需要保證大數據及其附屬產品能在未來的10年、20年乃至更長的時間里都能獲得。從一開始就堅持遵守開放數據標準及技術標準可有效推動這一過程。
  
  3.數據表述。我們需要保證數據元素、數據采集單位(例如,是個人層級還是社區層級)、或數據的其他方面都被很好地界定,同時數據采集和使用政策得到清楚地表述。
  
  4.承擔責任。大數據對于提供信息和制定政策潛力巨大,但也可能造成損害。大數據通常包含了多種數據集的聚合,而這些數據集最初并不是出于整合的目的而生成的。在大數據創新中,政府需要對他人使用其數據所造成的損害承擔責任,確保對公眾的保護。
  
  政策建議
  
  大數據帶來了一系列問題,而當前的政策框架卻無力解決這些問題,這就需要一個大數據的治理模式。這一治理模式需要考慮以下具體問題:
  
  隱私。在個人、家庭、設備或其他層面,大數據包含了各種個人信息數據。隱私保護法律和政策可能會與大數據所帶來的機遇相沖突,而與此同時,大數據正在侵犯個人或社區的隱私權。
  
  數據再利用。數據通常是由政府機構或其他組織所采集的,一般與社會服務的被服務者相聯系。另外,個人、政府機構或公司常擁有在允許范圍內使用數據的權力,以及采集和使用數據時的隱私保護政策。當大數據應用不斷整合來自不同機構、政府以及家庭的數據集以期發現新思路并為決策和政策制定提供信息時,向個人清晰地進行數據利用和再利用政策的指導也非常必要,從而使個人能夠在知情的情況下,做出與其個人數據相關的決定。



铁牛视频app下载苹果-铁牛视频app下载地址-铁牛视频app破解版ios