從移動支付到共享經(jīng)濟,大數(shù)據(jù)正在加速重塑著大眾生活的諸多方面;從萬物互聯(lián)到智慧城市,大數(shù)據(jù)正在深刻影響著經(jīng)濟發(fā)展、社會治理、國家管理的各個領域。了解大數(shù)據(jù)、掌握大數(shù)據(jù)、運用大數(shù)據(jù),這是當下的現(xiàn)實課題,更意味對未來的判斷和引領。
大數(shù)據(jù)正在得到空前重視。2017年底,習近平總書記在中共中央政治局第二次集體學習時強調(diào),推動實施國家大數(shù)據(jù)戰(zhàn)略,加快完善數(shù)字基礎設施,推進數(shù)據(jù)資源整合和開放共享,保障數(shù)據(jù)安全,加快建設數(shù)字中國。最近一年來,貴州、海南、四川等地陸續(xù)發(fā)布促進大數(shù)據(jù)發(fā)展工作方案或相關地方法規(guī),以促進和保障大數(shù)據(jù)發(fā)展有序推進,各類便民應用層出,產(chǎn)業(yè)集聚明顯加快。
我國大數(shù)據(jù)發(fā)展現(xiàn)狀如何—數(shù)據(jù)應用是否發(fā)揮應有效果?數(shù)據(jù)公開共享是否合理充分?個人數(shù)據(jù)隱私保護是否全面?近日,本報記者就這些問題深入調(diào)研,采寫“解碼大數(shù)據(jù)”上下篇報道。今天推出上篇《3問大數(shù)據(jù)》。
大數(shù)據(jù)好用嗎
■應用領域不廣泛
■區(qū)域水平不均衡
■行業(yè)融合不深入
年度賬單、聽歌歷程、出行軌跡……年初,多個互聯(lián)網(wǎng)應用平臺推出對用戶使用情況的“個人總結(jié)”,買了什么東西、下了幾次館子、聽了什么歌、去了什么地方……大數(shù)據(jù)似乎比用戶更了解自己。雖質(zhì)疑不斷,但有趣的“用戶畫像”背后,是大數(shù)據(jù)應用越來越深入尋常百姓家。
工信部發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020)》指出,目前大數(shù)據(jù)仍存在應用領域不廣泛、應用程度不深、認識不到位等問題。為解決更多需求痛點,大數(shù)據(jù)亟待打通行業(yè)發(fā)展水平參差不齊、應用領域不平衡、業(yè)務融合不深入等堵點。
賽迪顧問股份有限公司大數(shù)據(jù)產(chǎn)業(yè)研究中心的統(tǒng)計數(shù)據(jù)顯示,互聯(lián)網(wǎng)、金融和電信三大領域的大數(shù)據(jù)應用在各行業(yè)總規(guī)模中所占比重超過70%;健康醫(yī)療領域和交通領域近年不斷“上架”新應用,但行業(yè)規(guī)模占比相對較??;而其他眾多民生領域,大數(shù)據(jù)應用仍處于淺層次信息化層面,行業(yè)發(fā)展水平參差不齊。
上海普陀區(qū)全面推廣“社區(qū)治理云平臺”系統(tǒng),基層大數(shù)據(jù)讓社區(qū)服務“掌上”可得;全國首個旅游大數(shù)據(jù)公共服務平臺“杭州旅游數(shù)據(jù)在線”上線,游客通過手機便可了解景點實時擁堵度、酒店好評率等信息……總體上,東部地區(qū)的大數(shù)據(jù)應用“刷新”更快。賽迪顧問統(tǒng)計顯示,北京、江蘇、浙江、山東、上海五大省市的大數(shù)據(jù)產(chǎn)業(yè)發(fā)展領跑全國,而云南、吉林、河北、內(nèi)蒙古、廣西等省區(qū)則相對滯后,大數(shù)據(jù)應用區(qū)域發(fā)展不平衡的問題不容忽視。
大數(shù)據(jù)的價值在于應用。“玩轉(zhuǎn)大數(shù)據(jù)”的關鍵,在于大數(shù)據(jù)技術與業(yè)務實現(xiàn)深度融合。“目前,大數(shù)據(jù)在多個行業(yè)尚未與業(yè)務實現(xiàn)深度融合,應用場景創(chuàng)新不足,大數(shù)據(jù)技術人員需要提升行業(yè)業(yè)務知識和經(jīng)驗。”數(shù)據(jù)技術與應用服務商百分點首席數(shù)據(jù)科學家杜曉夢表示,國內(nèi)很多行業(yè)仍僅在局部業(yè)務上使用大數(shù)據(jù)技術,僅掌握數(shù)據(jù)挖掘和分析技術,如不能將技術與業(yè)務全面、深度地融合,則無法完全發(fā)掘出數(shù)據(jù)應用的真正價值。
《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020)》提出,到2020年,大數(shù)據(jù)相關產(chǎn)品和服務業(yè)務收入突破1萬億元,年均復合增長率保持30%左右,大數(shù)據(jù)在創(chuàng)新創(chuàng)業(yè)、政府管理和民生服務等方面廣泛深入應用。未來如何在搜集、儲存大數(shù)據(jù)的基礎上更好地整合、分析和應用,將成為優(yōu)化“數(shù)據(jù)大腦”的重點課題。
大數(shù)據(jù)的生命力,在于發(fā)現(xiàn)問題、感知風險、建立連接、解決問題以及預測未來。目前國內(nèi)的大數(shù)據(jù)應用側(cè)重于數(shù)據(jù)收集,在基礎統(tǒng)計分析、風險感知和預測方面還有較大提升空間。同時,也不能在尚未明晰具體業(yè)務應用場景的情況下盲目追求大數(shù)據(jù),而要以應用場景為牽引,只匯集不分析或者片面追求大而全,都不利于大數(shù)據(jù)發(fā)揮其對生產(chǎn)力提升的促進作用。此外,在大數(shù)據(jù)廣泛運用于創(chuàng)新創(chuàng)業(yè)、政府管理和民生服務等方面的同時,也應認識到:大數(shù)據(jù)對社會的沖擊有多大,社會對于大數(shù)據(jù)發(fā)展的回應、規(guī)范和約束就應有多大。
——清華大學新聞與傳播學院教授沈陽
大數(shù)據(jù)暢通嗎
■收集標準不統(tǒng)一
■信息壁壘待打通
■供給需求不匹配
我國信息數(shù)據(jù)資源80%以上掌握在各級政府部門手中。近年來,在《關于推進公共信息資源開放的若干意見》《政務信息系統(tǒng)整合共享實施方案》等文件的推動下,政府數(shù)據(jù)加快共享開放的步伐,惠民成績單亮點不斷。然而,由于我國大數(shù)據(jù)發(fā)展還處在起步階段,不少基礎性、關鍵性數(shù)據(jù)仍被政府部門束之高閣,共享開放程度低,成為現(xiàn)代化治理進程中的“路障”。
有效的數(shù)據(jù)收集是實現(xiàn)共享與開放的基礎。據(jù)貴州省大數(shù)據(jù)發(fā)展管理局相關負責人介紹,部分政府部門在數(shù)據(jù)收集的過程中,由于缺乏統(tǒng)一的標準,收集到的數(shù)據(jù)雖然量大,但質(zhì)量不高,可利用價值低。
由于目前數(shù)據(jù)共享開放的法律、政策環(huán)境尚不成熟,一些地方政府職能部門評估信息是否要開放等問題時,往往有所推脫。如果數(shù)據(jù)毫無關聯(lián)地沉淀在各部門的信息系統(tǒng)中,缺乏共享開放的意識,甚至把數(shù)據(jù)資源視為“私產(chǎn)”,就會造成條塊分割、重復建設,形成壁壘森嚴的“信息孤島”。據(jù)此前媒體報道,長江上游地區(qū)一些省份的交通管理部門、運輸公司不愿與其他省市共享物流信息,造成聯(lián)運銜接的信息壁壘,甚至出現(xiàn)了同樣1噸貨,百公里公路運費比經(jīng)濟發(fā)達地區(qū)高60元的現(xiàn)象。
供給與需求脫節(jié)也讓數(shù)據(jù)共享和開放效果打上折扣。截至去年底,廣東省全省87個省直部門有6988類數(shù)據(jù)資源、62332項信息項,居全國各省(區(qū)、市)首位。但各部門提出共享需求僅3649類,省級編目共享僅477類,數(shù)據(jù)難以真正發(fā)揮利民惠民、支撐政府決策的作用。
此外,盡管部分數(shù)據(jù)已接入共享開放平臺,但由于不能被機器讀取,成為無法釋放應有活力的“休眠數(shù)據(jù)”。《2017中國地方政府數(shù)據(jù)開放平臺報告》顯示,截至去年4月,全國19個地方政府數(shù)據(jù)開放平臺的8398個開放數(shù)據(jù)中仍有約25%的機器可讀性較差。
去年12月6日召開的國務院常務會議提出,提供公共數(shù)據(jù)是政府公共服務的重要內(nèi)容,要求對分散、獨立的政務信息系統(tǒng)加快清理整合,統(tǒng)一接入國家數(shù)據(jù)共享交換平臺,并依法依規(guī)向社會開放。如何繼續(xù)加快數(shù)據(jù)共享開放的進程,讓群眾真正享受到數(shù)據(jù)共享開放帶來的紅利,是未來大數(shù)據(jù)工作的重點和難點。
當前我國政府數(shù)據(jù)治理發(fā)展不充分、不平衡有多方面原因。
首先是認識問題,沒有認識到數(shù)據(jù)治理對提高執(zhí)政透明度和促進經(jīng)濟發(fā)展都有積極意義,反而認為沒有直接的政績產(chǎn)出;其次是責任問題,安全風險和問題追責等都影響政府部門開放數(shù)據(jù)的積極性;第三是利益問題,一些人認為共享開放數(shù)據(jù),將導致原有權力或既得利益受影響;第四是能力問題,有沒有物力財力可以投入,這是經(jīng)濟能力;有沒有專人專崗協(xié)調(diào),這是行政能力;有沒有成熟技術可以快速應用,這是技術能力。
——北京大學政府管理學院副教授黃璜
大數(shù)據(jù)安全嗎
■越權收集花樣多
■數(shù)據(jù)黑市有隱患
■安全防護存漏洞
2018年初,對大數(shù)據(jù)時代個人隱私安全的擔憂再度升級:微信官方表示,不會將用戶任何聊天內(nèi)容用于大數(shù)據(jù)分析;支付寶因用戶查看年度賬單時“被同意”收集個人信息,被國家網(wǎng)信辦約談;百度則回應江蘇消協(xié)稱,旗下手機應用沒有能力、也從來不會申請監(jiān)聽用戶電話。
數(shù)據(jù)作為大數(shù)據(jù)產(chǎn)業(yè)中的核心資源,已成為各家企業(yè)、平臺的爭奪對象。為采集數(shù)據(jù),眾多網(wǎng)站平臺、聯(lián)網(wǎng)設備、應用軟件“各出奇招”。有網(wǎng)友質(zhì)疑,連手電筒應用都要求讀取手機通訊錄、使用麥克風和攝像頭,實在不合理。
“究其原因,是因為數(shù)據(jù)變得值錢了”。九次方大數(shù)據(jù)創(chuàng)始人、貴陽大數(shù)據(jù)交易所執(zhí)行總裁王叁壽說,大數(shù)據(jù)是海量數(shù)據(jù)的聚合,沒有數(shù)據(jù),大數(shù)據(jù)如同無源之水。合法企業(yè)通過用戶數(shù)據(jù)提供精準、便捷的個性化服務,從而實現(xiàn)商業(yè)變現(xiàn),讓大數(shù)據(jù)產(chǎn)業(yè)有利可圖。
除了政府開放的數(shù)據(jù)和企業(yè)自身收集的數(shù)據(jù),數(shù)據(jù)交易也是數(shù)據(jù)的重要來源,但也在某種程度上催生了黑色產(chǎn)業(yè)鏈。據(jù)業(yè)內(nèi)人士介紹,正規(guī)數(shù)據(jù)交易市場的交易額約為100億元,而數(shù)據(jù)黑市的交易額度則龐大得多,盈利狀況也很好。
王叁壽介紹,正規(guī)交易的數(shù)據(jù)需要經(jīng)過采集、清洗、脫敏、脫密、融合等流程,保障了數(shù)據(jù)的合法性、真實性和安全性,成本也相應提高。但黑市交易的大部分數(shù)據(jù)多由內(nèi)鬼或黑客竊取得來,幾乎是無本萬利。比如,正規(guī)渠道的人臉識別數(shù)據(jù)價格為每條0.1元,而黑市上只需花1分錢就能獲取同樣的數(shù)據(jù)。
去年3月,某知名電商內(nèi)部員工被捕,因其涉嫌盜取涉及交通、物流、醫(yī)療、社交、銀行等個人信息50億條并在網(wǎng)絡黑市販賣;去年11月,深圳警方在華強北某投資咨詢公司查獲上千份公民征信報告,循線追查出售賣者為某商業(yè)銀行深圳分行信貸部職員。2016年發(fā)布的一項調(diào)查研究結(jié)果顯示,近七成企業(yè)曾在過去一年內(nèi)遭遇公司內(nèi)部人員竊取或試圖竊取數(shù)據(jù)。
大數(shù)據(jù)技術不斷創(chuàng)新演進,傳統(tǒng)網(wǎng)絡安全技術也面臨嚴峻挑戰(zhàn)?!吨袊髷?shù)據(jù)發(fā)展調(diào)查報告(2017年)》顯示,企業(yè)在選購大數(shù)據(jù)軟件產(chǎn)品時,產(chǎn)品安全性和穩(wěn)定性成為最重要的考慮因素。業(yè)內(nèi)人士指出,大數(shù)據(jù)背景下的攻擊者通過人工智能、機器學習等新技術對攻擊工具進行升級,提高網(wǎng)絡攻擊的精確度和隱蔽性。安全保護技術手段亟待強化更新,構建更可靠、更有效的大數(shù)據(jù)安全保障技術體系。
網(wǎng)站和手機應用越界收集用戶數(shù)據(jù),根本原因是為了追逐商業(yè)利益。企業(yè)收集用戶數(shù)據(jù)時,要尊重用戶的知情權、退出權和自由選擇權。要明確大數(shù)據(jù)和個人信息之間的關系:個人信息屬于隱私權范疇,而大數(shù)據(jù)一部分來源于個人信息,但本質(zhì)是知識產(chǎn)權。
現(xiàn)階段,數(shù)據(jù)黑市問題嚴重,反映出《網(wǎng)絡安全法》落實尚未到位,在制度上、人員上、技術防控上還有很大差距。立法不代表問題完全解決,還要加大力度、嚴格執(zhí)行,技術上也要配合跟進,一步一個腳印,切實提高網(wǎng)絡安全水平。
——中國政法大學傳播法研究中心副主任朱巍