不信謠不傳謠 講文明樹新風 網絡安全
首頁 新聞 國內

你的隱私,大數(shù)據怎知道?我們又該如何自我保護?

2023-01-12 08:55 來源:光明日報 責任編輯:徐明霞
發(fā)送短信 zmdsjb 10658300 即可訂閱《駐馬店手機報》,每天1毛錢,無GPRS流量費。

摘要:換句話說,大數(shù)據是很值錢的“垃圾”。對于個人的網絡行為而言,在大數(shù)據時代,應該如何保護隱私呢?也就是說,在大數(shù)據技術出現(xiàn)之前,隱私就是把“私”藏起來,個人身份可公開,而大數(shù)據時代,隱私保護則是把“私”公開(實際上是沒法不公開),而把個人身份隱藏起來,即匿名。

在網絡上,每個人都會或多或少,或主動或被動地泄露某些碎片信息。這些信息被大數(shù)據挖掘,就存在隱私泄露的風險,引發(fā)信息安全問題。面對洶涌而來的5G時代,大眾對自己的隱私保護感到越來越迷茫,甚至有點不知所措。那么,你的隱私,大數(shù)據是怎么知道的呢?大家又該如何自我保護呢?

1.“已知、未知”大數(shù)據都知道

大數(shù)據時代,每個人都有可能成為安徒生童話中那個“穿新衣”的皇帝。在大數(shù)據面前,你說過什么話,它知道;你做過什么事,它知道;你有什么愛好,它知道;你生過什么病,它知道;你家住哪里,它知道;你的親朋好友都有誰,它也知道……總之,你自己知道的,它幾乎都知道,或者說它都能夠知道,至少可以說,它遲早會知道!

甚至,連你自己都不知道的事情,大數(shù)據也可能知道。例如,它能夠發(fā)現(xiàn)你的許多潛意識習慣:集體照相時你喜歡站哪里呀,跨門檻時喜歡先邁左腳還是右腳呀,你喜歡與什么樣的人打交道呀,你的性格特點都有什么呀,哪位朋友與你的觀點不相同呀……

再進一步說,今后將要發(fā)生的事情,大數(shù)據還是有可能知道。例如,根據你“飲食多、運動少”等信息,它就能夠推測出,你可能會“三高”。當你與許多人都在獨立地購買感冒藥時,大數(shù)據就知道:流感即將暴發(fā)了!其實,大數(shù)據已經成功地預測了包括世界杯比賽結果、股票的波動、物價趨勢、用戶行為、交通情況等。

當然,這里的“你”并非僅僅指“你個人”,包括但不限于,你的家庭,你的單位,你的民族,甚至你的國家等。至于這些你知道的、不知道的或今后才知道的隱私信息,將會把你塑造成什么,是英雄還是狗熊?這卻難以預知。

2.數(shù)據挖掘就像“垃圾處理”

什么是大數(shù)據?形象地說,所謂大數(shù)據,就是由許多千奇百怪的數(shù)據,雜亂無章地堆積在一起。例如,你在網上說的話、發(fā)的微信、收發(fā)的電子郵件等,都是大數(shù)據的組成部分。在不知道的情況下被采集的眾多信息,例如被馬路攝像頭獲取的視頻、手機定位系統(tǒng)留下的路線圖、駕車的導航信號等被動信息,也都是大數(shù)據的組成部分。還有,各種傳感器設備自動采集的有關溫度、濕度、速度等萬物信息,仍然是大數(shù)據的組成部分。總之,每個人、每種通信和控制類設備,無論它是軟件還是硬件,其實都是大數(shù)據之源。

大數(shù)據利用了一種名叫“大數(shù)據挖掘”的技術,采用諸如神經網絡、遺傳算法、決策樹、粗糙集、覆蓋正例排斥反例、統(tǒng)計分析、模糊集等方法挖掘信息。大數(shù)據挖掘的過程,可以分為數(shù)據收集、數(shù)據集成、數(shù)據規(guī)約、數(shù)據清理、數(shù)據變換、挖掘分析、模式評估、知識表示等八大步驟。

不過,這些聽起來高大上的大數(shù)據產業(yè),幾乎等同于垃圾處理和廢品回收。

這并不是在開玩笑。廢品收購和垃圾收集,可算作“數(shù)據收集”;將廢品和垃圾送往集中處理場所,可算作“數(shù)據集成”;將廢品和垃圾初步分類,可算作“數(shù)據規(guī)約”;將廢品和垃圾適當清潔和整理,可算作“數(shù)據清理”;將破沙發(fā)拆成木、鐵、布等原料,可算作“數(shù)據變換”;認真分析如何將這些原料賣個好價錢,可算作“數(shù)據分析”;不斷總結經驗,選擇并固定上下游賣家和買家,可算作“模式評估”;最后,把這些技巧整理成口訣,可算作“知識表示”。

再看原料結構。大數(shù)據具有異構特性,就像垃圾一樣千奇百怪。如果非要在垃圾和大數(shù)據之間找出本質差別的話,那就在于垃圾是有實體的,再利用的次數(shù)有限;而大數(shù)據是虛擬的,可以反復處理,反復利用。例如,大數(shù)據專家能將數(shù)據(廢品)中挖掘出的旅客出行規(guī)律交給航空公司,將某群體的消費習慣賣給百貨商店等??傊?,大數(shù)據專家完全可以“一菜多吃”,反復利用,而且時間越久,價值越大。換句話說,大數(shù)據是很值錢的“垃圾”。

3.大數(shù)據挖掘永遠沒有盡頭

大數(shù)據挖掘,雖然能從正面創(chuàng)造價值,但是也有其負面影響,即存在泄露隱私的風險。隱私是如何被泄露的呢?這其實很簡單,我們先來分解一下“人肉搜索”是如何侵犯隱私的吧!

一大群網友,出于某種目的,利用自己的一切資源渠道,盡可能多地收集當事人或物的所有信息;然后,將這些信息按照自己的目的提煉成新信息,反饋到網上與別人分享。這就完成了第一次“人肉迭代”。

接著,大家又在第一次人肉迭代的基礎上,互相取經,再接再厲,交叉重復進行信息的收集、加工、整理等工作,于是,便誕生了第二次“人肉迭代”。如此循環(huán)往復,經過多次不懈迭代后,當事人或物的畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經證實,至少主體是事實,“人肉搜索”就成功了。

幾乎可以斷定,只要參與“人肉搜索”的網友足夠多,時間足夠長,大家的毅力足夠強,那么任何人都可能無處遁形。

其實,所謂的大數(shù)據挖掘,在某種意義上說,就是由機器自動完成的特殊“人肉搜索”而已。只不過,這種搜索的目的,不再限于抹黑或頌揚某人,而是有更加廣泛的目的,例如,為商品銷售者尋找最佳買家、為某類數(shù)據尋找規(guī)律、為某些事物之間尋找關聯(lián)等??傊灰康拿鞔_,那么,大數(shù)據挖掘就會有用武之地。

如果將“人肉搜索”與大數(shù)據挖掘相比,網友被電腦所替代;網友們收集的信息,被數(shù)據庫中的海量異構數(shù)據所替代;網友尋找各種人物關聯(lián)的技巧,被相應的智能算法替代;網友們相互借鑒、彼此啟發(fā)的做法,被各種同步運算所替代。

各次迭代過程仍然照例進行,只不過機器的迭代次數(shù)更多,速度更快,每次迭代其實就是機器的一次“學習”過程。網友們的最終“滿意畫像”,被暫時的挖掘結果所替代。之所以說是暫時,那是因為對大數(shù)據挖掘來說,永遠沒有盡頭,結果會越來越精準,智慧程度會越來越高,用戶只需根據自己的標準,隨時選擇滿意的結果就行了。

當然,除了相似性外,“人肉搜索”與“大數(shù)據挖掘”肯定也有許多重大的區(qū)別。例如,機器不會累,它們收集的數(shù)據會更多、更快,數(shù)據的渠道來源會更廣泛??傊?,網友的“人肉搜索”,最終將輸給機器的“大數(shù)據挖掘”。

4.隱私保護與數(shù)據挖掘“危”“機”并存

必須承認,就當前的現(xiàn)實情況來說,大數(shù)據隱私挖掘的“殺傷力”,已經遠遠超過了大數(shù)據隱私保護的能力;換句話說,在大數(shù)據挖掘面前,當前人類有點不知所措。這確實是一種意外。自互聯(lián)網誕生以后,在過去幾十年,人們都不遺余力地將碎片信息永遠留在網上。其中的每個碎片雖然都完全無害,可誰也不曾意識到,至少沒有刻意去關注,當眾多無害碎片融合起來,竟然后患無窮!

不過,大家也沒必要過于擔心。在人類歷史上,類似的被動局面已經出現(xiàn)過不止一次了。從以往的經驗來看,隱私保護與數(shù)據挖掘之間總是像“走馬燈”一樣輪換的——人類通過對隱私的“挖掘”,獲得空前好處,產生了更多需要保護的“隱私”,于是,不得不再回過頭來,認真研究如何保護這些隱私。當隱私積累得越來越多時,“挖掘”它們就會變得越來越有利可圖,于是,新一輪的“挖掘”又開始了。歷史地來看,人類在自身隱私保護方面,整體處于優(yōu)勢地位,在網絡大數(shù)據挖掘之前,“隱私泄露”并不是一個突出的問題。

但是,現(xiàn)在人類需要面對一個棘手的問題——對過去遺留在網上的海量碎片信息,如何進行隱私保護呢?單靠技術,顯然不行,甚至還會越“保護”,就越“泄露隱私”。

因此,必須多管齊下。例如從法律上,禁止以“人肉搜索”為目的的大數(shù)據挖掘行為;從管理角度,發(fā)現(xiàn)惡意的大數(shù)據搜索行為,對其進行必要的監(jiān)督和管控。另外,在必要的時候,還需要重塑“隱私”概念,畢竟“隱私”本身就是一個與時間、地點、民族、文化等有關的約定俗成的概念。

對于個人的網絡行為而言,在大數(shù)據時代,應該如何保護隱私呢?或者說,至少不要把過多包含個人隱私的碎片信息遺留在網上呢?答案只有兩個字:匿名!只要做好匿名工作,就能在一定程度上,保護好隱私了。也就是說,在大數(shù)據技術出現(xiàn)之前,隱私就是把“私”藏起來,個人身份可公開,而大數(shù)據時代,隱私保護則是把“私”公開(實際上是沒法不公開),而把個人身份隱藏起來,即匿名。

(作者:楊義先、鈕心忻,均為北京郵電大學教授)

責任編輯:徐明霞

查看心情排行你看到此篇文章的感受是:


  • 點贊

  • 高興

  • 羨慕

  • 憤怒

  • 震驚

  • 難過

  • 流淚

  • 無奈

  • 槍稿

  • 標題黨

版權聲明:

1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發(fā)現(xiàn),本網將授權常年法律顧問予以追究侵權者的法律責任。

駐馬店日報報業(yè)集團法律顧問單位:上海市匯業(yè)(武漢)律師事務所

首席法律顧問:馮程斌律師

2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。

3.如果您發(fā)現(xiàn)本網站上有侵犯您的知識產權的作品,請與我們取得聯(lián)系,我們會及時修改或刪除。

返回首頁
相關新聞
返回頂部