開放引擎平臺 百度欲推「革命」(圖)
匯聚用戶數據 平臺能否善用?
百度正式宣布推出「大數據引擎」,平臺如何善用 百度能否掌控?(網路圖片)
【看中國2014年04月29日訊】隨著目前IT業的「大數據」理念對各行業帶來的衝擊越來越廣,如何保護私人數據的安全也越來越被普通用戶所關注。
在4月24日第四屆技術開放日上,百度正式宣布推出「大數據引擎」(該引擎包括開放雲、數據工廠、百度大腦三層核心平臺),將打造一個開放平臺,採取邀請制和免費模式,吸引通信、金融、物流、製造、農業等行業擁有海量數據卻不知如何處理的傳統企業進駐,為這些公司提供存儲、關聯、分析大數據的能力。
據悉,百度「大數據引擎」的開放是漸進式的,目前主要與政府、非政府組織、製造、醫療、金融、零售和教育等傳統領域率先展開合作。百度CEO李彥宏表示:未來會有更多行業被捲入,而且被捲入的速度越來越快,是一個加速發展的過程,將產生一場新的工業革命。
換句話說,百度在為這些行業免費提供存儲、關聯、分析等大數據處理能力的同時,也獲取了豐厚的回報---即獲取了這些行業的所有數據,其中包括許多普通用戶的私人數據。通過運營這些數據內容,百度可以打造多個商業模式進行高額盈利,例如網際網路廣告等等。
匯聚用戶數據 平臺安全堪憂
據悉,國家交通運輸管理部已表示,將把應用遷移至百度開放雲平臺;中國疾病高預防控制中心也將結合疾控大數據和百度大數據,建成中國首個流感預測系統。與此同時,普通用戶乘坐飛機、火車等交通工具的出行數據,以及用戶自己的健康數據,也都將被集中到百度的平台上。
以此類推,後續一旦通信、金融、交通、醫療、教育、製造、物流等政府機構部門都入駐百度平臺,那麼除了上述的交通數據和健康數據以外,各政府部門掌握的普通用戶個人的銀行數據、醫療數據、教育信息、消費信息、通訊錄等各種隱私信息,也都會被集中到百度平台上。百度的「大數據引擎」將為各政府部門提供存儲、關聯、分析等一系列大數據處理能力。
據悉,「大數據引擎」包括開放雲、數據工廠、百度大腦三層核心平臺,其中最核心的平臺是百度大腦。借用圖靈獎獲得者 N.Wirth(沃斯)提出的「程序 = 數據結構 +演算法」的理論,那麼如果說百度「大數據引擎」是一個程序,它的數據結構就是「開放雲」+「數據工廠」,而演算法則對應到「百度大腦」。百度大腦將把百度在深度學習和大規模機器學習的能力,開放給這些入駐百度平臺的政府部門。百度大腦能自動識別語音、圖像、文本,並理解自然語言和語義,目前已經可以模擬到兩三歲嬰兒的智力水平。
一旦這些政府部門入駐百度平臺,從一方面看,這些政府部門可以獲取百度「大數據引擎」的能力,這將極大的提高工作效率,並會取得一些突破性的進展,如建成中國首個流感預測系統等。
但從另一方面看,如此之多的用戶數據一旦都集中到百度平台上,將有可能帶來另外的致命風險。4月8日剛剛發生的OpenSSL的安全漏洞Heartbleed(心臟在流血)殃及全球,只要使用了https協議的網站幾乎無一倖免,至今讓人仍心有餘悸。國內受影響的公司更是不計其數,如微信、淘寶、支付寶、QQ平臺、網銀等等,百度的伺服器也在其中。在這次危機中許多用戶的信用卡信息被泄露,但網站卻無法知道是誰竊取了用戶信息,也無法追究追究法律責任。
此外,除了技術原因導致用戶數據泄露外,百度作為一個非政府部門的第三方網際網路公司,是否有權利跨過用戶的許可,通過政府部門入駐其平臺的方式,直接獲取如此之多的用戶私人數據?以及在其運用「大數據引擎」關聯、分析這些用戶數據後,是否能不濫用、不公開其獲得的分析結果(包括對北京政府也不公開其分析結果)?對這些問題李彥宏在4月24日的技術開放日上都沒有做出說明,而這一點正是普通用戶和媒體關注的核心。
百度騰訊聯手 用戶再無隱私?
在百度推出「大數據引擎」平臺之前,普通用戶的數據是被分散存儲在通信、金融、交通、醫療、教育等各部門的資料庫中,如果因為某個目的去查詢、關聯或分析單個用戶的數據,會涉及到授權和不同資料庫訪問等問題,難度很大;一旦各部門入駐百度平臺,用戶數據也都會被集中同步到百度的資料庫中,以獲取百度「大數據引擎」的處理分析能力,這樣可以迅速彙集該用戶所有的重要信息,以及未來他(她)可能要做的事情。
例如,某用戶目前的個人檔案信息存放在人才交流中心,健康信息存放在醫院,金融信息存放在銀行,學歷信息存放在教育部,親屬關係信息存放在公安局或派出所,出行信息存放在交通運輸管理部,聯繫人信息存放在移動通訊公司,等等;一旦這些部門都入駐百度平臺,這些個人信息都會被同步存放到百度的資料庫。然後百度的「大數據引擎」可以對這些數據進行關聯和分析,一旦這個用戶成為查詢的目標------不管是「防禦疫情」還是「新聞審查」,都能迅速的定位該用戶的所有信息。
按照李彥宏的構想,在免費吸引上述政府及傳統行業部門入駐百度平臺之後,下一步將吸引更多的其他大型行業公司入駐百度平臺,例如另一網際網路巨頭騰訊公司。可以想像,如果擁有7億微信用戶(5億國內用戶)的騰訊和百度聯手,百度的「大數據引擎」將可能知道這7億用戶幾乎所有的秘密。
而這個結果對個人用戶來說,不論是國內用戶還是國外用戶,都將無法接受,因為這將會侵犯用戶的隱私權利。Google公司力推的新品Google眼鏡,從推出到現在始終招到質疑,而且目前被多家咖啡館、餐廳禁止使用,原因就是該產品攜帶的拍照、攝像、錄音等功能,能迅速記錄他人隱私信息。Facebook新推出的廣告系統「Facebook AudienceNetwork」,能利用facebook平台上存放的用戶數據,幫助廣告商對用戶的環境定向投放廣告,儘管深受廣告商的好評,但也因為未經用戶許可而使用了用戶數據遭到用戶和媒體的公開指責。
平臺如何善用 百度能否掌控?
因此,對於百度開放「大數據引擎」平臺,並吸引了大量政府部門入駐,後續如何使用這個平臺將成為關鍵。從一方面看,對於用戶個人的隱私信息,民眾都希望儘可能防止泄露,以避免不必要的損失和傷害。另一方面,對於關係到大眾利益、國計民生的重大社會事件,民眾則希望能第一時間瞭解真相。這些都將考驗百度是否能善用這個平臺,是否能把民眾的利益放在第一位。
有分析人士認為,百度作為一個網際網路公司,如果能夠彙集大多數政府部門的數據到其平台上,並利用「大數據引擎」為各個部門提供統一的存儲、關聯、分析服務,在目前大陸嚴格把控網際網路信息的環境下,將是極其罕見的。
例如,4月17日,網路紅人秦志暉(網名"秦火火")因在網上轉發了幾條不實的信息,被以尋釁滋事罪判處有期徒刑3年。
然而反過來看,即使在新聞信息寬鬆的美國,也沒有一個網際網路公司能把通信、金融、交通、醫療、教育、製造、物流等政府部門或機構的數據彙集到一個平臺。然而百度在開放「大數據引擎」平臺後,立刻就有國家交通運輸管理部和中國疾病高預防控制中心宣布進駐。這場百度新推的「工業革命」後續會如何發展,媒體將持續關注。