當前位置: 華文世界 > 科技

孕期家庭分、幼兒家庭分、婚戀意願分……營運商的數據生意經

2024-09-06科技

來源:@21世紀經濟報道微博

「手機號對應的使用者所屬家庭是孕期家庭的可能性,分數越高,可能性越大。」

這是登記在上海數據交易所裏,一則名為「孕期家庭辨識評分」數據產品的說明,輸入電話號碼、姓名、身份證,可輸出對應0~150分值的孕期家庭分數,以及20個數據維度的解釋。

點進產品列表,頗令人在意的還有幼兒家庭辨識評分、婚戀意願強度模型、工作地理位置辨識……產品功能均為查詢某種身份標簽,背後的開發者是中國移動「梧桐風控」。6月份,記者查詢時,價格在0.9元/次~1.35元/次,8月份查詢時,該類產品價格變為「面議」。

近些年,使用者對社交平台的數據交易愈加敏感,但對營運商的印象還停留於「辦卡辦寬頻」。營運商大數據變現,這塊隱秘的蛋糕很少被端上桌面。

去年三大營運商共收入近1.9萬億元,光中國移動的客戶覆蓋面已經接近10億。今年8月釋出的半年報中,中國移動首次將數據資源作為資產入表,入表金額達到7000萬元。

從采集傳輸到儲存計算,數據流通的每一個環節都需要通訊營運商的支撐。修一條路,能跑的只是交通行業這一個行業車子,而在營運商網絡上跑的,是十多億使用者的整個數碼化世界。

百億級賽道

互聯網平台用演算法挖掘使用者資訊已經不是新鮮事。但真正的數據「富商」——營運商卻往往隱匿於公眾感知不到的角落「悶聲發大財」。

營運商手裏有哪些使用者數據,如何分析出如此多資訊?

不願具名的營運商內部人士告訴記者, 這類大數據產品主要依仗的是營運商三要素:電話號碼和真實匹配的姓名、身份證號。 在三要素基礎上,再結合營運商手中的其他數據進行數據建模。

拿「幼兒家庭辨識分」為例,中國移動有親情副卡或者針對小學生的校園電話卡,辦卡登記的資訊經過存檔後,稍加交叉比對,便能描摹出一條手機號背後的家庭網絡。「準確率很高」,前述內部人士說。

浙江移動大數據中心的傅一平曾公開撰文指出,大多身份資訊可以透過大資料探勘出來,比如依托親情網、依托一群人每天在同一地點連WiFi的位置資訊,營運商可以分析出比手動錄入更加靠譜的身份數據,他認為這是營運商的王牌資源之一。

另外一類重要的營運商數據是上網內容。

不同於各大APP收集數據的邏輯,營運商收集數據的技術叫DPI。想象一下,DPI像是站在網絡路口的交警,不僅能看到每一輛「過路車」的來源地、目的地,並且能深入檢查車裏攜帶的數據內容。

盡管許多網站現在會使用加密協定(比如Https開頭的網站),讓營運商無法輕易窺探使用者在網站裏到底搜過什麽、看過什麽,但使用者的上網流量流向哪些APP、存取了哪些網站,這類基本的上網活動都可以被營運商追溯。

公開資料顯示,2017年,僅浙江地區的移動DPI記錄就超過每天700億條,一天的位置信令打點數據上百億。如果把數據比作新石油,那營運商可以算得上最大礦主之一。

「組合拳」風險

手握通訊網的營運商,握有優質資源。中原證券指出,營運商掌握C端、B端、G端的優質數據資源,受益於數據要素全產業鏈的價值釋放。在中國數據要素市場高質素發展中,營運商掌握的數據價值逐步獲得充分定價,有望迎來收入和估值雙升。

市場的期待也很直觀。去年8月21日,數據資產入表的正式規定剛剛落地,三大通訊營運商股價集體走強,增幅均在3%以上。

但是龐大的數據如何合規開采,是一塊燙手山芋。

「我們的數據不能出網」,前述內部人員在采訪中向21記者反復提及。雖然有豐富的數據石油,但根據工信部【電信和互聯網使用者個人資訊保護規定】的規定,營運商的原始數據,尤其是個人手機號,不能直接對接外部系統。 所謂數據交易,交易的並非數據,而是一個個包裝過的數據產品。

多家下遊套用端的大數據公司告訴記者,一類最常見的數據產品就是使用者標簽,主要是為了滿足合規要求,避免精確定位到個人資訊。比如前文提到的孕期可能性高、工作位置離查詢位置為1~3公裏,都屬於標簽型數據。

從法律角度來看,中國【個人資訊保護法】(下稱【個保法】)的確不保護使用者標簽或畫像。這是因為【個保法】的底層邏輯為:如果數據不能辨識到個人,就不屬於個人資訊。

比如,一條數據顯示張三的孕期可能性高,但並不足以在人群中找出張三是誰,因此把數據分享給其他人不需要向張三單獨申請同意,相當於為大數據行業的發展留出了一定空間。

但預測使用者的身份特征,尤其涉及到家庭、孕期,讓人難以卸下擔憂,這樣的標簽產品足夠安全可靠嗎?

觀韜中茂律師事務所合夥人吳丹君告訴21記者,盡管【個保法】未對使用者畫像和使用者標簽作出直接規定,但並不意味著可以隨意分析,使用者畫像仍然可能涉及非法收集或交易個人資訊。

在2023年北京互聯網法院審理的一起案件中,求職者送出的求職期待、學歷背景、婚姻狀況等使用者畫像,均認定為個人資訊。法院在判決書中尤其強調了多種數據組合起來的效果: 「雖然單獨來看未達到辨識特定自然人的程度,但在本案的套用場景中,上述資訊組合賬戶名、賬戶號碼,仍可對應到原告這一特定身份的自然人。」

吳丹君說,使用者畫像的合規關鍵仍然在於能否指向特定個人。如果屬於個人資訊,那麽交易前需要說明目的、處理方式、數據種類,並取得使用者的單獨同意才行。

21記者因此翻閱了三大營運商APP的個人資訊保護政策,在共享和交易資訊方面,基本采取的是一攬子授權。中國移動、中國聯通的條款寫道平台分析和使用使用者畫像,無需得到使用者特許。

TalkingData總法律顧問兼數據合規官葛夢瑩向21記者指出,目前的法律法規的確沒有限定,某類內容是絕對禁止數據分析的。不過【APP違法違規收集使用個人資訊自評估指南】特別指出,如果將個人資訊用於使用者畫像,需要明確說明套用場景以及對使用者產生的影響。記者同樣未在營運商APP的使用者協定中看到相關說明。

在一位不願具名的數碼法學者看來,透過用大數據去預測使用者社會身份,或者給使用者的家庭、孕期等身份特征標簽打分,涉及人格尊嚴和人身安全等核心利益,甚至有可能被劃分為敏感個人資訊。 如果屬於敏感個人資訊,這套數據交易則更加難以考過「合規線」。

大數據變現 營運商的糾結與混亂

進一步深究,在合規邊緣遊走,營運商的一部份挑戰來自組織管理。

在過去五年中,浙江移動大數據中心負責數據管理的傅一平反復提到一個難題:集中化營運。

一直以來,營運商數據都是分省營運、分省隔斷,背後的邏輯不難理解:對於傳統業務「辦卡辦寬頻」,將數據和銷售隊伍下沈於各省市,能夠小步快跑,靈活擴張。但大數據開發要求集中技術、人力、數據,「撒胡椒面」式的傳統組織結構便不再合適。

傅一平曾經舉了一個現例項子,「如果金融客戶找中國移動合作(手機號)驗真業務,要一家家談。營運商可是有90多個獨立的經營單位,哪家全國客戶都受不了跟90多家省公司去談一個驗真業務,這些營運單位也不大可能都有對應的大數據營運組織,並打造與之配套的流程、人員和產品體系。」

正因如此, 電信、聯通較早就建立了集團層面的大數據公司,統一對外數據變現。而覆蓋了10億客戶的營運商「老大」中國移動,可謂巨輪掉頭難—— 公開資料顯示,中國移動直到2018年才正式官宣中移資訊科技有限公司,專門推進大數據服務,並且2021年才推出大數據品牌「梧桐大數據」。

前述移動內部人士就職於某中部省級移動公司,根據他的解釋,「梧桐大數據」擁有全國數據,省公司如果需要跨省數據,需要向集團申請接入梧桐大數據,可以自己開發數據產品,也可以用集團分發的數據產品。

熟悉三大營運商的技術人士告訴21記者,直到今天,也只有聯通大數據由聯通數科統一建設。

中國聯通告訴21記者, 公司的大數據集中儲存,數據業務統一受理,也就是說任何業務需求都需要透過集團平台統一評估和處理,以此減少各地人員素質參差、合規標準不同的局限。

而據前述技術人士透露,中國移動可以說是在集中式和分布式中搖擺,目前采取是兩級管理制:集團掌握全國數據,授權數據使用,省公司自行制定標準。天眼查數據顯示,中國行動通訊集團100%投資的子公司達到36個。這意味著,起碼36個省級移動公司和其他專業子公司,都能參與建設大數據產品。

記者看到的婚戀意願強度模型,分別由中國移動上海有限公司、廣州有限公司在兩地交易所上架。而幼兒家庭辨識分、孕期家庭辨識分,目前只有中移上海公司提供。

截至發稿,中國移動未回復21記者的問詢。

「滿足公司的研發指標吧,讓報告好看一點」。前述移動內部人士看到幼兒家庭辨識分產品時,第一反應是發出如此感慨。他無奈地解釋,自己所在省公司的研發部門,每年就有一定的產品開發指標。

在這種模式下,地方公司的一線業務人員也背負著銷售指標,難免出現動作變形。比如前文提到的用「序列號」方式交易手機號,就是業務人員應對政企大客戶的取巧方法。對於大數據交易而言,無疑意味著更多隱患。

(作者:肖瀟 編輯:王俊)