當前位置: 華文世界 > 科技

壽曉明|演算法信任的流程治理體系重塑——以數據交易場景為例

2024-02-21科技

技術+法律的數位法治模式正逐漸成為共識,數據交易市場化還是法治化都離不開技術套用的支持。反之,技術價值得不到規則層面的確認,技術開發也會因缺乏合法性而失去發展動力。演算法信任的基石應當是數據演算法公信力,依靠國家政府對演算法的監管構造公信力,以國家數據局作為監管演算法的核心機構,國家數據局應當根據數據交易的特定場景制定相應的演算法監管內容和標準,對演算法進行全流程監管。在演算法公信力的基礎之上,數據交易各方應當建構演算法合約自治性,從數據交易的全流程出發,以資料來源、數據交易平台、數據交易中建構合約自治性,實作數據交易的契約精神。最後,則是回歸數據交易的演算法技術本質,從演算法全流程中建構機器演算法技術性,從演算法流程的獲取、分析和套用階段進行演算法的技術剖析,從而從底層邏輯建構對演算法的技術信任。

在數位交易市場中企業的重要策略性行為往往由數據和演算法所驅動,這是數位市場與傳統市場中策略性行為的重大差異。隨著數據采集和處理技術的不斷突破,數據體量無窮膨脹,數據交易場景呈現越來越強的多樣性和復雜性,數據權屬及利益分配很難由幾部法律和檔來清晰規定。同時,基於權力內容,演算法權力借助深度學習技術,肆意擴張,這種內生性的風險與外部的不可控引發了演算法極權、打破權力——權利格局平衡、引發主體危機等諸多異化風險。因此,迫切需要對數據交易和演算法引入科學合理的規制。演算法具有自動性、隱秘性等特點,既要考慮這些特點對規制帶來的挑戰,又要避免規制對創新造成不必要的傷害。從更寬廣的視野來看,需要建立一個基於場景並嵌入未來的數據交易體系以及相應的演算法問責體系,這與工業經濟時代所建立的產權體系具有同樣的基礎性意義。在演算法決策套用中有必要區分人工決策和演算法決策的合理場域,構建二者區分標準並協調和最佳化決策機制。因此,對數據和演算法進行規制,應該成為數位經濟、數位社會中的關鍵性規制議題。對數據和演算法的規制不應該扼殺創新的推進和社會福利的提高。而技術的革命性與顛覆性,場景的豐富性和復雜性,使得規制在興利與除弊之間的平衡變得非常困難。

一、邏輯基礎:數據交易場景中演算法信任的演算法公信力

演算法監管涉及政治、經濟和法律三個社會子系統,應當透過數據活動顧問這一「介面崗位」實作系統間的結構耦合,從而借助系統間的協力有效監管演算法活動。當前數據交易則分為場內交易和場外交易,但無論哪種交易方式由於數據牽涉到個體、社會、國家等各個層面的利益,數據交易必定需要依靠國家進行監管。當演算法嵌入到數據交易這個特定場景中時,由於演算法權力自身的特性足以異化數據交易這個領域,其產生的風險足以使得整個數位社會的信任機制完全崩壞。對於演算法不進行相應的監管,不把演算法權力裝進法律的籠子中則難以建構信任基石,演算法透過國家層面對其加以監管,使得社會對於演算法憑借國家公信力得以建立長久信任,國家對於演算法的監管使得演算法權力被約束在合理限度之內。使得演算法可以秉持技術中立性發揮其數位技術獨有的工具作用,演算法公信力作為數據交易中演算法信任的底層基礎,是整個演算法信任的前提要件,以國家政府作為演算法技術中立性的保障,從而使數據交易各方從主觀上建構起對演算法的信任,從而維護數據交易的安全和公平,發揮數據在數位經濟中的生產要素作用。

(一) 數據交易場景中演算法公信力的法理邏輯

政府公信力的建立來源於民眾對於政府的信任,公信力則是指在社會公共生活中,公權力面對時間差序、公眾交往和利益交換所表現出的一種公平、正義、效率、人道、民主、責任的信任力。數位社會中,國家政府的重要任務便是保障演算法自動化決策秉持其技術中立性,維護這種自動化決策的公平性作為核心要點,使得演算法做出影響個體具體權利義務的行為時可以不違背基本的公平原則。伴隨著人工智慧的快速發展以及演算法權力的崛起,個體難以抗衡演算法權力帶來的風險,個體在演算法面前則處於弱勢地位,甚至在一定程度上演算法權力已經開始異化個體在法律上的主體地位。由於個體的弱勢地位,政府成為抵擋演算法權力和承擔演算法風險損害結果的最後屏障。政府作為個體基於社會契約建立起的公眾信任體,作為廣大民眾共同推選的產物,滿足公共利益的需求是政府公共行政在理論上唯一的目標。

根據行政法基本原則中的高效便民、權責統一等內容,政府在數據交易中應當充當對演算法權力的規制角色,從而保證數據交易的公平胡安全以維護公共利益。數據交易是演算法商業自動化決策重要領域之一。演算法自動化決策和大數據交易的雙重融合,使其對於整個交易市場的公平性帶來了極大的挑戰。演算法和數據的融合,使得商業平台具有了上帝視角。執法者需要對數據交易的全過程進行流程化監管,對於演算法在數據交易中的運用采取流程化監管。在政府的全流程監管之下,演算法發揮其技術中立性的工具作用,平衡交易各方的權利義務,從而實作數據的流通利用。由於演算法和數據互相的深度融合,在數據交易這個數據資源整合共享和開發利用的重要環節,國家數據局應當作為政府對數據交易的演算法進行監管,從而建構數據演算法公信力。

(二) 數據交易場景中演算法公信力的監管內容

在數據交易這個特定場景中,國家數據局作為國家對演算法的監管部門,可對數據和演算法進行雙重監管。「法律的監管功能要求它具有廣泛的可預測性。」對演算法自動化決策進行監管的功能作用便是開啟黑箱,而在演算法黑箱中的哪些元素需要接受演算法監管,則是國家數據局的重要職能之一。畢竟,無論法律賦予監管第三方或者數據交易平台對演算法進行監管,由於監管第三方並沒有法律賦予的懲戒職能,而數據交易平台的自我監管則由於利益牽涉可能只是形式審查,都難以對演算法做到真正有效的監管。而國家數據局則可以作為監管第三方和數據交易平台的後援力量,從而形成相應的演算法監管體系。國家數據局對於演算法監管的物件並非演算法的設計資訊,而是具有法律意義的資訊。一個完整的演算法自動化決策監管應當按照相應步驟對演算法內容進行相應的監管,並隨著數據交易流程和內容的不同做出相應調整。

首先,作為監管部門的國家數據局,需要知曉數據交易流程和內容中哪些做法是由演算法的自動化決策做出的。演算法自動化決策的可見性已經逐步成為演算法規制的必要前提。知曉演算法自動化決策的存在,是演算法監管部門啟動演算法監管的前提和基礎;其次,需要對演算法自動化決策的人為因素進行監管。演算法的設計者和使用者在被進行演算法監管時,應當向國家數據局披露演算法中的人為因素。具體內容則包括演算法設計者、使用者和演算法執行的監督第三方和責任方。「在設計和編碼中,程式設計師或設計者可能會試圖以公開或隱蔽的方式嵌入一種邏輯,以使演算法偏向期望的目標。」演算法的設計者名單應當向國家數據局進行披露,演算法設計者名單的披露使得設計者對於演算法的設計必然會考慮到法律責任的承擔,從而在設計和使用中恪守職業倫理和道德,避免設計者和使用者躲在實驗主義的盾牌之後規避法律的監管。同時,對於事後追責可以作為設計是否承擔過錯的證據予以佐證,從而分配事後侵權責任的承擔;再次,則是對演算法的數據進行監管。對於演算法的訓練數據進行審查從而檢測演算法歧視的產生是否是數據偏差導致,從而決定是否能繼續進行監管。面對不同型別演算法歧視存在的技術難題與法理障礙,進一步細化具體型別中的特殊情形,提煉規制重點,將深化對演算法歧視的認知,實作以制衡演算法權力為核心的規制範式重構。而後則是對演算法系統功能的監管,演算法系統功能的監管著重對整體設計和一般因素權重的問題予以化解,對於演算法系統中的意義、邏輯,其範圍涵蓋了系統的決策樹、預定義模型、分類標準和需求規範等內容。系統監管並非要公開演算法的原始碼,而是作為事後演算法解釋的必要內容。在前三項監管失效後,則透過對演算法系統監管尋找問題所在。最後,以演算法決策的具體理由說明為兜底監管,具體理由包括演算法的理由、原因,需要解釋使得相對人可以知曉演算法決策的執行邏輯,也應當為相對人提供修正演算法的具體方法。在演算法對相對人的實體權利、程式權利及救濟權利產生直接具體的影響時,應當對演算法系統的營運流程、營運結果和決策行為做出合理的理由和說明。透過上述的具體監管內容,從而為國家監管局提供演算法監管的具體舉措,同時為數據交易各方在遭受演算法侵權後獲取事後分類救濟提供具體途徑和步驟。監管制度構建應以事先預防為基點,以演算法影響評估制度的完善與演算法審計規則的落實為中心,強化技術監管的協同治理,最終構建起精細化、多層次的監管體系。

(三) 數據交易場景中演算法公信力的監管標準

未來中國演算法治理方案的完善應當秉持技術信任和治理信任同步推進,打造場景化和精細化的演算法監管機制設計。國家數據局在對演算法自動化決策的監管確立具體內容之後,則應當對監管的標準作出指引從而使得監管具有可操作性。演算法自動化決策的監管標準並非技術上的概念,而是對具有法律意義上的資訊的程式性要求和實質理性化的具體規範。因此,不能以國家數據局監管中技術的匱乏和數據交易各方對於演算法專業知識的薄弱作為逃避演算法監管的理由。與此相反的則是要求演算法監管應當基於形式程式標準和實質實體標準作為基準,將法律責任和義務施加演算法設計者和演算法使用者來破解資訊的不對等。從形式程式標準上,國家數據局應當向演算法設計者和演算法使用者提供格式文本,要求他們提供的演算法客體是個完全體,否則應當視為提供無效。對於數據交易各方應當提供具體的理由說明演算法的自動化決策,如果無法提供則視為無理由,從而直接導致演算法的失效。提供書面形式的說明報告,應當保證說明報告可以讓國家監管局和數據交易各方對說明進行理解知曉。送出的書面說明則作為事後追責的證據予以存檔,便於日後分配侵權責任時作為證據予以證明。

在演算法自動化決策的實體實質標準中,對於內容應當符合演算法數據輸入到數據輸出的基本設計,如若演算法不具備數據輸入到輸出的基本原則,那很顯然這樣的演算法是錯誤的。由於其具備法律意義則應當保證內容的清晰明了,提供說明時對各方權利義務會產生直接重大的影響,否則事後救濟則形同虛設。同時提供的說明應當簡潔明了,根據奧卡姆的剃刀原則,演算法的復雜程度應當適宜,過於復雜的內容則由於基於知識鴻溝的存在變得難以理解。提供說明可以提供演算法自動決策的具體數量,應當具有普遍性。出具詳盡完整的說明,可解決各式各樣的具體問題,從而減輕國家數據局和監管第三方的監管負擔。提供的說明應當為數據交易各方提供有效幹預演算法的具體路徑,可以具體指出演算法中數據的偏差和提高演算法自動化決策的具體規程。演算法監管的最終目的是證明演算法的可信任性,透過國家數據局等國家公信力重建社會對演算法的公信力,並為數據交易各方提供事後救濟的法律途徑。

二、流程內核:數據交易場景中演算法信任的合約自治性

在依靠國家政府對演算法的監管,建構演算法的公信力之後,則應當回歸數據交易的整個流程中對數據交易進行規範。「透過制定行政規制、自主規制等,與演算法交易處理相關的各種規則,可以確保市場的公正和公平。」數據交易的起點則是對後設資料的收集,其中對於個人資訊的收集顯得尤為突出,個體的個人資訊基於保護人格權的出發點,應當建構默示知情—明示同意的基本原則,在前台系中作出相應規範。而後台系統中由於演算法的運用使得數據收集者應當對個體承擔更多的責任和義務。在資料來源收集之後的流程則是數據交易平台,要建構數據交易平台的合約自治則需要透過元規制—獨立規制的雙重規制實作,既需要數據交易平台自我的規制,也需要外部獨立監管第三方對數據交易進行監管,數據交易平台則對演算法透過雙重規制從而保障交易的公平性。而數據交易的核心在於數據交易雙方之間的買賣行為,應當建構數據交易相對方的合約自治。由於數據交易的特殊性,對於場外交易的雙方則需要更為嚴格的限制,交易雙方應當向國家數據局提供相應的交易內容以備監管備案,交易雙方之間同樣需要基於合約實作合約自治,建構數據交易的契約精神。

(一) 數據交易場景中資料來源的合約自治

數據交易的起點是資料來源的收集,對於演算法的規制同樣起源於此。收集的後設資料是否侵權則對整個數據交易的合法性有著至關重要的作用。資料來源中的一個重要組成部份是個體手中掌握的個人資訊,個人資訊基於默示知情—明示同意的二階層構造,對個人資訊進行分層授權從而進行收集個人數據。「為了防止傷害,保護資訊不被未經授權披露的義務可以說是家長式的。」數據的生成機制則分為前台系統和後台系統,前提系統主要則是個體和數據收集者的場域,這個視窗空間包括了數據收集時的個人行為、時空和客觀事物,數據收集者基於個人資訊的收集原則收集個人資訊,此時基於個體和數據收集者之間形成的合約自治達成合意,形成相應的合約賦予數據收集者收集個體手中的個人資訊。後台系統則是數據收集者透過演算法將個人資訊進行處理、分析從而形成後設資料,後台系統則由專業團隊組成,此時則不像前提系統依賴時間和空間。專業的團隊和演算法的加持共同組成了後台系統。後台系統作為數據收集的核心部份,由於演算法的自動化決策使得系統如黑箱一般處於不可知不可見的狀態。但正是透過演算法自動化的決策使得收集的個人資訊最終轉化成數據交易的後設資料。

前台系統,基於個體和數據收集者的合約自治建構二階層收集原則,個體則可以要求數據收集者對於使用的演算法進行解釋說明,個體也可以要求數據收集者禁止使用自動化決策演算法來處理自己的個人資訊。數據收集者應當對演算法的設計目標和原理作出系統和可理解的解釋說明,以及對使用演算法可能存在的風險和授權產生的後果作出明示的系統說明。個體也可以對數據收集者使用的演算法提出建議和批評,對於演算法存在的問題提出自己的改進意見,而對於演算法存在的隱患則提出批評並要求改正和最佳化。應以溝通訊任原則重構演算法解釋權,將演算法解釋權的性質視為一種程式性權利,而非實體性權利。對於後台系統則可以從功能主義的角度出發,功能主義從法的外部觀察法,本著實用性的目標去分析法的目的性,使得法能夠適應社會的快速發展,同時又不會失去法的安定性。「根據問責制原則,數據控制者必須能夠證明其決定的合理性。」從功能主義角度出發保護個人數據的安全,其意圖則是數據收集者在進行數據交易前,根據其目的和目的背後的保護的利益進行價值權衡,以便明確數據交易這個場景中應當著重保護何種權能,進而確定數據交易場景下的價值取向,並圍繞該價值取向完善個人數據保護的相關舉措,從而實作資料來源的合約自治。

(二) 數據交易場景中交易平台的合約自治

法律是社會控制的工具,但社會控制實際效果則依賴於現實中人面對法律規制的行為。數據交易平台應當發揮對數據交易演算法的全流程的監管和服務職責,實作合約自治。演算法和數據在數據交易平台中深度嵌合,同時根據個人資訊保護法對於平台企業的範圍,平台監管範圍則應當從數據保護到演算法規制。數據交易平台進行自我規制,在不依賴外部監管第三方的幫助實施演算法規制。基於數據交易平台的獨特雙重職能,除了對交易數據的合法性需要提供合理證明外,同時需要對數據交易各方的自動化決策演算法作出限制,從而穩定數據交易的基本秩序和維護交易的公平胡誠信。在數據交易平台的元規制基礎之上,應當依靠獨立的監管第三方進行獨立規制,平台作為數據交易的利害相關方僅僅依靠自身能力難以完全實作合約自治,而且由於演算法產生的知識鴻溝,數據交易平台如果沒有專業團隊進行演算法監管則難以真正落實。數據交易平台應當構建元規制與獨立規制的二元合約自治體系,從內外兩個層面實作對演算法的規制,實作數據交易平台的合約自治。

數據交易平台的元規制存在兩個關鍵要素即目的性和可歸責性。元規制的目的性則由制定規制、反饋資訊和糾正行為三個部份組成。制定規制則是要求數據交易平台根據演算法和數據交易流程的不同特征制定特殊化規制,以此要求數據交易平台實作自我規制。其次,則是反饋資訊,要求數據交易平台進行合約自治出具執行報告、管理報告和監管第三方報告,形成數據交易平台自治的過程。在最後的糾正行為階段,數據交易平台和數據交易各方需要就演算法監管情況進行協商,對演算法監管中的問題和不足進行反饋,及時要求數據交易各方作出相應的整改和最佳化。元規制的可歸責性,是指數據交易各方對演算法決策的合理性作出說明和理由。可規則性的核心要義則是透過立法或其他方式向數據交易平台授權之後,還應對其實施足夠的控制,從而保證數據交易平台以知識和能力實作其監管和服務的雙重職能。應當註重設定程式來解決數據交易各方的可歸責性爭議,形成一種不同延伸的問責形式。

(三) 數據交易場景中交易方的合約自治

只有對數據進行挖掘和利用,數據才有價值,而演算法等技術是挖掘和利用的集中體現。數據交易的本質在於數據分享,實質上是數據買方和數據賣方進行的數據買賣行為。數據交易平台則是作為中間人提供監管和服務職能。實踐中的數據交易則更多的是數據買賣雙方的直接買賣活動,基於數據交易平台的交易則並不占大多數。對於數據交易相對方的合約自治在當下則顯得更為重要。即便在不久的未來建構大數據交易平台為核心的數據交易體系,由於數據交易的核心都是買賣雙方之間的法律行為,大數據交易平台則是基於交易的特性為了監管演算法和交易的而作為交易中間人,而且數據的權屬並不屬於大數據交易平台,根據買賣合約的本質則是買方物品權利轉移到賣方手中的過程,那麽數據交易的核心自然是數據交易相對方的數據買賣行為。由於數據交易的特殊性,應當作為國家監管的交易之一,數據交易相對方則需要獲得相應的行政授權授權才可以進行交易。同時應當建立數據交易信譽名單,基於數據交易者的信譽來判斷其是否可以進行交易,數據交易相對人應當將交易數據、運用演算法等相關內容送出給國家數據局進行登記備案,國家數據局則對送出的內容進行審查,備案的內容則可以為數據交易雙方日後的爭議提供相應的證據。

數據賣方則需要對交易數據的符合交易承擔相應的義務,應當確保交易的數據在數據交易的授權範圍之內。同時數據賣方也應當對交易數據的品質提供一定的義務,數據品質標準則屬於復合型的內容,包括後設資料、運用演算法和數據內容。具體而言數據賣方應當確保交易數據的合法性、對分析數據的演算法進行說明、明確數據的適用範圍、期限和用途、確保交易數據的真實性以及對交易數據可能的風險進行明示。目前對於數據交易的合約自治並沒有出台相應的數據交易法,而是分散在法律法規等對方,且對於數據交易的合法性、演算法監管、數據交易的風險沒有一個統一的規範。應當明確數據交易中各方的權利義務和數據交易的基本準則、演算法的使用規範,並出台配套的法律法規,細化數據交易的目的、流程和演算法使用細則、責任歸屬等具體內容,構建統一的數據交易的部門法。未來持續深化平台演算法監管,需要構建「硬法」「軟法」相結合的合意監管體系,建立技術監管技術的自動化監管模式,形成內送流量備援容錯機制體共生演化的生態化監管網路,落實全流程覆蓋的動態化監管機制。

三、底層設計:數據交易場景中演算法信任的技術中立性

演算法的程式正義理論在確立「以人為本」的智慧倫理觀的基礎上,透過演算法公開、演算法影響評估和問責等新的制度性設計,化解傳統程式所面臨的正義風險,促進正義價值的實作。數據和演算法的相互融合在數據交易這個特定場景中顯得尤為突出,數據作為演算法的質料,演算法則挖掘數據的特有價值,在數據交易這個動態即時的場景中,對演算法進行流程式的規制則符合交易的基本規則。數據交易從資料來源出發作為交易的物件,交易數據則透過場外交易或者場內交易的特定場所進行交易,無論是否基於數據交易平台這個場所,數據交易基本則是數據買賣雙方的買賣行為。演算法則從數據交易的全流程中和數據進行深度嵌入,使得拋開數據交易這個特定場景去對演算法進行規制顯得荒謬可笑。數據交易的演算法規制必然是在回歸交易流程中進行流程規制。機器演算法技術性並不是單純意義上的技術規制,而是建構在演算法技術的基礎上形成法律上的具體內容,回歸數據交易的本質即數據分享以及演算法如何實作數據分享的流程,可以將演算法流程分為三大階段即獲取階段、分析階段和套用階段。首先是獲取數據,再是透過演算法分析數據,最後則是經過演算法分析的數據的套用過程。這三個階段通常是連續動態的流程,在這個流程中某些行為可以被單獨區分開來,並且總結在三階段模型之中。

(一) 數據交易場景中演算法流程的獲取階段

應及時樹立以風險防範為目的的監管思路,實行內容與演算法並重的雙軌審查機制,以及設立平台責任與技術責任雙軌並列的責任體系,並對演算法的生產性資源數據的收集和使用進行合理限制。獲取階段是演算法流程中數據交易中各方為獲取數據的階段,演算法流程的開始需要數據作為質料,但在整個行程中也會進行數據收集。而在實踐中,獲取階段在整個流程中重復出現或者貫穿全程。演算法流程通常具備一個響應新數據輸入的自動化決策演算法,數據可以從個體手中收集,根據對個人資訊的分層形成的默示同意和明示知情二階層,透過匿名化演算法和技術去除個人資訊的人格和身份內容,轉化成為匿名化資訊。自然數據收集可以透過傳感器,傳感器不僅收集關於個體的個人資訊,還可以收集事物和過程的資訊。另一種方式則是透過數據交易獲取數據。新數據並不總是從個人、傳感器或者數據交易這些方式獲取,數據也可以透過數據爬蟲進行抓取數據等方式的公共資料來源中獲取,或者是透過現有資料來源的組合進行建立。此外,可以根據現有數據進行推斷和預測,這種推斷和預測則又會構成新的數據。

除了個人數據的交易限制外,對於企業數據和公共數據的交易限制同樣重要。企業數據可以分為企業自生數據和企業非自生數據。企業自生數據則是企業自身生產經營活動過程中生產與企業業務相關的數據,企業自身數據由於是企業這個獨立法人產生的數據,類比自然人生產的個人資訊,企業自身數據的權屬屬於企業自身,企業對於自身的數據具有占有、處分的權利,企業可以將自身企業進行數據交易。而企業非自生數據則是企業持有的其他數據主體的數據,包括個人、政府、法人等其他社會主體的數據。企業掌握的個人數據依舊基於個人數據交易的二階層原理進行規制,而對於掌握的其他企業數據則由於企業數據的可交易性而可以進行交易。而企業掌握的公共數據則應當根據數據是否對外開放進行分類處理,對於涉及國家秘密、公共私密等非對外開放數據則不能進行交易。公共自生數據則是指國家行政機關、公共事業單位以及履行公共管理職能的企事業單位在履行公共職能的過程中而產生的數據,公共自身數據雖然是公共組織產生的,但由於公共組織代表的是公共利益,基於社會契約論其權力是由個體賦予,其自生數據不應當進行交易,對於公共自生數據中公開的數據則應當基於共享的原則實作數據流通利用,可以根據申請公共組織依法公開公共數據。「具有公共產品內容的非個人數據原則上應視為人類社會的共有資源,由公眾自由使用。」對於公共非自生數據則是指行政機關、企事業單位在履行公共職能的過程中基於社會治理和公共管理的需要,向個體、企業、社會組織收集的數據,由於這些數據屬於公共組織收集的其他數據主體的數據,數據權屬並不在公共組織手中,這些數據是為了便於社會治理和公共管理等公共利益的需要而收集,其具備的公共性使得公共非自生數據同樣不能進行交易,且由於屬於數據各方同樣不能進行公開共享。

(二) 數據交易場景中演算法流程的分析階段

演算法流程的第二個階段則是對獲取的數據進行演算法分析,數據分析需要依賴資料庫管理和數據處理軟體進行,其中包括數據儲存和處理,為數據分析的前提預處理技術,以及資料探勘和支持技術。在資料探勘中,使用並建立了機器學習和人工智慧等領域的各類方法,其目的則是在大型數據集中發現有用的模型。當下最為廣泛使用對數據進行分組發現模型的技術包括集群、分類和模式挖掘。而在這些技術之中,數據則被用來進行建立邏輯中的假設部份,這和傳統統計方法背道而馳。在社會科學中,假設作為數據收集或者分析的起源。這使得它看起來相對而言的中立、客觀和真實,但演算法流程的分析並不局限於此。假陽性和假陰性的存在風險其實和傳統統計數據類似,高度擬合(誤將巧合的模式錯認為是實際上具有普遍價值)的風險同樣較為突出。無論數據集的大小,用於分析的數據必然得出一個定律:數據永遠不可能完全決定性的重現真實世界。「一個或多個人類決策或評估被記錄為結構化數據,並且該數據被自動匯總或合並以生成用於做出決策的總體評分或評估。」此外,數據的選擇取決於其對數據組織的時效性和目的性,其效果和代表性並不能完全預測或者進行事後評價。

演算法流程的分析階段中對於數據分析所形成的則是相關關系,而並非因果關系的資訊,兩個變量或者事件之間的聯系可能純粹出於巧合而並不具有必然性,事實上的相關關系並非等於法律上的因果關系,「依據特征組合作出的預測在某種程度上與目標訊號存在因果關系,」將演算法流程分析階段的相關關系轉化成法律上的因果關系為演算法規制開啟了大門。根據演算法的作為和不作為進行劃分,判讀演算法的因果關系標準則是行為風險的關聯性,從作為層面看,對於人為操控演算法產生的作為行為,應當認定為因果關系。演算法和行為人可以看作是工具和靈魂的關系,基於行為人積極地作為行為操控演算法損害數據交易各方的合法權益,所實施的侵權行為危害到了不僅僅是個體甚至是群體和社會的利益。而對於演算法的不作為行為則可以分為積極的不作為和消極的不作為。積極的不作為是指出於故意的意思表示,對於不作為引發的風險存在預見可能性,應當對演算法的因果關系進行認定。消極的不作為,是指由於主觀上出於過失的意思表示,不作為的義務來源則是要求行為人對風險具備註意義務和作為義務,且產生的風險具有可避免性。此時的風險應當局限在可認知的範圍之內,對於超出認知範圍的風險不應當認定為法律上的因果關系。

(三) 數據交易場景中演算法流程的套用階段

在演算法流程的套用階段,套用則是從數據分析中獲得資訊,獲得的資訊可能是知識、模型或者預測,透過分析得出的資訊可能會形成通用的決定或者針對個人的決定。使用數據做出針對個人的決策可能是透過自動化方法得以實作的,或者由個人或機構透過基於分析產生的知識做出決策。這些決策可以直接針對特定個體,但也有可能做出並不針對特定個體的通用決策。需要註意的是,由於這些決策出自多個來源渠道的數據集,而不僅僅取決於數據交易特定個體的數據。正如在分析階段中演算法所規制,知識是透過匯集來自廣泛來源的數據集而產生,這些則是影響數據交易特定個體決策背後的知識。在絕大多數情況中,所做出的一般性決策會對數據交易特定個體的交易策略產生影響,甚至在不需要處理數據交易特定個體的數據時影響其內心交易想法。但是當演算法做出的決策是針對數據交易特定個體本身的時候,仍然主要是來自分析階段的其他來源的數據,以及在套用階段的有限資訊,決定了結果或者決策。

演算法論證程式具有的相對客觀合理性、銜接技術中立與技術向善性、多元價值相容性,為法律限制演算法權力恣意、解決演算法黑箱問題和減少演算法歧視提供了全新的溝通性視角。分析階段的大量數據加上套用階段的少量資訊,是演算法流程中影響決策、預測和新資訊的因素。對於規範和法律分析而言,套用形式的多樣性和套用手段的多樣性,通用決定或針對數據交易特定個體的決定,無論是否使用大量數據交易特定個體的數據都是極其重要的。演算法流程是一個極其復雜的程式,根據實踐和法律視角出發將其分為獲取、分析和套用三大階段。獲取階段是大量的數據交易特定個體的數據。在分析階段,利用各式各樣的演算法分析數據提煉知識。在套用階段,收集的數據交易特定個體的數據會被用於數據交易這個場景中,但知識和資訊的主要來源並非一定來自數據交易特定個體的自主數據,也很有可能來自其他數據。顯然,獲取階段、分析階段和套用階段是分離的。演算法流程中的某些階段可能數據處理是關鍵因素,但在另一個階段則可能並不重要。在演算法流程中,不同法律規制不同演算法流程的不同部份,不同階段需要運用不用的法律手段和解決方案。以演算法規制演算法,透過規範的計算化、規制的技術化、技術的反饋化三個界面的勾連,使規範穿透演算法的外衣,直達演算法的後台。演算法流程論在信任基礎上建構起來,在數據交易這個特定場景中,顯示出演算法流程是由不同階段組成,不同的法律規制適用不同的行為,不同的行為則伴隨著不同的風險和責任。這是演算法流程劃分為不同階段進行規範分析和法律分析的核心和優勢。在演算法場景化規制原則的指引下,可以構建演算法公開、數據賦權與反演算法歧視等演算法規制的具體制度。

結語

演算法黑箱的存在,並不僅僅是因為知識鴻溝的存在,更多的是由於使用演算法的組織和企業,它們在數據交易中運用演算法自動化決策為自己謀取利益的最大化,完全摒棄了交易的基本誠信原則,使得數據交易無法真正建構演算法信任。演算法作為一把雙刃劍,如何看待和運用演算法遠比演算法本身來得重要。數據交易這個特定場景中的數據和演算法深度融合導致了原先的信任失衡,演算法權力逐漸異化了數據交易的各方面,如何讓重構演算法信任實作演算法規制顯得尤為重要。如何使用演算法從而促進數據交易成為當下的實務和學術界的熱門話題,在數據交易中規制演算法從而促進數據的流通利用,從而規制演算法秉持演算法的技術中立性,發揮演算法的技術性的優勢,從而促進數位經濟的良性發展。中國演算法治理和數據治理深度融合,數據保護立法剛剛起步,應當將數據保護和演算法規制同步推進,促進中國演算法治理體系的建立。