當前位置: 華文世界 > 科技

當我們獲得資訊時,我們獲得了什麽?

2024-02-07科技

圖片來源@視覺中國

文 | 追問NextQuestion

21世紀被譽為資訊時代,資訊已經成為了人們賴以生存並與世界互動的必要工具。但我們真正理解「資訊」是什麽嗎?它推動了時代,但對我們的生活和思維方式又有何實質影響?

著名數學家克勞德·山農(Claude Shannon)提出的消息理論,為我們提供了探討資訊量化、儲存和傳播的理論框架。按照消息理論的觀點,資訊是一種「線索」,它的關鍵作用是減少對未知事件的不確定性。如果了解某些事件能幫助我們減少對另一個事件的不確定性,那麽這些知識就構成了資訊。

例如,初來乍到的員工對公司知之甚少,他對周圍同事充滿了不確定感。不過,在和同事們約過幾次飯後,他對同事們的言行舉止有了一些觀察,他逐漸開始了解同事們的興趣愛好、性格特點。這些資訊使得同事們不再那麽陌生,使得新員工的不確定感大大降低。

在我們的日常生活和人際交流中,資訊無處不在,它深刻影響著我們的人際交流和認知過程。對於神經科學家來說,消息理論將人類的大腦視為一台資訊加工機器,資訊就像是神經系統中的基礎貨幣,不同神經元透過電訊號和神經化學訊號的傳遞相互交流,這些資訊在大腦中不斷地被修改和組合,形成了我們的認知和記憶。

那麽,電訊號和化學訊號就是資訊嗎?

神經科學家們對此也並未形成統一共識 [1] ,用「基礎貨幣」這樣的修辭學方式來定義資訊,可能還無法全面反映資訊的本質。

近年來,消息理論領域湧現出一種新的觀點:資訊並非單一的實體,而是由多種形態構成。這種觀點被稱為「資訊分解」(information decomposition) [2] ,它試圖將資訊解構為獨特資訊(unique information)、冗余資訊(redundant information)和協同資訊(synergistic information)三大類。這樣的分解為理解資訊的本質提供了新的視角,有助於我們更綜合地認識大腦的資訊結構,理解認知加工過程。

▷原始論文:Luppi, Andrea I., et al. "Information decomposition and the informational architecture of the brain." Trends in Cognitive Sciences (2024).

資訊分解:多元的資訊

三類資訊各有特點,在資訊加工過程中扮演著不同的角色。

以視覺資訊加工為例,人的視覺系統包含中央視野和邊緣視野。其中,邊緣視野幫助我們捕捉寬廣的環境資訊,包括物體的大致位置和模糊的細節。雙眼邊緣視野中的資訊各不相同,屬於獨特資訊。因為當我們閉上一只眼睛(左眼)時,相應眼睛(左眼)的邊緣視野中的資訊便會遺失,這時,大腦只能接收到另一只眼睛(右眼)的資訊。例如,在駕駛車輛時,邊緣視野往往能幫助司機從後視鏡察覺到兩側和後方的車輛情況,假如左後方有車正在快速接近,司機左眼突然不舒服閉上了一瞬,那麽,司機很有可能因未能及時察覺而面臨意外事故。

相較於邊緣視野,中央視野是人類視覺範圍的中心區域,承載了我們看到的大多數詳細資訊。對於司機來說,同一車道正前方的車輛同時位於雙眼的中央視野內,即使某一瞬間司機閉上了左眼,僅憑右眼他依然能察覺到前方車輛的動態。這樣的資訊被稱為「冗余資訊」。其主要優勢在於穩健性,不同來源提供的資訊相同,這種過度表征保障人們在任何一處資訊源受損時依然能夠獲得所需的資訊。不過,冗余資訊的缺點也十分明顯,它並沒有充分利用大腦所有的資訊收集能力。

最後一類資訊是協同資訊。單眼是無法產生立體視覺的,世界在人的眼中如何變得立體?這有賴於雙眼的相互協作,由於雙眼在頭部的位置不同,看相同物體存在視角的差異。視覺皮層會接收到兩幅稍有差異的二維影像資訊,根據雙眼視差的程度或兩幅影像間的差異來判斷眼前物體的距離,進而形成了對眼前物體深度的感知,產生了立體感。

在駕駛場景中,雙眼協同幫助司機準確判斷與前車或障礙物之間的距離,任何一只眼睛受損都會對安全帶來威脅。相較於獨特資訊和冗余資訊,協同資訊最大的特點是效率,它充分利用了大腦神經系統不同部份之間的互動,實作了1+1>2的效果,在幫助人們處理復雜任務方面具有重要作用。

▷圖1:圖中橡果和香蕉是獨特資訊,矩形是冗余資訊,立方體則是協同資訊,需要雙眼共同作用才能知覺深度。圖源:參考文獻[2]

人體作為一種高度復雜的系統,資訊分解框架不僅為人們理解資訊的結構提供了更細致的視角,在其他系統中也多有套用,如元胞自動機、社會經濟數據、人工神經網絡等 [3]

大腦如何整合資訊?

資訊整合是神經科學和認知科學中一大基礎概念,然而,研究者們對於這一概念卻存在兩種不同的理解:整合即一體(integration-as-oneness)和整合即協作(integration-as-cooperation)。

一體化觀點認為,在分析大腦數據時,假如發現不同腦區的活動存在強相關或同步性,那麽,研究者會推測兩個腦區是高度整合的。這源於一種直覺:整合的元素會表現得像一個元素。兩個元素的活動同步程度越高、表現越相同,它們的整合程度也越高。協作化觀點則認為,當不同元素可以相互補償時,系統的資訊處理能力會受益於不同元素間的互動,這種互動即為整合的體現。

從資訊分解框架的角度來看,整合實際上是獨特資訊的反面,一體化對應著冗余資訊的概念,而協作化對應著協同資訊。然而,傳統的神經科學研究往往基於相關性來推測神經系統不同元素間是否存在整合,這種方法難以準確區分一體化和協作化的整合形式。高相關通常暗示著資訊的冗余,而低相關復雜得多,可能意味著資訊的獨特性或協同性。

為了更好地區分冗余和協同,早期研究者開發出協同-冗余指數,來反映系統中協同與冗余的平衡程度。假如系統中的資訊總和超過了各個組成部份的貢獻總和,那麽可以推測系統中存在協同。相反,假如系統各部份的貢獻總和更高,那麽系統中一定存在冗余。這種方式非常直觀,但無法應對協同和冗余同時存在的情形,也無法精確辨識協同資訊。

與相關法或協同-冗余指數不同,資訊分解透過計算系統的轉移熵(transfer entropy, TE)來更精確地分析資訊加工。例如,如果某個系統中兩個腦區的時間序列數據X和Y之間的轉移熵數據顯示,從X到Y的轉移熵高於從Y到X的,那麽可以認為X對Y有著明顯的「影響」。

以癲癇為例,這是一種大腦功能連線紊亂的現象。傳統觀點認為患者的大腦訊號彼此高度同步,仿佛是一體的,也就是說,大腦不同區域的冗余是癲癇發作的可能成因。但使用資訊分解框架分析癲癇患者的腦電數據,研究者發現,相較於發作前,癲癇發作時患者皮層下區域向皮層區域傳遞的冗余資訊和協同資訊都有所增加。更進一步地,分析不同區域的深部電極記錄,結果發現,特定皮層下區域向皮層區域傳遞的獨特資訊增加可能是引發皮層振蕩的主要原因,這為定位癲癇發作區域提供了更直觀的證據 [4]

▷圖2:資訊分解為認知科學提供了一種統一的框架,圖中穿過中心三角區域的每個雙向箭頭都表示認知科學和神經科學中一組對立的概念,箭頭的一端對應資訊分解框架中的某一種資訊,另一端則混淆了兩種資訊,如整合(integration)與非整合(disintegration),非整合意味著獨特資訊,整合則包含冗余和協同兩類資訊。局部和分化在正文中未提及。對於局部,當某一資訊源只包含獨特資訊,那麽,該資訊源的所有資訊都是局部可獲得的,即只能從該資訊源獲得,相反,當該資訊源只攜帶冗余資訊,那麽,該資訊源的所有資訊都是多局部可得的。對於分化,當系統不同部份表現各異,即未表現出一體化時,它們被視為是分化的,不過,兩個分化的部份既有可能是相互獨立的,也有可能是相互補償的。圖源:參考文獻[2]

大腦如何平衡冗余和協同?

冗余和協同作為廣泛存在於大腦不同區域的兩種重要互動方式,二者的區分得到了大量研究的支持。一項使用NeuroSynth數據庫、涉及15000余項影像學研究的元分析發現,冗余資訊在感覺運動加工中起到至關重要的作用。作為大腦的輸入-輸出系統,穩定的感覺運動加工對生存至關重要,冗余的互動方式則為這一過程提供了必要的穩健性。

另一方面,協同資訊則扮演了大腦中「全域工作空間」的角色,是完成高級認知功能的關鍵。高度協同的腦區表現出更快的有氧酵解(aerobic glycolysis)、更多樣的神經遞質受體表達,為靈活快速的供能、突觸形成以及神經調控提供了基礎 [5]

在宏觀尺度上,人類的靜息態fMRI數據表明,總體來看,協同似乎更為普遍 [5] ,但也與具體腦區有關。額葉和頂葉聯合皮層以協同為主,這些區域是大腦中整合多模態資訊的重要區域,其中,額葉聯合皮層主要負責長期規劃和決策,頂葉聯合皮層則負責空間定位、手眼協調等功能。相反,冗余則主要出現在較為初級的、處理單一模態資訊的皮層區域,如初級視覺皮層、軀體運動皮層和聽覺皮層。相較於其他靈長類動物,人類擁有更為發達的聯合皮層,這意味著我們的大腦更多地以合作、協同的方式整合多重資訊。這些發現無疑為人類的認知優勢提供了消息理論的證據。

微觀尺度的研究證據與宏觀尺度的fMRI研究結論高度一致。例如,電生理記錄發現,神經元之間的互動對於解釋前額葉皮層中的脈沖活動非常重要,前額葉神經元常常會根據刺激和任務的變化展現出復雜而靈活的反應。然而,對於視覺皮層(V4,尤其是V1),神經元之間的互動在解釋脈沖活動方面的貢獻度要低得多 [6, 7]

除了以人類為物件的研究證據,人工神經網絡研究也發現,在早期,網絡中冗余占主導地位。但隨著學習的深入,一些神經元開始變得專一化,提供更多的獨特資訊。當人工神經網絡在學習多工時,它們需要足夠靈活以整合不同來源的資訊,此時,協同作用會不斷增強。一旦高度協同的神經元被破壞或移除,整個網絡的表現會明顯變差。假如在訓練時隨機關閉神經元,神經網絡變得更加冗余但也更加穩健,訓練完成後面對人工損傷也有更好的抵禦能力 [8]

綜合來看,冗余沒能充分利用神經系統處理資訊的能力,但提供了強大的穩健性,是人類及眾多靈長類動物感覺運動功能的基礎。協同與更高階的資訊加工息息相關,更具效率也更為靈活,是人類成為萬物之靈的重要助力,但一旦某一部份受損,有賴於不同神經元/腦區協同作用的高階認知功能也更易惡化。

▷圖3:(A)圖中藍色和紅色分別對應大腦中冗余和協同為主的區域,藍色腦區主要與初級感覺運動加工有關,以底層的結構化連線為基礎,展現出高度模組化的網絡組織,即不同部份只專一化地加工單一模態的資訊,如視覺皮層對應視覺資訊。紅色腦區負責復雜認知加工,並且與突觸密度、突觸樹突相關基因等有關,擁有更強的可塑性。(B)協同的演化史。冗余資訊對不同物種都相對穩定,而與其他靈長類動物相比,人類大腦中表現出更加發達的協同資訊,這可能是由於人腦擁有更發達的皮層區域。圖源:參考文獻[2]

人工智能設計的新藍圖

資訊分解框架提供了探究大腦資訊加工的全面視角,也為我們理解人類的前進演化優勢提供了許多新的證據,除此以外,資訊分解也將有助於研究者設計更加類人的人工智能系統。

當前,人工神經網絡已在多個領域展現出強大的能力。關鍵的問題是,這些系統是否也像人腦一樣依賴於協同作用?

近期,人工智能的進步主要來源於模型的規模。研究者觀察到,隨著人工智能模型的規模擴大和其在處理多工方面的靈活性增強,我們可以觀察到模型表現出更多的協同作用。這些都可以視為人工智能系統越來越類人化的標誌。但協同作用內在的易損性對於人工智能來說也是一種隱患,因此,未來在設計人工智能系統時,應對系統中不同類別的資訊加以辨別,將資訊分解框架發展為一種理解復雜系統的通用語言,這也將有助於人們解開許多人工智能模型的「黑箱」。

反過來,人工智能也能為消息理論研究提供強而有力的檢驗環境。比如,我們已經觀察到在面對復雜任務時,協同作用會增強。那麽,假如透過如演化演算法的方式,將人工智能系統設計成為更偏好協同作用,它們是否能更好地應對復雜任務呢?更進一步地,假如某個人工智能系統只擁有協同作用的能力,這將為我們提供一個獨特的視角來直觀探究協同作用的優勢和局限性,這種極端環境是任何生物系統都無法實作的。

▷圖4:使用資訊分解框架作為連線生物與人工智能的羅塞塔石碑(羅塞塔石碑上包含希臘文、古埃及文字等多種語言,是研究古埃及歷史的重要參照)。在生物的大腦中,資訊加工、資訊分解幫助我們理解大腦結構和功能組織與認知和行為變量之間的關系,類似地,在人工智能系統中我們也可以建立起系統架構與計算能力和表現之間的關系。無論是生物大腦皮層,還是人工智能系統,資訊加工、資訊分解不依賴於載體,可以成為一種通用的語言。圖源:參考文獻[2]

結語

現實生活中,如火如荼發展的人工智能技術時不時引發人們的驚呼,其實,大腦的精巧程度遠非人工智能可及,資訊分解框架無疑讓我們朝大腦之謎再度前進了一步。

未來,我們還能以怎樣的方式分解資訊?我們如何基於資訊分解創造出更先進的人工智能系統?對大腦的資訊結構更加全面的了解能否幫助我們破解困擾人們的諸多精神障礙?也許有朝一日,當我們將大腦的基礎貨幣拆解得足夠細微,人造大腦便不再是夢想。

參考檔:

  • [1] Timme, N. M., & Lapish, C. (2018). A Tutorial for Information Theory in Neuroscience. Eneuro, 5(3), ENEURO.0052-18.2018. https://doi.org/10.1523/ENEURO.0052-18.2018
  • [2] Luppi, A. I., Rosas, F. E., Mediano, P. A. M., Menon, D. K., & Stamatakis, E. A. (2024). Information decomposition and the informational architecture of the brain. Trends in Cognitive Sciences, 0(0). https://doi.org/10.1016/j.tics.2023.11.005
  • [3] Mediano, P. A. M., Rosas, F. E., Luppi, A. I., Carhart-Harris, R. L., Bor, D., Seth, A. K., & Barrett, A. B. (2021). Towards an extended taxonomy of information dynamics via Integrated Information Decomposition (arXiv:2109.13186). arXiv. https://doi.org/10.48550/arXiv.2109.13186
  • [4] Faes, L., Marinazzo, D., & Stramaglia, S. (2017). Multiscale Information Decomposition: Exact Computation for Multivariate Gaussian Processes. Entropy, 19(8), Article 8. https://doi.org/10.3390/e19080408
  • [5] Luppi, A. I., Mediano, P. A. M., Rosas, F. E., Holland, N., Fryer, T. D., O’Brien, J. T., Rowe, J. B., Menon, D. K., Bor, D., & Stamatakis, E. A. (2022). A synergistic core for human brain evolution and cognition. Nature Neuroscience, 25(6), Article 6. https://doi.org/10.1038/s41593-022-01070-0
  • [6] Chelaru, M. I., Eagleman, S., Andrei, A. R., Milton, R., Kharas, N., & Dragoi, V. (2021). High-order interactions explain the collective behavior of cortical populations in executive but not sensory areas. Neuron, 109(24), 3954-3961.e5. Scopus. https://doi.org/10.1016/j.neuron.2021.09.042
  • [7] Rigotti, M., Barak, O., Warden, M. R., Wang, X.-J., Daw, N. D., Miller, E. K., & Fusi, S. (2013). The importance of mixed selectivity in complex cognitive tasks. Nature, 497(7451), Article 7451. https://doi.org/10.1038/nature12160
  • [8] Proca, A. M., Rosas, F. E., Luppi, A. I., Bor, D., Crosby, M., & Mediano, P. A. M. (2022). Synergistic information supports modality integration and flexible learning in neural networks solving multiple tasks (arXiv:2210.02996). arXiv. https://doi.org/10.48550/arXiv.2210.02996