作者:凱爾茜·休斯頓-愛德華茲〔KelseyHouston-Edwards〕(美國數學家兼記者,曾為美國在線節目“PBS無窮級數”撰稿并主持該節目)
一個表情包如何一夜間火遍全網?一種産品是怎樣閃電般地占據了整個市場?一場疾病又為何會突然全球性暴發?這類問題的答案就藏在經典的數學分支——滲流理論中。
引言
當你按下“發送”時,你可能以為短信會直接從自己的手機傳輸到朋友的手機上。事實上,長途傳送信息通常需要通過蜂窩網絡或互聯網完成,這兩種網絡都依賴于集中調度的基礎設施,而這些設施可能會遭到自然災害等因素的破壞。現在,有一些應用程序正試圖幫助用戶與臨近的手機實現直接的信息傳輸。這些應用程序能讓加密的信息悄悄地從一部手機傳到另一部,從而将發信人和收信人連接起來。換言之,這些手機以網格網絡(meshnetwork)或自組織網絡(adhocnetwork)的連接方式實現了沒有中心調度的靈活通信。在這樣的網絡中,任意兩部手機進行通信時,都需要通過短距離内的相互連接來實現。那麼,有一個問題出現了:在一個網格網絡中,需要同城有多少人相連接,才能保證全城通信?
1.突然的巨變
一門名為滲流理論(percolationtheory)的數學分支給了我們出人意料的答案:隻需幾個人就能讓一切變得不同。最早加入這個通信系統的用戶會構成若幹互不相連的小規模網絡。然而一旦用戶的密度(單位面積的用戶數)超過一個關鍵的阈值,就會突然出現能夠連接遠距離用戶的信息通道。科學家們将網絡連接性的這種快速變化描述為相變(phasetransition),這一概念同樣也能用來解釋冰的融化或水的沸騰等物質狀态的突然變化。
滲流理論能研究在這種網格結構中随機創建或删除連接産生的後果。數學家将網格結構設想為由邊(也就是線)連接頂點所形成的網絡——每個頂點代表一個對象,例如電話或人,而邊則代表其中兩個頂點之間的特定關系。滲流理論可以追溯到20世紀50年代,它的基本觀點是:随着網絡中連接數量的逐漸增加,将存在無窮多個點彼此間有路徑相接,或者用數學的語言來講,一個無窮大的連通簇(infinitecluster)将會在一瞬間突然出現。
現在,科學家正在緻力于回答:這樣的相變何時會發生?對于任何一個給定的網絡,如何找到相當于冰在0℃融化或是水在100℃沸騰的時刻?一個表情包如何一夜間火遍全網?一種産品是怎樣閃電般地占據了整個市場?一場地震在何時降臨?一個手機網絡如何能在刹那間實現全面連接,或者一種疾病何時開始在全球蔓延?滲流理論能提供解答這類問題的理論基礎。
數學家通常傾向于研究具有幾何對稱性的無限網絡,因為這樣便于進行理論計算。一般隻有無限網絡具有一瞬間發生的相變,術語稱為驟然相變(sharpphasetransition)。現實世界中的網絡計算起來則難度較大,這些網絡一般規模有限,且常常非常混亂。不過,這些網絡也有相變,隻是相變較為平滑。在當下的時代,各種複雜的連接使世界的聯系更加緊密,例如為人們提供能源的電網,聯系着人們的社交媒體,甚至是傳染病的傳播網絡。因此,滲流理論也與我們愈加息息相關。
2.牽一發而動全身
1957年,英國數學家西蒙·拉爾夫·布羅德本特和約翰·邁克·哈默斯利首次将流體的濾過過程(例如油滲入多孔岩或者水滲過咖啡粉)抽象成名為滲流的純數學問題:用一個網絡來代表岩層,岩石結構中的孔隙表示為頂點,允許流體在其間流動的通道或裂縫表示為邊。我們很容易想象,石油在裂縫較多的岩石中流動得更遠。布羅德本特和哈默斯利通過滲流理論預測,在理想化的情形下,當裂縫的密度超過一定的阈值,石油将突然滲透到幾乎整個岩層而不再僅限于一些小區域。
地質學家曾使用滲流理論的一個版本來研究有裂縫的岩石中岩團的大小,這些研究與水力壓裂法開采石油以及理解地震發生的原理息息相關。為了建立地震模型,地震學家會創建與觀測到的裂縫規模和密度相匹配的滲流網絡,然後根據調整不同裂縫連接起來的概率來解釋應力。随着應力增加,裂縫集群擴大,地震在倏忽之間不可預測地産生。研究者可以通過調整滲流過程的參數,使縫隙愈合或是再次裂開,以模拟餘震或者更長期的變化。
滲流理論還可用于闡明更小規模的物理和化學過程。以聚合過程為例:在這個過程中,單體,也就是小而簡單的分子結合在一起,形成更大的集群,稱為聚合物。在滲流理論的框架中,每個單體可以作為一個節點,兩個相鄰的單體可能會自發地形成化學鍵,對應着網絡中的一條邊。如果它們連接的可能性不斷增加,系統最終會達到滲流阈值,形成遠比單體分子龐大的聚合物。這也是明膠粉溶于水能凝固形成果凍的原因。
岩石裂縫或構成聚合物的網絡極其複雜。盡管我們幾乎不可能精确描述它們的結構,但布羅德本特和哈默斯利表示可以将其近似地描述成一些更加易于分析的重複圖樣。最簡單的例子是由一個個正方形組成的格點網格,它看起來就像一張無盡的圖紙:網格中頂點依次排列,并由四條邊連接到鄰側的點。
為了理解液體是如何穿過這個網格的,不妨将網格中的邊想象成一條要麼開放要麼閉合的水管。所有水管都獨立地以相同的概率開放或閉合。于是,所有或開或閉的水管将形成一個随機的網絡,其中包含一些連通的區域(連通簇),所有的頂點都由一系列開放的水管連接。如果你往這種連通簇的任何一個節點中注水,那麼水流就會通過那些開放的水管流到這個簇中的所有其他節點。
滲流理論關注的就是網絡的連通性,即上述的連通簇究竟有多大。但“大”是一個模糊的概念,并不容易得到形式化的數學表述,因此數學家常常用無窮大來替代那些很大的數。那麼,我們讨論的核心問題就變成了:是否存在一個無窮大的連通簇?德國魏爾斯特拉斯應用分析和随機過程研究所(WIAS)的數學家貝内迪克特·雅内爾說:“對我們來說,回答‘是否存在這種簇’比回答‘有多少這種簇’,或者‘這些簇有多大’要容易得多。”
事實上,一個無限大的網絡中包含一個無窮大的連通簇(以下簡稱為“無窮簇”)的概率總是0或1,這是由于滲流過程會受到概率論中一個一般性理論的制約。該理論叫作零一律,由蘇聯數學家安德裡·柯爾莫哥洛夫在20世紀30年代提出。
零一律告訴我們,有限的改變無法幹擾本質上是無限的現象。所以,在無限大的網絡中找到一個無窮簇的概率必須處于某個極端的位置——不是0就是1。這一概率不會産生更細微的改變,比如從0.81變為0.82。換句話說,一個無限大的網絡要麼一定有一個無窮簇,要麼一定沒有,非此即彼。因此,将有限條水管閉合或開放,對是否存在無窮簇沒有任何影響。找到無窮簇的概率要麼是0,要麼是1。那麼到底是哪一種呢?
3.找出阈值
答案取決于水管開放的概率。想象你有一個用于控制這個概率的表盤。當表盤的指針轉到最左端時,代表概率為0,水管總會閉合。一旦所有的管道都被關閉,灌入某個節點的水不會往任何地方流,這時找到一個無窮簇的概率為0。當你順時針轉動指針,水管開放的概率會增加,開放管道的總數也越來越多。當指針轉到最右端時,該概率為1,所有水管都開放,并且灌入某一個節點的水最終會流入所有其他節點,此時找到無限簇的概率為1。
如果你将指針緩慢地從關到開轉動,管道打開的概率會逐漸增大,看起來找到無限簇的概率也會從0到1逐漸變化。但事實上,這一變化是瞬間發生的。零一律指出,該概率不會取0到1之間的值。對于正方形網格而言,存在無限簇的概率會在指針恰好處于正中央時突變,這時水管開放與閉合的概率相等。撥盤上這個關鍵的位置被稱作滲流阈值。不論網絡的形狀是什麼樣的——例如三角網格或三維正方體網格——滲流理論的基本問題仍然相同:阈值在哪?管道開放的概率需要多大,才會有足夠多的開放連接來保證無窮簇的存在?
答案取決于無限網格網絡的精确形狀,而要找到它并非易事。即使要證明幾乎最簡單的系統——正方形網格——的阈值是1/2也是一項令人望而卻步的挑戰。正方形網格的這個問題最終在1980年被數學家哈利·凱斯滕解決。現在,盡管經過了數十年的努力,但我們僅能在少數極其簡單的網絡上精确地計算滲流阈值。“僅僅是尋找阈值就耗費了大量的工作,”密歇根大學的統計物理學家羅伯特·齊夫說,“難以想象的是,人們已經研究了這麼多不同種類的系統。”齊夫整理了一個維基百科頁面,記錄了數百種不同網絡的滲流阈值。三角網格的阈值約等于0.347,這是一個經過精确計算得出的數字,但該頁面上大量的數值(包括三維正方體網格的阈值)是通過計算機模拟而得到的近似解。
4.連通網格網絡
在物理系統中,格點網格(lattice)是很好的滲流模型。以斷裂的岩石為例,孔隙的位置是固定的,但它們之間的裂縫是随機形成的。現實世界中其他的網絡甚至還要複雜得多,比如前面提到的網格網絡,這一網絡中頂點的位置會不斷變化,而其中的邊,或者說連接,隻有在兩部手機彼此足夠接近(藍牙通信的有效範圍約為10米)的情況下才能形成。類似這樣的網絡中,頂點可以存在于連續空間中的任何地方。因此我們需要用另一種被稱作連續滲流(continuumpercolation)的模型來描述它們。
像任何數學模型一樣,這種網絡模型仍然進行了一定程度的簡化。作為通信節點的智能手機是随機分布的,它們的位置并沒有模仿自然情況下行人自動産生的集群模式;兩個節點僅根據它們之間的距離進行連接,沒有考慮牆壁或其他幹擾源。盡管如此,該模型還是凸顯了滲流理論在真實世界的網格網絡中的重要作用。
有兩種方法可以增加這種連續滲流網絡的連通程度:在更遠的距離實現直接連接;或者增加節點數,即用戶密度。這些變動都可以被理解成水管系統中那個控制表的旋鈕,順時針任意轉動一下都會增加連通程度。在這些模型中,“存在一個開關,你可以‘咔嗒’一下就實現從局部到全面的連接。”雅内爾說。
對于網格網絡應用程序的設計者來說,找到滲流阈值是一個非常實際的工程問題。想要調控這個網絡中的旋鈕,一種方式是改變設備的功率。網格網絡公司goTenna的首席科學家拉姆·拉瑪納坦說:“關鍵問題是,為了保證網絡連接,你應該如何設定傳輸功率?”如果功率和連通程度存在線性關系的話,答案就相當直觀了——每一次小幅增加功率都會導緻連通程度按一定比例增加。但是,滲透阈值的存在意味着,随着人們的移動而斷開部分連接,網絡有可能會突然失去連通性。因此最佳的功率是在不浪費能源的情況下,始終保證網絡的連接性。
另一種撥動旋鈕的方式是控制節點的密度。具有固定範圍的網格網絡需要一個用戶密度的臨界值,這種網絡最有可能在音樂節、足球比賽等人員擁擠的活動中提供範圍較廣的連接。紐約布魯克林的RedHook等社區正在使用網格網絡,他們将永久性節點固定在建築物的頂部,從而增強互聯網接入。網絡中許多必要的硬件和路由技術仍在發展中,但這并不妨礙我們對未來應用的一些大膽設想,比如在無須依賴任何額外基礎設施的前提下,自動駕駛車輛可以利用網格網絡直接進行通信交流,分享交通狀況或道路障礙的信息。
5.傳染病傳播網絡
我們用一些網絡模型模拟石油在岩石中的流動或電話間的通信網絡。事實上,這些網絡模拟了這些系統的真實空間結構:如果兩個頂點所代表的對象是相連的,就在網絡中用一條邊将它們連通。然而傳染病的傳播網絡更加複雜,這是由于其連接關系是由某種病毒在人與人之間的傳播方式決定的。一個在一家夜總會度過一小時的感染者可能在短短幾天内就将病毒傳向全國甚至整個大洲。
最簡單的流行病學模型會将某一區域的人群簡單地分為易感人群、感染人群和康複人群三類,但一般忽略了人與人之間的複雜聯系結構。在這種模型中,感染者會将傳染病随機傳播給易感人群中的其他人,并且易感人群的每個人被感染的概率相同,例如宿舍中的學生與城市中的普通居民感染的可能性是一樣的。易感人群的感染率取決于基本再生數,即單個感染者造成的新感染者的平均數量,我們将它記為R0。顯然,如果R0大于1,則說明病毒正在傳播;反之,如果R0小于1,則說明疫情正在消退。
但實際上,人與人之間的相互關系會影響傳染病傳播的整體趨勢。例如,2003年暴發的嚴重急性呼吸綜合征(SARS)最初的R0值在2.2到3.6之間,然而現任得克薩斯大學新冠肺炎建模聯盟的負責人勞倫·安塞爾·邁耶斯在2006年的一篇文章中指出,“通過簡單的計算不難看出”,SARS的病例數“比預期要低得多”。她認為,這種差異正是因為預測的時候會認為“所有易感人群被感染的概率相同”,而這一假設忽略了人群關系的複雜性。并且,上述估計的R0值是基于SARS病毒在公寓和醫院中的迅速傳播得出的。與普通人群相比,這兩個地方的人“彼此密切接觸的概率異常之高”。但由于SARS感染者通常很快就會出現嚴重的病情而前往醫院,因此他們無法将SARS病毒傳播給更多的人。
在傳染病的傳播網絡中,連接頂點的邊表示某種具體的傳播關系,例如在一個顯示艾滋病傳播的網絡中,兩個人如果交換了體液,那麼他們所代表的兩個頂點之間就用一條邊連接。新冠病毒的傳播網絡則有所不同:如果兩個人緊密接觸卻沒有呼吸防護,那麼他們之間就用一條邊相連。顯然,諸如禁止商業活動和限制旅行之類的限制措施會改變新冠病毒傳播網絡中邊的結構,同時戴口罩和保持社交距離等措施也是減少病毒在人群中,即點與點之間傳播的方法。找到控制疫情傳播的對策,或者說讓這個傳播網絡斷開的途徑,正是流行病學家們面臨的挑戰。
實際的疾病傳播網絡非常複雜,難以準确描述。而且即使知道網絡的确切結構,也很難進行數學分析。此時,計算機模拟和大數據分析可以用于預測未來的病例數,對比分别保持1米和2米的社交距離所産生的效果,以及定量分析學校和飯店在疫情傳播中的重要性等等。美國東北大學複雜網絡理論學者亞曆山德羅·韋斯皮尼亞尼将這項研究稱為他的“戰時工作”。雖然有時候研究會有一些雜亂,但他已得到了一些決策者和醫護人員急需的即時數字化的結果。如他自己所說,他和同事們已經“将整個社會打包裝入計算機”進行模拟。
和“戰時工作”相比,韋斯皮尼亞尼還有一類屬于“和平時期”的研究:“我們會建立模型、比較權衡不同的建模方法,然後建立特定的方法并研究如何改進所得的結果。”為了從理論上理解網絡形狀和結構特征究竟如何影響傳染病傳播,科學家将目光投向了滲流理論。
事實上,傳統數學中的滲流理論隻提供了一種最簡單的情況下的分析工具,即網絡是人為設定的、有序且對稱的。然而即便如此,韋斯皮尼亞尼也認為:“數學對于指導你的理解是至關重要的。”網絡流行病學家嘗試将傳染病的傳播網絡進行必要的精細化,尤其是針對網絡中頂點的度數(degree)分布。一個頂點的度數指的是與它相連的其他頂點的個數,例如在正方形網絡中,所有頂點的度數都是4。然而在一個傳染病的傳播網絡中,各頂點的度數彼此相差很大:有的人有許多接觸者,從而他們可能将疾病傳播給許多人;同時另一些人則相當孤立,接觸者相當少。
網絡中頂點的度數分布是指一個頂點度數的可能取值以及取這些取值對應的概率。就傳染病的傳播網絡而言,其代表的是一個人感染其他人(或被多少人感染)的可能數量以及相應的概率。為了理解度數分布如何影響滲流的阈值,以邁耶斯為代表的數學流行病學家生成了數千個網絡樣本,這些樣本除了具有相同的度數分布之外是完全任意的。邁耶斯說,通過這種“控制變量”的方法,人們能夠看出度數分布在傳染病的傳播網絡中所起到的作用。如果這些生成網絡樣本的性質與實際網絡相匹配,那麼這些生成網絡中的度數分布或者其他數學特征就很可能與傳染病傳播有關。如果這種匹配非常完美,“那麼你的數學結論就會像你的模拟結果一樣”。
研究表明,在網絡的度數分布較分散,或者說頂點度數的取值範圍較廣的情形下,它的滲流阈值會下降。也就是說,假設有兩個網絡,一個網絡中的每個人都有大緻相同數量的接觸者,另一個網絡中的一部分人有很多接觸者而另一些人較為孤立,那麼在後面這個網絡中,傳染病将更容易傳播。澳大利亞墨爾本樂卓博大學的數學流行病學家喬爾·米勒較為直觀地解釋了這一結論:“如果我的接觸者數量是你的10倍,那麼我被感染的可能性就是你的10倍,同時我傳播疾病的可能性也是你的10倍,因此我在傳染病傳播網絡中的重要性是你的100倍。”
6.未來網絡
滲流理論常常被用來模拟許多有“傳染性”的現象。例如一類表情包最開始在社交媒體上緩慢傳播,之後卻突然出現暴發式擴散。滲流也可以應用于經濟領域的模型,描述一種特定的産品是如何伴随着人們在社交中的分享和推薦而快速占領整個市場。受到人際交流影響的投票模型(votermodel),也顯示出了這樣的門檻效應。
與數學家研究的無限的、整齊有序的網絡相比,現實樣本中得到的網絡模型是有限但雜亂無章的。盡管有限網絡不會像無限網絡那樣,從一個一個小的連通分支瞬間轉化為一個幾乎處處連通的結構,但這種變化仍然非常迅速。為了理解這類過程,研究網絡的學者們在數學理論和計算機模拟之間不斷來回探索。較簡單的網絡能引導他們建立精确的計算機模型,而計算機模拟的結果又會告訴他們如何從手繪的簡單網絡出發,洞察真實世界的本來面目。
許多重要的新冠病毒傳播模型整合了來自其他網絡的信息。學校的課表、交通路線以及醫院員工日程表都能夠形成特定的網絡,并且每個網絡都會影響流行病的傳播。加利福尼亞大學戴維斯分校的複雜網絡學者雷薩·迪蘇紮(RaissaD'Souza)說:“我們生活在一個由相互依賴的網絡組成的系統中,我們不能隻研究其中的某一個而不考慮網絡間的相互影響。”每一個網絡都是一個複雜系統,有着自己的突發行為。研究者正在逐漸将這些網絡組合起來,形成一個更加複雜的系統。但目前還沒有清晰的理論框架來研究網絡相互嵌套的系統。理解多個網絡是如何相互影響的,将會是未來的重大挑戰。
韋斯皮尼亞尼說:“我們身處的地方,既不是一個個孤立的氣泡,也不是一個所有事物都完全混合的地方。我們生活在一個充滿接觸和交流的世界中,我們關注推特賬号,而滲流模型就能出現在這些事件中。”對這些數學模型取得更深入的理解,“可以在未來有所作為。”滲流模型是很容易被接受的,它為數學家提供了新的遊樂場,也為科學家提供了實際的應用。但這些不同的模型有一個令人驚訝的統一特征:它們的變化中都有一個樞軸點(pivotpoint),當系統處于該點附近時,隻需少數幾個連接就可以将整個系統連為一體。随着世界中的聯系變得越來越緊密,理解這些關鍵變化的必要性也越發迫切。
(翻譯 蔡格非 馮煜陽 楊鵬)
(《環球科學》雜志社供稿)
《光明日報》( 2021年05月13日14版)
來源: 光明網-《光明日報》
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!