人工智能與人口?許多研究機構與學者在嘗試利用飛速發展的技術與算法,實現更加準确的人口分布測算,進而為不同地區提供更有保障的生活、醫療、教育與現代社會資源,下面我們就來聊聊關于人工智能與人口?接下來我們就一起去了解一下吧!
許多研究機構與學者在嘗試利用飛速發展的技術與算法,實現更加準确的人口分布測算,進而為不同地區提供更有保障的生活、醫療、教育與現代社會資源。
脊髓灰質炎,又稱小兒麻痹症,是由脊髓灰質炎病毒導緻的傳染病。為了防止脊髓灰質炎病毒傳播,絕大多數新生兒在5歲前都要接種脊髓灰質炎疫苗。
中國的“免費提供、強制接種”制度,讓這種疾病幾乎絕迹。而在另一些國家——比如尼日利亞——脊髓灰質炎仍一度成為區域流行病。這背後很大一部分原因是疫苗資源分配的問題:有些地區的疫苗供給大于實際需求數量,而另一些地區的疫苗則可能不夠用。
那麼,如何才能更準确地估計出不同地區的疫苗需求、把有限的疫苗資源最合理地分配給亟待注射的兒童?
需要精準地知道不同地區兒童數量的分布。
一張特殊的地圖
根據尼日利亞官方最新統計數據,人口密度最高的拉各斯州大約有900萬常住人口,北部的卡杜納州則是600萬,聯邦首都特區為140萬。更進一步,我們還能獲得各州内“地方政府轄區”的人口數量,結合經典人口學方法,似乎很容易就能得知不同區域5歲以下兒童人口的數字。
■ 拉各斯州過大的人口密度導緻交通擁擠 / CNN
這就是我們需要的數據嗎?很遺憾,這個答案并不完美。如果帶着救命的疫苗站在尼日利亞的土地上,你會發現這些統計結果給到的幫助十分有限。
尼日利亞每個行政單位内的人口分布并不均勻。以拉各斯州為例,州内大約90%的人口都分布在拉各斯城市帶,而拉各斯城市帶僅占全州面積的約1/3。
除此之外,相較于經濟發達地區,貧窮地區往往更加地廣人稀,獲取疫苗的成本也更高,因此需要更加準确的人口分布與資源分配方案。而當前的統計結果隻能告訴你:在這廣闊的100平方公裡内居住了10戶人家,至于這些居民的具體位置,它則一無所知。
為了解決這些弊端,20世紀初,一位俄羅斯地理學家發明了分區密度地圖(dasymetric map)。這種地圖需要利用人口統計結果,但卻擺脫了以行政單位劃分人口的限制。
這是怎麼做到的呢?
分區密度地圖引入了許多輔助信息,其中既包括山嶺、水域等地形信息,也包括農田、森林等土地性質信息。随着地理信息系統(GIS)的發展,道路、建築等設施的遙感圖像也被添加進來。這些信息可以體現不同地理環境下,人口分布水平的大緻範圍,将它們與人口統計數據相結合,就可以獲得更加符合真實情況的人口分布地圖了。
■ 俄勒岡阿斯托裡亞市普通人口分布圖與分區密度地圖 / iScientist | 向右滑動查看更多
随着技術的發展,“區”分得越來越小,反映出的人口分布水平也越來越準确。帶着這張地圖,我們就能清楚地知道一片區域内到底有多少需要疫苗的孩子,以及如何才能有效地實現疫苗調配了。
然而,分區密度地圖能完全解決尼日利亞的問題嗎?
答案是不盡然。
尼日利亞的困局與轉機
還記得前文中提到的尼日利亞各州人口數據嗎?——不用回去翻,因為那些數字已經無法代表真實情況了。上一次尼日利亞官方更新人口統計數據,是2006年。
一次大規模人口普查的平均成本大約為1-2美元/人,而尼日利亞的人口接近2億,全國性人口普查會是一筆不小的費用。
其實尼日利亞的經濟情況在非洲尚且算好,更多貧窮的國家因為高額的成本、糟糕的經濟加上動蕩的政權,可能在過去幾十年間都沒有進行過規範的全國性人口普查。
甚至對于已經完成的普查結果來說,數據的準确性也需要打上一個問号。2006年尼日利亞全國人口普查顯示拉各斯州擁有900萬人口,而同一時期,拉各斯州當地政府進行的調查則顯示拉各斯州人口為1750萬,相差達近兩倍之多。
在數據老舊過時、可靠性差的情況下,分區密度地圖方法也難以得到準确的人口分布結果,更不用說利用它進行有效的疫苗規劃了。
尼日利亞需要新的解決方案。
2017年,英國南安普頓大學的世界人口計劃項目組,與比爾及梅琳達·蓋茨基金會、美國橡樹嶺國家實驗室聯合發表了一篇學術論文。這篇文章講述的人口分布估計新方法,成功提升了整個尼日利亞地區疫苗規劃方案的效率與效果。
這種方法擺脫了對大規模人口普查的依賴,從尼日利亞北部卡杜納州與卡諾州的總體人口與5歲以下兒童分布測算開始,逐漸推廣到了整個尼日利亞疫苗追蹤系統。
■ 疫苗追蹤系統推動了全球根除脊髓灰質炎的進程 / Novel-T
它的實現得益于——高清衛星地圖。
當下流行的地圖類手機應用中都存在一個圖層,叫做“衛星地圖”。選擇展示這一圖層,你會發現你身處的建築、甚至建築上的窗戶都清晰可見。
現在高清衛星地圖的精度可以達到1米以内,這讓人口學家們發覺了其中的潛力:能不能從衛星地圖上獲取建築信息,通過計算不同建築内的人口密度,測算出特定區域的人口分布呢?
答案是肯定的。
首先,研究者們借助機器學習方法,分兩步從高清衛星地圖中識别、提取出了7類有人居住的建築,其中包括6種不同的城市建築以及1種鄉村建築。他們的假設是:這7種建築間存在人口居住密度的差異,而同類建築則具有相同的人口居住密度。
然後,研究者們對目标地區進行了小規模人口普查。
他們從地圖上随機抽取了覆蓋不同建築類别的樣本區域,每個樣本區域覆蓋25-50座同類建築,研究者們雇傭當地非政府組織,對每座建築中的人口狀況進行了調查與統計,從而估計出了每類建築的人口居住密度。
■ 兩步建築提取法 圖1:第一步 - 識别“居住區域”與“非居住區域”;圖2:第二步 - 識别不同建築類型;圖3:結果 - 根據不同建築類型估算出的人口居住密度。(左:卡努市 右:卡杜納市 A-F為不同城市建築類型,Z為非居住區) / Elsevier Inc. | 向右滑動查看更多
結合不同類别建築的人口居住密度信息,與實際抽樣人口數,研究者們就可以得到人口分布結果了。
他們将這種人口分布的估計方法稱為“自下而上”法——先對小範圍地區進行人口調查,然後通過統計模型估計未調查地區的人口分布水平。
與傳統的“自頂向下”法(從全國性人口普查數據出發,将人口逐步拆解分配到不同空間區域)相比,這種方法的測算成本能夠下降數十倍。
與此同時,新方法也提升了測算結果的精度——“自下而上”法能夠測算90米×90米小方塊中的人口密度,而當時其他人口分布測算方法的精度隻有1千米左右。
十年前,尼日利亞暴發的脊髓灰質炎病例占到了全球病例的一半以上。十年後,2020年8月,世界衛生組織正式宣布尼日利亞已經不再屬于脊髓灰質炎流行區域。
尼日利亞勝利了。
“看見每一個人”
除了實現疫苗資源分配之外,人口分布數據還能提供什麼幫助?
2013年到2016年,西非暴發了有記錄以來最嚴重的埃博拉疫情(一種平均死亡率約為50%的病毒感染)。過去許多次埃博拉疫情都暴發于與世隔絕的村莊,因此病毒沒有得到大規模擴散。這一次疫情爆發初期,人們也如此認為。
直到——2014年無國界醫生組織報告利比裡亞首都蒙羅維亞,已經面臨“災難性”公共衛生危機,世界衛生組織報告英國、美國和西班牙也出現了埃博拉感染個案。後續的分析認為,如果人們能及時确定疫情暴發源頭的地理位置與人口規模——知曉當地村落分布與人口分布——從而估算出更準确的疫情傳染率,一切也許不會演變成最終的局面。
在欠發達地區,疫情傳染率與疾病發生率的估算都是不小的挑戰。除此之外,各種資源需求及成本評估、災難應對規劃以及社會經濟指标測算也面臨着許多障礙。這些問題也正是聯合國2015年公布的可持續發展目标(SDG)中需要解決的重要問題,而人口分布的精确測量,恰恰能為這些問題提供解決方案。
随着高清地圖資源的豐富與人工智能算法的發展,許多科技公司也加入了人口分布測算的研究。過去幾年間,臉書(Facebook)與美國哥倫比亞大學以及世界銀行合作,預測并公布了世界上絕大部分地區的人口分布地圖。借助深度卷積神經網絡與半監督學習等人工智能前沿算法與高清衛星圖像,他們得到的人口分布地圖在偏遠地區也能夠達到30米的量級,如同給地球這張大地圖插上了無數關鍵的“偵查守衛”,照亮了世界的每一個角度。
■ 基于深度卷積神經網絡的非洲人口分布預測 / 臉書
臉書發布的人口分布數據,幫助國際紅十字會推進了高效率、低成本的非洲馬拉維麻風疫苗接種運動,協助世界糧食計劃署完成了災難應急響應規劃,并為推動欠發達地區的電氣與通信網絡鋪設提供了寶貴而準确的信息。
與此同時,還有許多研究機構與學者在嘗試利用飛速發展的技術與算法,實現更加準确的人口分布測算,進而為不同地區提供更有保障的生活、醫療、教育與現代社會資源。
聯合國可持續發展目标的一項基本原則是“不讓任何人掉隊”,希望不斷進步的人口分布測算方法,終有一天能讓我們 “看見每一個人”。
作者:氪羅鋇路斯
康奈爾大學細胞生物學PhD,研究方向是用各種毒物搞瓜蟲子的線粒體,現在同時騎着生物和碼農的牆頭不想下去
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!