可調整地區單元問題

可調整地區單元問題(英語:modifiable areal unit problemMAUP)是統計偏差的一個來源,會嚴重影響統計假設檢定的結果。當將基於點的空間現象度量匯總到區域中時(例如人口密度或疾病發生率),MAUP會影響結果。所得匯總值(例:總計、比率、比例、密度)受匯總單元的形狀和尺度的影響。[1]

MAUP distortion example
可調整地區單元問題和患病率計算失真的示例

例如,人口普查數據可以按照縣、區、人口普查區、郵政編碼區域、公安轄區或其他任意的空間單元來匯總。因此,數據匯總的結果取決於地圖製作者在其分析中對「可調整地區單元」的選用。基於省、州邊界計算人口密度並繪製的人口面量圖與基於縣邊界計算密度所得出的結果可能截然不同。此外,人口普查區的邊界也會隨着時間而變化,[2]這意味着對比新舊數據時必須考慮可調整地區單元問題。

背景 編輯

該問題最早在1934年由Gehlke和Biehl發現[3],隨後在Openshaw(1984)的著名論文和Arbia(1988)的書中得到了詳細描述。尤其是Openshaw(1984)觀察到「許多地理研究中使用的地區單元(區域物件)是任意的、可修改的,並且受制於進行匯總的人的心血來潮和幻想」。[4]當將匯總數據用於空間流行病學英語spatial epidemiology空間統計面量圖作圖的聚類分析時,問題尤其明顯,在這種情況下很容在沒有意識到的情況下對數據作出不恰當的解讀。當基於匯總數據從統計中得出推論時,許多科學領域,特別是人文地理學領域都容易忽略MAUP。MAUP與區群謬誤和區群偏差這一主題密切相關(Arbia,1988)。

MAUP引起的區群偏差有兩個分別的效應,二者通常在匯總數據分析時同時發生。其中,尺度效應(scale effect)會導致不同聚合水平(徑向距離)下統計結果的差異。因此,變量間的關聯取決於數據地區單元的大小。通常,面積單位越大,相關性趨於更強。而區劃效應(zoning effect)是指將數據在相同尺度(區域形狀)下,區域的不同的劃分組合方式會導致的相關統計量的變化。[5]

自1930年代以來,研究發現統計結果由於MAUP而存在額外差異。計算組內和組間方差的標準方法忽視了在MAUP研究中隨組的變化而產生的額外方差。MAUP可以用作計算多組空間分組的上限和下限以及平均迴歸參數的方法。MAUP是空間研究(無論是觀察研究還是實驗研究)中誤差的重要來源。因此,單元的一致性至關重要,尤其在涉及時間序列橫截面(TSCS)時。此外,應常規執行對替代空間匯總的單元敏感性的穩健性檢驗,以減輕對所得統計估計值的有關偏差。

解決方案 編輯

現有文獻提出了一些減少迴歸分析中匯總偏誤的建議。研究人員可能會使用來自個體級別數據的樣本來校正方差-協方差矩陣。[6]或者,可以將重點放在局部空間迴歸上而不是全局迴歸上。研究人員還可試圖設計地區單元以最大化特定的統計結果。[4]另一些人則認為,可能難以為多個變量構建單一的一套最佳的匯總單元,每個變量可能會以不同的方式表現出跨空間的非平穩性和空間自相關。其他人則建議開發統計數據,這種統計數據在跨尺度時以可預測的方式變化,例如可能可以使用分形維數作為空間關係的尺度不敏感方法。還有人則建議將貝葉斯層次模型作為一種綜合方法,將匯總的和個體級別的數據結合起來以進行區群推斷。

由於無法控制多個空間變量之間的關係,因此基於經驗數據的MAUP研究只能提供有限的洞察。要控制個體級別數據的各種屬性,必須進行數據模擬。模擬研究表明,變量的空間支持可以影響由空間數據聚合引起的區群偏差的大小。[7]

MAUP敏感性分析 編輯

通過使用單變量數據的模擬,Larsen提倡使用方差比來研究空間配置、空間關聯和數據匯總的影響。[8]雷諾茲(Reynolds)提出了由於MAUP引起的統計變化的詳細描述,他證明了數據值的空間配置和空間自相關的重要性。[9]斯威夫特(Swift)擴大了雷諾(Reynold)的模擬實驗的範圍,斯威夫特(Swift)通過模擬迴歸分析和空間趨勢進行了九次模擬,然後重點關注空間流行病學語境下的MAUP。他提出了一種MAUP敏感性分析的方法,該方法證明了MAUP並不只是問題。[7]MAUP也可以用作分析工具,以幫助了解空間異質性和空間自相關。

這一點特別重要,因為在某些情況下,數據匯總會掩蓋變量之間的強相關性,從而使該關係顯得微弱甚至變成負向的。MAUP也可能導致隨機變量出現似是而非的顯著關聯。多元迴歸參數比相關係數對MAUP更為敏感。在找到解決MAUP的更多分析方法前,建議使用各種地區單元的空間敏感性分析作為一種方法來估算由區群偏差引起的相關性和迴歸系數的不確定性。現已有使用ArcPy庫進行數據模擬和重新匯總的示例。[10][11]

在交通規劃中,交通小區英語traffic analysis zone劃分(Traffic Analysis Zoning,TAZ)中伴隨者MAUP。要理解交通分析中的問題,主要出發點是認識到空間分析具有空間離散化導致的某些局限。其中劃定交通小區時,可調整地區單元問題和邊界問題英語Boundary problem (spatial analysis)直接或間接地與交通分析和規劃相關——大多數交通研究需要直接或間接地定義交通小區。在確定交通小區時,應特別注意可調整邊界和尺度的問題,因為這些因素會對空間形態的統計和數學特性產生影響(即可調整地區單元問題)。在Viegas、Martinez和Silva(2009,2009b)的研究中[11],作者提出了一種方法,其中從空間數據研究中獲得的結果並非與尺度無關,且聚合的影響隱含在區域邊界的選取中。交通小區邊界的劃定直接影響交通預測模型獲得的結果的真實性和準確性。該研究使用不同的網格(大小和原點位置)測量和分析了MAUP對交通小區定義和運輸需求模型的影響。這一分析是通過構建集成在商業GIS軟件中的應用並進行案例研究(里斯本都市區)來測試其實施性和性能。結果表明,在交通規劃模型的交通分配步驟中,統計精度和地理精度之間存在衝突,且它們與資訊損失之間存在關係。

參見 編輯

一般主題
具體應用

參考資料 編輯

  1. ^ MAUP | Definition – Esri Support GIS Dictionary. support.esri.com. [2017-03-09]. (原始內容存檔於2017-03-12). 
  2. ^ Geography, US Census Bureau. Geographic Boundary Change Notes. www.census.gov. [2017-02-24]. (原始內容存檔於2019-03-13) (美國英語). 
  3. ^ Gehlke & Biehl 1934
  4. ^ 4.0 4.1 Openshaw 1983
  5. ^ Fotheringham, A. S.; Rogerson, P. A. The Modifiable Areal Unit Problem (MAUP). The SAGE handbook of spatial analysis. Sage. 2008: 105–124. ISBN 978-1-4129-1082-8. 
  6. ^ Holt D, Steel D, Tranmer M, Wrigley N. (1996). 「Aggregation and ecological effects in geographically based data.」 「Geographical Analysis」 28:244{261
  7. ^ 7.0 7.1 Swift, A., Liu, L., and Uber, J. (2008) "Reducing MAUP bias of correlation statistics between water quality and GI illness." Computers, Environment and Urban Systems 32, 134–148
  8. ^ Larsen, J. (2000). "The Modifiable Areal Unit Problem: A problem or a source of spatial information?" PhD thesis, Ohio State University.
  9. ^ Reynolds, H. (1998). "The Modifiable Area Unit Problem: Empirical Analysis By Statistical Simulation." PhD thesis, Department of Geography University of Toronto, http://www.badpets.net/Thesis頁面存檔備份,存於互聯網檔案館
  10. ^ Swift, A. (2017). "Crime mapping data simulation", https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene頁面存檔備份,存於互聯網檔案館
  11. ^ 11.0 11.1 Viegas, José Manuel; Martinez, L. Miguel; Silva, Elisabete A. Effects of the Modifiable Areal Unit Problem on the Delineation of Traffic Analysis Zones. Environment and Planning B: Planning and Design. January 2009, 36 (4): 625–643. doi:10.1068/b34033. 

參考文獻 編輯

  • Arbia, Giuseppe. Spatial data configuration in then statistical analysis of regional economic and related problems. Dordrecht: Kluwer Academic Publishers. 1988. 
  •   This article contains quotations from Modifiable areal unit problem頁面存檔備份,存於互聯網檔案館) at the GIS Wiki, which is available under the Creative Commons Attribution 3.0 Unported (CC BY 3.0) license.
  • Gehlke, C. E.; Biehl, Katherine. Certain effects of grouping upon the size of the correlation coefficient in census tract material. Journal of the American Statistical Association. March 1934, 29 (185A): 169–170. JSTOR 2277827. doi:10.2307/2277827. 
  • Openshaw, Stan. The modifiable areal unit problem. Norwick: Geo Books. 1983. ISBN 0860941345. OCLC 12052482. 
  • Unwin, D. J. (1996). "GIS, spatial analysis and spatial statistics." Progress in Human Geography. 20: 540–551.
  • Cressie, N. (1996). 「Change of Support and the Modifiable Areal Unit Problem.」 「Geographical Systems「, 3:159–180.
  • Viegas, J., E.A. Silva, L. Martinez (2009a). 「Effects of the Modifiable Areal Unit Problem on the Delineation of Traffic Analysis Zones」 「Environment and Planning B – Planning and Design「, 36(4): 625–643.
  • Viegas, J., E.A. Silva, L. Martinez (2009a). 「A traffic analysis zone definition: a new methodology and algorithm」 「Transportation「. 36 (5): 6「, 36 (5): 6 .

延伸閱讀 編輯