11. 공간 분석(보간)

gentleLogo

목적

공간 분석의 일부분으로써의 보간(interpolation)을 이해하기

키워드

포인트 데이터, 보간법, 역거리 가중, 불규칙 삼각망

11.1. 개관

공간 분석(spatial analysis) 이란 원본 데이터로부터 새로운 정보와 의미를 뽑아내기 위해 공간 정보를 처리하는 과정입니다. 일반적으로 GIS(Geographic Information System)를 통해 공간 분석을 수행합니다. GIS는 일반적으로 객체 통계를 계산하고 데이터 보간으로써의 지리 정보 처리를 수행하기 위한 공간 분석 도구들을 제공합니다. 수문학에서는 지형 분석 및 (지표 및 지하에서의 물의 이동을 모델화하는) 수문학 모델링을 강조하는 편입니다. 야생 동식물 관리에서는 야생 동식물의 점 위치(point location) 및 점 위치가 주변 환경과 맺는 관계를 다루는 분석 기능에 집중합니다. 각기 다른 분야에서도, 해야 하는 작업 유형에 따라 서로 다른 사항에 집중하게 될 것입니다.

11.2. 공간 보간을 더 자세

공간 보간(spatial interpolation)이란 알려진 값을 가진 포인트들을 이용해서 다른 알려지지 않은 포인트의 값을 추정하는 과정입니다. 예를 들어, 어떤 나라의 기온 맵을 만든다고 할 때 전체 지역을 커버할 만큼 고르게 분포된 기상관측소를 충분히 찾기란 힘든 일입니다. 공간 보간을 이용하면 기록된 데이터가 없는 위치의 기온도 가까이 있는 기상관측소의 기록값을 통해 추정할 수 있습니다. (그림 11.40 을 참조하세요.) 이런 유형의 보간된 지표면을 보통 통계 지표면(statistical surface) 이라 합니다. 표고 데이터, 강수량, 적설량, 지하수위, 인구밀도 등등 다른 데이터 유형도 보간법으로 계산할 수 있습니다.

../../_images/temperature_map.png

그림 11.40 남아프리카 기상관측소에서 보간한 기온

높은 비용과 제한된 자원으로 인해, 제한된 개수의 선택된 점 위치에서만 데이터 수집이 이루어지는 경우가 많습니다. GIS에서 이런 포인트들을 보간하면 모든 래스터 셀에 대해 생성한 추정값으로 래스터 지표면을 생성하도록 할 수 있습니다.

단락 없는 맵을 — 예를 들어 GPS 기기로 측정한 표고 포인트들로부터 수치 표고 맵을 재생하기 위해서는, 샘플이나 측정값이 없는 위치에서의 값을 최적으로 추정하기 위한 적절한 보간법(interpolation method)을 사용해야 합니다. 그 다음 모델링 및 전체 영역을 커버하는 분석을 위해 보간 분석을 사용할 수 있습니다.

보간법은 여러 가지가 있습니다. 〈GIS에 대한 친절한 소개〉 에서는 널리 쓰이는 두 가지 보간법을 소개할 것입니다. 바로 역거리 가중(Inverse Distance Weighting; IDW)불규칙 삼각망(Triangulated Irregular Networks; TIN) 입니다. 이외의 보간법을 찾고 있다면, 이번 단원 마지막에 있는 〈더 읽어볼 거리〉 부분을 참조하세요.

11.3. 역거리 가중(IDW)

IDW 보간법에서는, 보간 처리 과정에서 어떤 포인트가 사용자가 생성하고자 하는 알려지지 않은 포인트로부터 멀어질수록 해당 포인트의 영향력이 다른 포인트에 상대적으로 낮아지도록 샘플 포인트에 가중치를 부여합니다. (그림 11.41 을 참조하세요.)

../../_images/idw_interpolation.png

그림 11.41 가중치를 부여한 샘플 포인트 거리에 기반한 역거리 가중 보간(왼쪽). 표고 벡터 포인트로부터 보간한 IDW 지표면(오른쪽). 이미지 출처: Mitas, L., Mitasova, H. (1999).

가중 영향력이 새 포인트로부터의 거리가 증가할수록 얼마나 떨어지는지를 제어하는 가중치 계수(weighting coefficient)를 사용해서 샘플 포인트에 가중치를 부여합니다. 가중치 계수가 클수록, 보간 과정에서 알려지지 않은 포인트로부터 멀리 있는 경우, 포인트가 받는 영향도 줄어들 것입니다. 계수가 증가할수록, 알려지지 않은 포인트의 값이 최근접 관측 포인트의 값에 근접합니다.

IDW 보간법에도 단점이 있다는 사실을 아는 것이 중요합니다. 샘플 데이터의 분포가 고르지 않을 경우 보간 결과의 질이 떨어질 수 있습니다. 게다가 보간된 지표면에서 최대 및 최소값은 샘플 데이터 포인트에만 존재할 수 있습니다. 이런 단점들 때문에, 그림 11.41 에서 볼 수 있는 바와 같이 샘플 데이터 포인트 주변에 조그만 마루와 골(peaks and pits)이 생기는 경우가 많습니다.

In GIS, interpolation results are usually shown as a 2 dimensional raster layer. In 그림 11.42, you can see a typical IDW interpolation result, based on elevation sample points collected in the field with a GPS device.

../../_images/idw_result.png

그림 11.42 IDW interpolation result from irregularly collected elevation sample points (shown as black crosses).

11.4. Triangulated Irregular Network (TIN)

TIN interpolation is another popular tool in GIS. A common TIN algorithm is called Delaunay triangulation. It tries to create a surface formed by triangles of nearest neighbour points. To do this, circumcircles around selected sample points are created and their intersections are connected to a network of non overlapping and as compact as possible triangles (see 그림 11.43).

../../_images/tin_interpolation.png

그림 11.43 Delaunay triangulation with circumcircles around the red sample data. The resulting interpolated TIN surface created from elevation vector points is shown on the right. Image Source: Mitas, L., Mitasova, H. (1999).

The main disadvantage of the TIN interpolation is that the surfaces are not smooth and may give a jagged appearance. This is caused by discontinuous slopes at the triangle edges and sample data points. In addition, triangulation is generally not suitable for extrapolation beyond the area with collected sample data points (see 그림 11.44 ).

../../_images/tin_result.png

그림 11.44 Delaunay TIN interpolation result from irregularly collected rainfall sample points (blue circles)

11.5. 공통적으로 조심해야 할 문제들/사항들

It is important to remember that there is no single interpolation method that can be applied to all situations. Some are more exact and useful than others but take longer to calculate. They all have advantages and disadvantages. In practice, selection of a particular interpolation method should depend upon the sample data, the type of surfaces to be generated and tolerance of estimation errors. Generally, a three step procedure is recommended:

  1. Evaluate the sample data. Do this to get an idea on how data are distributed in the area, as this may provide hints on which interpolation method to use.

  2. Apply an interpolation method which is most suitable to both the sample data and the study objectives. When you are in doubt, try several methods, if available.

  3. Compare the results and find the best result and the most suitable method. This may look like a time consuming process at the beginning. However, as you gain experience and knowledge of different interpolation methods, the time required for generating the most suitable surface will be greatly reduced.

11.6. Other interpolation methods

Although we concentrated on IDW and TIN interpolation methods in this worksheet, there are more spatial interpolation methods provided in GIS, such as Regularized Splines with Tension (RST), Kriging or Trend Surface interpolation. See the additional reading section below for a web link.

11.7. 무엇을 배웠나요?

이제 이번 단원에서 배운 내용을 정리해볼까요:

  • Interpolation uses vector points with known values to estimate values at unknown locations to create a raster surface covering an entire area.

  • The interpolation result is typically a raster layer.

  • It is important to find a suitable interpolation method to optimally estimate values for unknown locations.

  • IDW interpolation gives weights to sample points, such that the influence of one point on another declines with distance from the new point being estimated.

  • TIN interpolation uses sample points to create a surface formed by triangles based on nearest neighbour point information.

11.8. 도전해봅시다!

강사와 학생들이 함께 시도해볼 만한 몇 가지 아이디어가 있습니다:

  • The Department of Agriculture plans to cultivate new land in your area but apart from the character of the soils, they want to know if the rainfall is sufficient for a good harvest. All the information they have available comes from a few weather stations around the area. Create an interpolated surface with your learners that shows which areas are likely to receive the highest rainfall.

  • The tourist office wants to publish information about the weather conditions in January and February. They have temperature, rainfall and wind strength data and ask you to interpolate their data to estimate places where tourists will probably have optimal weather conditions with mild temperatures, no rainfall and little wind strength. Can you identify the areas in your region that meet these criteria?

11.9. 생각해볼 점

If you don’t have a computer available, you can use a toposheet and a ruler to estimate elevation values between contour lines or rainfall values between fictional weather stations. For example, if rainfall at weather station A is 50 mm per month and at weather station B it is 90 mm, you can estimate, that the rainfall at half the distance between weather station A and B is 70 mm.

11.10. 더 읽어볼 거리

Books:

  • Chang, Kang-Tsung (2006). Introduction to Geographic Information Systems. 3rd Edition. McGraw Hill. ISBN: 0070658986

  • DeMers, Michael N. (2005): Fundamentals of Geographic Information Systems. 3rd Edition. Wiley. ISBN: 9814126195

  • Mitas, L., Mitasova, H. (1999). Spatial Interpolation. In: P.Longley, M.F. Goodchild, D.J. Maguire, D.W.Rhind (Eds.), Geographical Information Systems: Principles, Techniques, Management and Applications, Wiley.

Websites:

The QGIS User Guide also has more detailed information on interpolation tools provided in QGIS.

11.11. 이 다음은?

이 교재의 마지막 단원이었습니다. QGIS를 탐구하고 그에 딸린 QGIS 사용자 지침서를 사용해서 GIS 소프트웨어로 해볼 수 있는 다른 모든 일들을 발견해보시길 권합니다!