WiDS Global Datathon 2026
Predicting Time-to-Threat for Evacuation Zones Using Survival Analysis
Problem
산불이 발생하면, 긴급 대응 관리자와 현장 대응 인력은 어떤 지역 사회에 경보를 발령할지, 언제 경보를 발령할지, 그리고 제한된 자원을 어디에 배치할지를 신속히 결정해야 합니다. 이러한 결정은 확실한 정보가 확보되기 이전에 내려져야 합니다. 따라서 대응 과정에서는 우선순위 판단(어떤 산불이 가까운 시점에 가장 긴급한지)과 보정된 위험 추정치(산불이 실제로 대피구역을 위협할 가능성이 실행 가능한 시간 범위 내에서 얼마나 되는지)가 동시에 요구됩니다.
이 대회는 이러한 운영상의 필요를 생존분석(survival analysis) 문제로 정식화했습니다. 참가자는 여러 시간 지평선에 걸쳐 보정된 확률 예측값을 생성함으로써, 실제 현장에서의 의사결정을 지원하게 됩니다.\
Column
Identifier / Target
- event_id : 시간 정보와 상관 없는 익명화된 산불 사건 ID
- time_to_hit_hours : 산불 발생 후 초기 5시간이 지난 시점부터, 산불이 대피구역 중심 반경 5km 이내에 도달하기까지 걸린 시간, 72시간 이내에 도달하지 않은 경우에는, “도달하지 않았다”는 사실이 마지막으로 확인된 시점까지의 시간만 기록된 검열(censored) 값이다. 생존분석 모델의 시간 변수로 사용
- event : 산불이 72시간 이내에 대피구역을 실제로 위협했는지를 나타내는 지표, 1이면 72시간 내 도달, 0이면 끝까지 도달하지 않은 검열 사례를 의미
Temporal Coverage (초기 관측 품질)
- num_perimeters_0_5h : 산불 발생 후 처음 5시간 동안 관측된 경계(perimeter) 수
- dt_first_last_0_5h : 처음과 마지막 경계 관측 사이의 시간 간격(시간)
- low_temporal_resolution_0_5h : 관측 해상도가 낮은 경우 표시 (시간 간격이 0.5시간 미만이거나 경계가 1개뿐이면 1, 아니면 0)
Distance (대피구역과의 거리 — 핵심 위험 지표)
- dist_min_ci_0_5h
초기 5시간 동안 산불과 가장 가까운 대피구역 중심 사이의 최소 거리이다.
현재 위험 수준을 가장 직관적으로 보여주는 핵심 변수다.
- dist_std_ci_0_5h
초기 5시간 동안 대피구역과의 거리 변동성을 나타내며, 접근·이탈이 얼마나 불규칙했는지를 보여준다.
- dist_change_ci_0_5h
초기 시점 대비 5시간 후 대피구역과의 거리 변화량이다. 값이 음수일수록 대피구역에 가까워지고 있음을 의미한다.
- dist_slope_ci_0_5h
시간에 따른 거리 변화의 추세를 선형 기울기로 나타낸 값이다.
- closing_speed_m_per_h
산불이 대피구역 방향으로 얼마나 빠르게 접근하고 있는지를 나타내는 속도 지표이다. 양수일수록 위험이 증가 중임을 의미한다.
- closing_speed_abs_m_per_h
접근·이탈 방향과 관계없이 거리 변화 속도의 크기만을 나타낸 값이다.
- projected_advance_m
초기 거리 대비, 5시간 동안 대피구역 방향으로 실제로 얼마나 전진했는지를 나타낸다.
- dist_accel_m_per_h2
대피구역과의 거리 변화 속도가 시간이 지나며 얼마나 빨라지거나 느려졌는지를 보여주는 가속도 지표이다.
- dist_fit_r2_0_5h
거리 변화가 시간에 따라 얼마나 직선적으로 설명되는지를 나타내는 값으로, 거리 추세의 안정성을 의미한다.
Directionality (이동 방향 정렬)
- alignment_cos
산불 이동 방향과 대피구역 방향이 얼마나 일치하는지를 코사인 값으로 나타낸다.
- alignment_abs
이동 방향의 정렬 정도를 0~1 사이 값으로 표현한 지표로, 값이 클수록 대피구역 쪽으로 향하고 있음을 의미한다.
- cross_track_component
대피구역 방향과 수직으로 이동하는 성분으로, 옆으로 빗나가는 움직임의 크기를 나타낸다.
- along_track_speed
대피구역 방향을 따라 이동하는 속도 성분으로, 실제 위협으로 이어질 가능성과 직접적으로 연결된다.
Temporal Metadata (시간적 배경 정보)
- event_start_hour
산불이 시작된 시각으로, 일중 시간대에 따른 위험 패턴을 반영할 수 있다.
- event_start_dayofweek
산불 발생 요일을 나타내며, 주말·평일에 따른 관측·대응 차이를 간접적으로 반영할 수 있다.
- event_start_month
산불 발생 월로, 계절적 요인을 반영하기 위한 변수이다.
