소셜 네트워크 모델
핵심 아이디어:
보험사기 사건은 특정 병원, 브로커, 설계사, 고객 간의 반복/공모 관계가 있는 경우가 많음 →
그래서 이 관계를 그래프로 모델링해서 의심되는 구조를 시각화 + 예측
사용 도구:
•
R 패키지: igraph, ggraph, tidygraph
library(igraph)
edges <- data.frame(from = accident_data$customer_id,
to = accident_data$hospital_id)
graph <- graph_from_data_frame(edges, directed = FALSE)
# 중심성 분석
V(graph)$betweenness <- betweenness(graph)
V(graph)$degree <- degree(graph)
R
복사
의심 징후 탐지 방법:
방법 | 설명 |
중심성 높은 노드 | 특정 병원이나 설계사가 여러 고객과 연결되어 있음 |
클러스터링 | 특정 그룹끼리만 연결되어 있을 경우 → 사기 조합 가능성 |
커뮤니티 탐지 | cluster_fast_greedy(), cluster_louvain() 등으로 공모 관계 추정 |
R Shiny 대시보드 구현
주요 기능 설계
기능 | 설명 |
고객-병원-설계사 간 관계 시각화 (visNetwork, ggraph) | |
고객 ID 입력 → 해당 노드 및 연결 관계 표시 | |
FP, 병원 중심성이 높은 노드 하이라이트 | |
지역별, 기간별 SIU 사고 분포 그래프 |
기본 구조 예시
library(shiny)
library(igraph)
library(visNetwork)
ui <- fluidPage(
titlePanel("SIU 사고 탐지 네트워크"),
sidebarLayout(
sidebarPanel(
textInput("target_id", "고객 ID 조회"),
actionButton("search", "조회")
),
mainPanel(
visNetworkOutput("network_plot")
)
)
)
server <- function(input, output) {
output$network_plot <- renderVisNetwork({
# 네트워크 생성 및 필터링
graph <- graph_from_data_frame(edges)
visNetwork::visIgraph(graph)
})
}
shinyApp(ui = ui, server = server)
R
복사
확장 가능성
확장 기능 | 설명 |
머신러닝 결합 | 노드 중심성, 클러스터링 정보 → SIU 사고 예측 모델에 피처로 활용 |
실시간 데이터 연동 | DB 또는 API 연동하여 신규 사고 반영 |
위험 알림 기능 | FP/병원 노드가 일정 위험 이상이면 UI에 경고 표시 |
보험 계약 이상 패턴 탐지 모델
목적
보험 계약의 유용/횡령 리스크를 FP와 계약의 특성 데이터를 기반으로 정량화하고 스코어링하는 모델 개발
1. 데이터 수집 및 통합
데이터 유형 | 주요 변수 |
계약 ID, 상품 유형, 보험료, 납입 주기, 계약일, 해약일 | |
FP ID, 소속 지역단, 활동 기간, 담당 계약 수, 이직/이탈 이력 | |
수금 방식(현금, 카드, 자동이체), 수금일, 지연 여부, 환수 이력 | |
유용/횡령으로 확정된 계약(=라벨) 또는 내부 감지 사례 |
→ 라벨이 있으면 지도학습, 없으면 비지도/이상치 탐지 기반으로 접근
2. Feature Engineering (리스크 탐지용 변수 생성)
분류 | 예시 변수 |
계약 기반 | 단기해약 비율, 첫 납입 후 해약까지의 일수, 보험료 대비 수금 방식 |
FP 기반 | FP 담당 계약 중 유사 이상 이력 비율, FP의 해약률, 동일 FP 반복계약 비율 |
수금 이상 | 같은 카드로 여러 명이 결제, FP 본인 명의 카드 사용 비율 |
시계열 패턴 | 특정 날짜에 집중된 수금, 계약-해약 주기 반복 여부 등 |
특히 FP와 계약 간의 연결성 기반의 네트워크 지표(소셜 네트워크 모델)도 유용하다
(예: FP가 특정 설계사와 계속 유사한 계약을 반복하고 있다면 위험)
3. 리스크 스코어 모델 개발
•
지도학습 기반 (라벨 존재 시)
◦
◦
◦
•
비지도학습 기반 (라벨 부족 시)
◦
▪
Isolation Forest, LOF(Local Outlier Factor)
▪
Autoencoder, One-Class SVM
4. 리스크 스코어 산출 방식 예시
계약 ID | FP ID | 리스크 점수 (0~1) | 등급 |
A12345 | FP009 | 0.83 | |
B54321 | FP012 | 0.31 | |
C90123 | FP001 | 0.09 |
→ 스코어 기반으로 고위험 계약 모니터링 / 추가 조치 / 선제 감사 대상 선별
5. 결과 활용 방안
적용 분야 | 설명 |
고위험 FP 선제 조사, 반복 계약 모니터링 | |
이상 수금/해약 계약 자동 알림 | |
위험 행동 패턴 피드백 기반 맞춤 교육 운영 | |
리스크 Top N 계약 → 실사 대상 자동 추출 |
이후 Shiny 또는 BI 툴로 시각화