Search
📊

보험 사기 탐지 모델

소셜 네트워크 모델

핵심 아이디어:

보험사기 사건은 특정 병원, 브로커, 설계사, 고객 간의 반복/공모 관계가 있는 경우가 많음 →
그래서 이 관계를 그래프로 모델링해서 의심되는 구조를 시각화 + 예측

사용 도구:

R 패키지: igraph, ggraph, tidygraph
library(igraph) edges <- data.frame(from = accident_data$customer_id, to = accident_data$hospital_id) graph <- graph_from_data_frame(edges, directed = FALSE) # 중심성 분석 V(graph)$betweenness <- betweenness(graph) V(graph)$degree <- degree(graph)
R
복사

의심 징후 탐지 방법:

방법
설명
중심성 높은 노드
특정 병원이나 설계사가 여러 고객과 연결되어 있음
클러스터링
특정 그룹끼리만 연결되어 있을 경우 → 사기 조합 가능성
커뮤니티 탐지
cluster_fast_greedy(), cluster_louvain() 등으로 공모 관계 추정

R Shiny 대시보드 구현

주요 기능 설계

기능
설명
네트워크 시각화
고객-병원-설계사 간 관계 시각화 (visNetwork, ggraph)
고객 조회
고객 ID 입력 → 해당 노드 및 연결 관계 표시
위험 탐지
FP, 병원 중심성이 높은 노드 하이라이트
사고 통계
지역별, 기간별 SIU 사고 분포 그래프

기본 구조 예시

library(shiny) library(igraph) library(visNetwork) ui <- fluidPage( titlePanel("SIU 사고 탐지 네트워크"), sidebarLayout( sidebarPanel( textInput("target_id", "고객 ID 조회"), actionButton("search", "조회") ), mainPanel( visNetworkOutput("network_plot") ) ) ) server <- function(input, output) { output$network_plot <- renderVisNetwork({ # 네트워크 생성 및 필터링 graph <- graph_from_data_frame(edges) visNetwork::visIgraph(graph) }) } shinyApp(ui = ui, server = server)
R
복사

확장 가능성

확장 기능
설명
머신러닝 결합
노드 중심성, 클러스터링 정보 → SIU 사고 예측 모델에 피처로 활용
실시간 데이터 연동
DB 또는 API 연동하여 신규 사고 반영
위험 알림 기능
FP/병원 노드가 일정 위험 이상이면 UI에 경고 표시

보험 계약 이상 패턴 탐지 모델

목적

보험 계약의 유용/횡령 리스크를 FP와 계약의 특성 데이터를 기반으로 정량화하고 스코어링하는 모델 개발

1. 데이터 수집 및 통합

데이터 유형
주요 변수
보험 계약 정보
계약 ID, 상품 유형, 보험료, 납입 주기, 계약일, 해약일
FP 정보
FP ID, 소속 지역단, 활동 기간, 담당 계약 수, 이직/이탈 이력
수금 이력
수금 방식(현금, 카드, 자동이체), 수금일, 지연 여부, 환수 이력
이상 사례 라벨
유용/횡령으로 확정된 계약(=라벨) 또는 내부 감지 사례
→ 라벨이 있으면 지도학습, 없으면 비지도/이상치 탐지 기반으로 접근

2. Feature Engineering (리스크 탐지용 변수 생성)

분류
예시 변수
계약 기반
단기해약 비율, 첫 납입 후 해약까지의 일수, 보험료 대비 수금 방식
FP 기반
FP 담당 계약 중 유사 이상 이력 비율, FP의 해약률, 동일 FP 반복계약 비율
수금 이상
같은 카드로 여러 명이 결제, FP 본인 명의 카드 사용 비율
시계열 패턴
특정 날짜에 집중된 수금, 계약-해약 주기 반복 여부 등
특히 FP와 계약 간의 연결성 기반의 네트워크 지표(소셜 네트워크 모델)도 유용하다
(예: FP가 특정 설계사와 계속 유사한 계약을 반복하고 있다면 위험)

3. 리스크 스코어 모델 개발

지도학습 기반 (라벨 존재 시)
목표: 계약 or FP 단위의 유용/횡령 위험 스코어 예측
모델 예시: XGBoost, Random Forest, LightGBM, Logistic Regression
평가 지표: AUC, Precision@TopK, Risk Ranking Accuracy 등
비지도학습 기반 (라벨 부족 시)
이상 탐지 모델:
Isolation Forest, LOF(Local Outlier Factor)
Autoencoder, One-Class SVM

4. 리스크 스코어 산출 방식 예시

계약 ID
FP ID
리스크 점수 (0~1)
등급
A12345
FP009
0.83
위험
B54321
FP012
0.31
주의
C90123
FP001
0.09
정상
→ 스코어 기반으로 고위험 계약 모니터링 / 추가 조치 / 선제 감사 대상 선별

5. 결과 활용 방안

적용 분야
설명
내부통제 강화
고위험 FP 선제 조사, 반복 계약 모니터링
사기 방지
이상 수금/해약 계약 자동 알림
FP 교육
위험 행동 패턴 피드백 기반 맞춤 교육 운영
감사 대상 추천
리스크 Top N 계약 → 실사 대상 자동 추출
이후 Shiny 또는 BI 툴로 시각화