프로젝트 쿼리 내용과 시각화 자료를 확인하시려면 위 링크를 눌러주세요
Preview
•
목적 : 국가별 코로나 누적 감염비율 비교 및 세계 누적 감염비율 확인
•
역할 : Dbeaver 활용한 MySQL 데이터 분석 및 Tableau 시각화
•
성과 : 국가별 코로나 누적 감염비율 비교와 시각화를 통한 누적 감염 비율 예측
분석의 목적
국가별 코로나 감염 현황과 누적 감염 비율을 한눈에 비교할 수 있게 시각화 하는 것이 목표입니다!
covid-deaths 데이터셋의 국가별 감염자 수와 사망자 수 데이터를 추출하여 국가별 지표값 비교가 용이하게끔 시각화하는 것이 이 프로젝트의 목표입니다.
결론
국가별 누적 감염 비율을 비교할 수 있었고 우리나라의 경우, 2023년 2월 7일 기준 약 56% 가 되는 것을 확인했습니다. 2024년 5월 우리나라 전체 누적 감염비율이 100% 가 될 것으로 예측할 수 있었습니다.
전세계 인구 대비 누적 확진자 수 비율이 약 8% 정도밖에 되지 않는 것으로 보아, 국내의 누적 감염비율은 최상위권에 분포하는 것으로 확인할 수 있었습니다.
진행 과정
•
국가별 감염 비율과 감염 대비 사망 비율을 구했습니다
•
대륙별 집계 데이터(continent 값이 공백으로 처리) 는 제외했습니다
•
국가별 확진자 수가 가장 많이 나왔던 날의 확진 비율을 확인했습니다
•
covid_vaccine 테이블과 covid_deaths 테이블을 조인하여 백신 접종률을 확인했습니다
데이터 설명
CovidDeaths
CovidVaccinations
시각화 자료
한계점 및 아쉬운 점
한계점
주어진 국가별 데이터셋은 정확하다고 단정할 수 없습니다. 해당 데이터셋은 Johns Hopkins University에서 제공하는 자료에 근거하고 있고, 각국의 정부 국가기관 또는 자자체로부터 수집된 데이터이므로 국가별 상이한 의료시스템과 의료환경에 따라 신뢰도가 달라질 수 있습니다.
아쉬운 점
데이터셋 내에 인구통계학적 변수들도 있었지만(나이, 인구밀도, gdp, 흡연여부, 당뇨유무, 기대수명 등등) 추가적으로 활용하지 못했습니다. 이후, 해당 변수들을 활용하여 깊이 있는 시각화를 진행해볼 예정입니다.