데이터

[데이터분석]데이터 시각화와 의미

Mi-Flat 2023. 3. 30. 21:55
반응형

안녕하세요 미니멀 헬퍼입니다.

 

오늘은 데이터 분석 과정 중 데이터 시각화에 대해 알아보겠습니다.

 

데이터 시각화란 말 그대로 데이터를 시각적인 요소를 포함한 형태로 표현한다는 것입니다.

 

데이터를 시각화하는 이유는 무엇일까요?

 

시각화하였을 때 데이터에 숨겨진 의미를 찾을 수 있기 때문입니다.

 

단순히 나열되어 있는 테이블 형태의 데이터에서 특징을 파악하기란 쉽지 않습니다.

 

또한 눈으로 확인이 가능한 적은 수의 데이터의 경우 하나씩 비교해보며 유의미한 값을 도출할 수 있지만,

 

수만, 수십 만개의 데이터를 한 눈에 보기란 쉽지 않습니다.

 

그래서 데이터 분석 과정에서 시각화 도구는 적절히 사용되는 것이 매우 중요하며,

 

반드시 필요한 데이터 분석 과정이 되겠습니다. 

 

이번 시간에는 많은 양의 데이터를 다루는 대신, 

 

시각화를 통해 어떤 포인트를 파악하고 확인할 수 있는 지에 대해 알아보겠습니다.

 

데이터 시각화의 정의입니다. 시각적으로 표현하는 데이터 분석 결과값이 정의 그대로 표현되고 있습니다. 

시각화의 형태는 매우 다양하기 때문에 어떤 형태를 써야 한다기보다 데이터의 형태에 따라 선택적으로 바뀝니다.

 

말씀드린대로 데이터에 따라 보편적으로 사용하는 시각화의 형태 즉, 선, 원, 막대, 면적, 버블 등 데이터의 특성을 

 

잘 보여주는 형태를 찾아 적절히 표현해주는 것이 중요합니다. 그러나 데이터를 표현하는 시각화 방법이 

 

딱 정해져 있다고 보기에는 어렵습니다.

 

앞서 말씀드린 것처럼 시각화를 하는 이유는 데이터의 특성 즉, 경향성을 파악하는 것에 큰 도움이 됩니다.

 

그리고 시각화를 통한 경향성을 확인했을 때 많은 사람들이 경향성을 쉽게 찾아 분석의 요인으로 삼는 경우가 많지만,

 

경향성은 데이터가 내포하고 있는 가능성이므로, 경향성에 따라 섣부르게 일반화하는 오류를 범해서는 안됩니다.

 

경향성은 데이터의 특성을 보여주는 참고사항이라고 보시면 되겠습니다.

 

경향성이란 어느 한 방향으로 기울어져 있는, 어떤 방향으로 갈 것이다라는 예측 가능성을 판단하기 위한 정보라고 볼 수 있습니다.

 

이렇게 되었으니까, 다음에는 이렇게 되겠지라는 예측이므로 데이터의 양과 질에 따라 일정 부분 오차가 존재합니다.

 

오늘 간단히 소개드릴 데이터 수집 및 시각화 사이트는

 

'데이터랩'으로 네이버 사이트에서 운영하는 데이터 저장소입니다. 네이버 사용은 많은 국민이 하고 있기에

 

어렵지 않게 접근할 수 있는 부분입니다.

 

데이터랩 > 검색어 트랜드로 이동합니다. 말 그대로 검색어의 트랜드를 검색 횟수 및 날짜에 따라 파악할 수 있는 것입니다.

 

원하는 주제의 데이터를 찾기 위해 주제어를 입력하고 세부 검색어까지 입력합니다.

 

아래의 기간, 범위 등까지 입력한 다음 네이버 검색 데이터 조회를 하면 원하는 키워드별 네이버 데이터랩 데이터 기반의

 

결과값을 시각화 형태로 볼 수 있습니다.

 

지난 1년 사이에 치킨이라는 키워드를 검색한 데이터 결과입니다. 만약에 이 데이터를 엑셀파일이나 워드 형태로 받았다면, 한 눈에 가장 많은 검색량을 찾거나 월별 추이 등에 대해 파악하기 쉽지 않았을 것입니다.

 

위 결과처럼 치킨이라는 키워드는 수많은 사람이 검색하는 키워드이지만, 유난히 11월 24일 경에 다른 날짜와는 비교도 안되게 많은 검색량을 보인 날이 있습니다.

 

이렇게 연속적인 형태의 그래프가 아닌 특정 시점에 특성을 나타내는 부분을 사건이라고 표현하기도 합니다.

 

그렇다면 그 날짜에 이런 특성을 보일만한 신뢰성 있는 사건이 무엇이 있는지 알아볼 필요가 있습니다.

 

아마 예측했을 수도 있듯이, 치킨이라는 키워드로 검색하는 날은 우리나라 축구경기가 있던 날이었습니다. 

 

이렇게 시각화 자료를 통해 데이터의 경향성을 파악하고 경향성에 따른 데이터의 특성에 맞는 근거를 찾는다면,

 

데이터가 내포하고 있는 의미를 통찰력 있게 발견할 수 있을 것입니다. 

 

오늘은 데이터 시각화의 도구에 대한 설명을 하기 보다는 데이터 분석 과정 중 데이터 시각화의 개념 및

 

목적에 대해 간단한 사례를 통해 설명을 드렸습니다.

 

아무리 정교하고 적절한 시각화 도구를 사용하더라도 데이터가 가지고 있는 특성을

 

올바르게 파악하지 못한다면 안하느니 못한 데이터 분석 과정이 될 것입니다.

 

감사합니다.

 

반응형

'데이터' 카테고리의 다른 글

[데이터 시각화]네이버 '데이터랩'  (0) 2023.04.13
[인공지능 인식]How nomal am i?  (2) 2023.03.20
데이터 분석 기획에 대한 이해  (0) 2021.03.27
빅데이터의 이해  (0) 2021.03.07
데이터 베이스에 대한 이해  (0) 2021.02.28