안녕하세요 오늘은 머신러닝 주요 모델 중 데이터양과 품질, 표준화, 문제 유형에 대해 알아보겠습니다. 머신러닝은 데이터를 기반으로 작업을 하기 때문에 앞서 살펴본 데이터형이나 데이터양, 품질, 데이터 표준화, 그리고 문제의 유형 등 데이터를 어떻게 받아들이고 출력값을 어떻게 계산하여 내보낼 것인가가 매우 중요합니다. 먼저 데이터양에 대해 알아보면, 데이터의 양이 많으면 머신러닝을 활용하기 좋습니다. 그러나 무작정 데이터의 양이 많기 보다는 특정 항목에 대한 데이터가 충분해야 합니다. 이미지 태깅이나 문법 파싱처럼 사람이 입력값을 일일이 입력하는 경우 데이터의 레이블을 얻기 어려운경우가 발생합니다. 이런 경우 '액티브 러닝 기법'을 활용하는데, 학습이 잘되지 않은 부분을 머신러닝 시스템이 사람에게 질문하는..