머신러닝

[머신러닝 입문]머신러닝의 관점과 기법

Mi-Flat 2020. 3. 24. 15:53
반응형

안녕하세요

 

오늘은 머신러닝의 중요 관점과 여러가지 기법에 대해 알아보겠습니다.

먼저 머신러닝의 중요 관점이라는 것은 머신러닝 기법을 활용해서 얻고자하는 목표나 과정에 따라 달라지게 됩니다.

관점을 나누는 기준은 여러가지 논의가 있지만, 검색을 해도 많은 내용이 나오지 않습니다.

그 중 한 가지인 제이슨 아이스너의 관점을 살펴보도록 하겠습니다.

 

첫 번째 관점은 '통찰력' 입니다. 머신러닝 기법을 활용하였을 때 통찰력이 있는 모델을 완성한다고 생각하였습니다.

즉 여러 데이터에 대한 분석을 통해 통찰력을 보여줄 수 있는 좋은 모델을 형성하는 것이 중요하다라고 생각한 것입니다. 대표적인 기법으로 '베이지언' 기법이 있습니다.

 

두 번째 관점은 '이론적 엄정성' 입니다. 기법을 분석하기 용이한지를 중심에 두고 머신러닝 기법을 활용하는 것입니다. 즉 수학적, 통계적 계산 과정이 명확한지 증명이 가능한가를 우선으로 생각한 것입니다. 대표적인 기법으로 스펙트럴 러닝, 서포트 벡터 머신(SVM), 볼록 최적화가 있습니다. 이론적으로 확실하게 증명되어야 하는 응용 분야에 사용되고 있습니다. 

 

세 번째 관점은 '데이터 적합성' 입니다. 데이터 기반으로 분석한 모델이 데이터 성격을 온전히 담고 있는지를 중심으로 생각하는 관점입니다. 데이터는 각각 성격이 다릅니다. 데이터의 성격에 맞게 적절한 모델을 활용한 머신러닝 기법인지를 중요시하는 관점입니다. 대표적으로 딥러닝과 랜덤 포레스트가 있습니다. 많은 양의 데이터를 기반으로 데이터 중심의 머신러닝 활용 방법입니다.

 

대표로 제이슨 아이스너의 관점을 살펴보았습니다. 어느 한 관점으로만 진행되는 머신러닝은 없고, 적절하게 모두 고려하여 활용해야 합니다. 이러한 관점을 염두하고 머신러닝 기법을 활용한다면 데이터 자체에 기반을 둘지, 데이터 분석을 통한 패턴에 기반을 둘지, 확실한 수학적 증명 결과에 기반을 둘지 목적을 명확히 할 수 있을 것입니다.

 

다음으로 머신러닝의 기법에 대해 알아보겠습니다.

머신러닝의 기법은 목표에 따라 크게 지도학습, 비지도학습, 강화학습으로 나눌 수 있습니다. 그리고 기법의 형태에 따라 딥러닝, 통계로 분류할 수 있습니다.

 

'지도학습' 은 입력에 대한 출력값(lable)을 기계에 지속적으로 학습시켜 대상에 대한 구분을 할 수 있도록 하는 학습 기법입니다. 사과 사진을 보여준 뒤 사과라는 정답을 출력하도록 학습시킨 뒤 사과 사진을 보여주면 사과라고 대답하는 형태입니다. 

그 중 '회귀 기법'은 숫자값을 예측하는데, 그래프의 연속성을 표현하는 것처럼 연속되는 값의 추이에 따라 결과값을 예측하는 방법입니다.

'분류 기법'는 특정 데이터가 어느 카테고리에 해당되는지 나누는 기법을 말합니다. 정해진 카테고리 내 정해진 데이터를 나누어 배치한다고 보면 됩니다.

'랭킹'은 데이터의 순위를 예측하는 것으로 데이터 기반 개별 데이터 예측이 아닌 데이터의 각 순위를 예측하는 기법입니다.

'추천'은 특정 데이터에 대한 출력값이 아닌 여러 데이터 특징을 종합하여 도출된 결과값을 출력합니다.

'군집화'는 클러스터링(Clustering)으로 비슷한 데이터들끼리 묶어 출력하는 기법입니다. 그러나 묶은 데이터가 어떤 값인지는 알려주지 않습니다. 사용자의 판단으로 구분해야 합니다. 즉 특징(Feature)를 종합하여 데이터를 구분합니다.

'토픽 모델링'은 텍스트 데이터 중심으로 구분하는데 일반적으로 관련 정도를 확률로 표현합니다.

'밀도 추정'은 데이터로부터 데이터가 가질 수 있는 값의 분포를 표현하는 것입니다. 대표적으로 '커널 밀도 추정'과 '가우스 혼합 모델'이 있습니다.

'차원 축소'는 고차원의 데이터를 분석하기에 매우 많은 용량을 차지하기 때문에 가장 중요한 특징을 분석하여 차원을 낮추어 분석하는 기법입니다. 대표적으로 주성분 분석(PCA) 및 특잇값 분해가 있습니다.

 

이렇게 머신러닝의 여러가지 기법에 대해 알아보았습니다. 각각의 기법의 응용이나 활용 사례 등은 다음에 조금 더 자세하게 설명드리도록 하겠습니다. 지금은 전체적인 구조와 개념 이해에 중점 두고 진행하도록 하겠습니다.

 

다음에는 머신러닝의 주요 개념인 모델, 손실함수, 최적화, 모델 평가에 대해 알아보도록 하겠습니다.

 

감사합니다. 

반응형