다음이 설명하는 알고리즘은 무엇인가? - 코호넨 맵이라고도 불리며, 인공신경망을 기반 차원축소와 군집화를 동시에 수행할 수 있는 알고리즘이다. 다차원 데이터를 축소해 저차원의 지도를 생성하고 이를 통해 데이터를 가시화하는 데 유용하다. 또한 입력공간의 속성을 보존한다는 특징이 있어 실제 유사한 데이터는 2차원 격자에서도 가깝게 표현된다.
정답 : SOM
더보기다음이 설명하는 군집분석의 종류는 무엇인가? 모형 기반의 군집 방법으로 관측된 데이터들은 여러 개의 확률분포(흔히 정규분포)로부터 추출되었다는 가정하에 같은 확률 분포에서 추출된 데이터들끼리 군집화하는 분석 기법이다. 확률분포의 모수(평균, 분산)와 그 확률분포가 전체 데이터에서 차지하는 비중(가중치)을 찾는 것이 ( )의 핵심이다. 이때 모수와 가중치를 추정하는 방법으로는 EM(기댓값 최대화) 알고리즘을 사용한다.
정답 : 혼합 분포 군집
더보기밀도 기반 군집분석의 한 방법으로 개체 간의 거리에 기반을 둔 다른 군집 방법 알고리즘과 다르게 개체들이 밀접한 정도에 기초해 군집을 형성하는 알고리즘은 무엇인가?
정답 : DBSCAN
더보기군집의 수(k개)를 사전에 정한 뒤 집단 내 동질성과 집단 간 이질성이 모두 높게 전체 데이터를 k개의 군집으로 분할하는 군집 분석 알고리즘은 무엇인가?
정답 : k-means 군집
더보기개별 관측치 간의 거리를 계산해서 가장 가까운 관측치부터 결합해나가면서 트리 구조를 형성하고, 이를 통해 군집화를 수행하는 군집분석을 무엇이라 하는가?
정답 : 계층적 군집분석
더보기이것은 군집분석의 거리 측도 중에서 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로 두 점 사이의 가장 짧은 거리를 계산한다. 이것은 통계적 개념이 포함되지 않은 수학적 거리로 변수들의 산포 정도를 감안하지 않는다. 이것은 어떤 거리 측도인가?
정답 : 유클리디안 거리
더보기이것은 분류 분석 모형의 평가를 쉽게 비교할 수 있도록 시각화한 그래프다. x축은 FPR(1 - 특이도) 값을, y축은 TPR(민감도) 값을 갖는 그래프로, 이진 분류(0 또는 1) 모형의 성능을 평가하기 위해 사용된다. 이 그래프는 무엇인가?
정답 : ROC 커브
더보기이것은 분류와 회귀분석에 사용되는 지도학습 알고리즘으로, 주어진 데이터를 학습해 새로운 데이터가 어떤 범주에 속할지 결정하는 비확률적 이진 선형모델을 만든다. 그래서 분류 분석, 머신러닝에 활용이 많이 되는 지도학습 알고리즘이기도 하다. 이 알고리즘은 무엇인가?
정답 : 서포트벡터머신
더보기사전확률과 우도확률을 통해 사후확률을 추정하는 정리로 데이터를 통해 확률을 추정할 때 현재 관측된 데이터의 빈도만으로 분석하는 것이 아니라 분석자의 사전지식(이미 알려진 사실 혹은 분석자의 주관)까지 포함해 분석하는 확률 이론을 무엇이라 하는가?
정답 : 베이즈 이론
더보기