문제 사전


1356번 문제

3과목 | 3과목 | 서브노트

다음이 설명하는 알고리즘은 무엇인가? - 코호넨 맵이라고도 불리며, 인공신경망을 기반 차원축소와 군집화를 동시에 수행할 수 있는 알고리즘이다. 다차원 데이터를 축소해 저차원의 지도를 생성하고 이를 통해 데이터를 가시화하는 데 유용하다. 또한 입력공간의 속성을 보존한다는 특징이 있어 실제 유사한 데이터는 2차원 격자에서도 가깝게 표현된다.

정답 : SOM

더보기

1355번 문제

3과목 | 3과목 | 서브노트

다음이 설명하는 군집분석의 종류는 무엇인가? 모형 기반의 군집 방법으로 관측된 데이터들은 여러 개의 확률분포(흔히 정규분포)로부터 추출되었다는 가정하에 같은 확률 분포에서 추출된 데이터들끼리 군집화하는 분석 기법이다. 확률분포의 모수(평균, 분산)와 그 확률분포가 전체 데이터에서 차지하는 비중(가중치)을 찾는 것이 ( )의 핵심이다. 이때 모수와 가중치를 추정하는 방법으로는 EM(기댓값 최대화) 알고리즘을 사용한다.

정답 : 혼합 분포 군집

더보기

1354번 문제

3과목 | 3과목 | 서브노트

밀도 기반 군집분석의 한 방법으로 개체 간의 거리에 기반을 둔 다른 군집 방법 알고리즘과 다르게 개체들이 밀접한 정도에 기초해 군집을 형성하는 알고리즘은 무엇인가?

정답 : DBSCAN

더보기

1353번 문제

3과목 | 3과목 | 서브노트

군집의 수(k개)를 사전에 정한 뒤 집단 내 동질성과 집단 간 이질성이 모두 높게 전체 데이터를 k개의 군집으로 분할하는 군집 분석 알고리즘은 무엇인가?

정답 : k-means 군집

더보기

1352번 문제

3과목 | 3과목 | 서브노트

개별 관측치 간의 거리를 계산해서 가장 가까운 관측치부터 결합해나가면서 트리 구조를 형성하고, 이를 통해 군집화를 수행하는 군집분석을 무엇이라 하는가?

정답 : 계층적 군집분석

더보기

1351번 문제

3과목 | 3과목 | 서브노트

이것은 군집분석의 거리 측도 중에서 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로 두 점 사이의 가장 짧은 거리를 계산한다. 이것은 통계적 개념이 포함되지 않은 수학적 거리로 변수들의 산포 정도를 감안하지 않는다. 이것은 어떤 거리 측도인가?

정답 : 유클리디안 거리

더보기

1350번 문제

3과목 | 3과목 | 서브노트

이것은 분류 분석 모형의 평가를 쉽게 비교할 수 있도록 시각화한 그래프다. x축은 FPR(1 - 특이도) 값을, y축은 TPR(민감도) 값을 갖는 그래프로, 이진 분류(0 또는 1) 모형의 성능을 평가하기 위해 사용된다. 이 그래프는 무엇인가?

정답 : ROC 커브

더보기

1349번 문제

3과목 | 3과목 | 서브노트

이것은 분류와 회귀분석에 사용되는 지도학습 알고리즘으로, 주어진 데이터를 학습해 새로운 데이터가 어떤 범주에 속할지 결정하는 비확률적 이진 선형모델을 만든다. 그래서 분류 분석, 머신러닝에 활용이 많이 되는 지도학습 알고리즘이기도 하다. 이 알고리즘은 무엇인가?

정답 : 서포트벡터머신

더보기

1348번 문제

3과목 | 3과목 | 서브노트

사전확률과 우도확률을 통해 사후확률을 추정하는 정리로 데이터를 통해 확률을 추정할 때 현재 관측된 데이터의 빈도만으로 분석하는 것이 아니라 분석자의 사전지식(이미 알려진 사실 혹은 분석자의 주관)까지 포함해 분석하는 확률 이론을 무엇이라 하는가?

정답 : 베이즈 이론

더보기

1347번 문제

3과목 | 3과목 | 서브노트

표에서 재현율(Recall)을 구하는 방법은?

정답 : 1행 1열 / 1행 합계

더보기