문제 사전


1346번 문제

3과목 | 3과목 | 서브노트

표에서 정밀도(Precision)을 구하는 방법은?

정답 : 1행 1열 / 1열 합계

더보기

1345번 문제

3과목 | 3과목 | 서브노트

다음이 설명하는 알고리즘은 무엇인가? - 정답 라벨이 있는 데이터들 속에서 정답 라벨이 없는 데이터들을 어떻게 분류할 것인지에 대한 해결방법으로 사용된다. 간단히 말해서, 정답 라벨이 없는 자신의 데이터를 분류하기 위해 정답 라벨이 있는 주변의 데이터들을 분석해서 가장 가까이에 있는 데이터의 라벨을 확인하는 것이다.

정답 : k-NN

더보기

1344번 문제

3과목 | 3과목 | 서브노트

인공신경망을 학습시키기 위해 사용하는 일반적인 알고리즘으로, 인공신경망을 학습시킨다는 것은 출력값과 실제값의 오차가 최소가 되는 가중치와 편향을 찾는 것을 의미한다. 이 알고리즘은 무엇인가?

정답 : 역전파 알고리즘

더보기

1343번 문제

3과목 | 3과목 | 서브노트

다음의 빈칸에 알맞은 말을 쓰시오. - 인공신경망은 ( A ), ( B ), ( C )의 세 가지 층으로 구성된다. 모든 층은 노드로 구성돼 있으며, 각 층은 가중치를 포함한 망으로 연결돼 있다. ( A )은 시스템 외부로부터 예측을 위한 데이터를 입력받아 시스템으로 전송하는 역할을 한다. n개의 독립변수로 종속변수를 예측하고자 한다면 ( A )은 n개의 노드를 가지게 된다. - ( A )의 노드에서는 어떠한 연산도 발생하지 않는다. ( B )은 일종의 블랙박스로 신경망 외부에서는 ( B )의 노드에 직접 접근할 수 없다. ( B )은 ( A )으로부터 값을 전달받아 가중합과 편향을 계산한 후 활성함수에 적용하여 결과를 산출하고 이를 ( C ) 으로 전송한다. - ( C )은 학습된 데이터가 포함된 층으로 활성함수의 결과를 담고 있는 노드로 구성된다. 출력층의 노드 수는 출력 범주의 수로 결정된다. 분류 문제일 경우 ( C )의 노드는 각 라벨의 확률을 포함한다.

정답 : (A) 입력층, (B) 은닉층, (C) 출력층

더보기

1342번 문제

3과목 | 3과목 | 서브노트

이것은 앙상블분석의 방법 중 하나로, 큰 분산을 갖고 있다는 의사결정의 단점을 보완하여 분산을 감소시키고 모든 분류기들이 높은 비상관성을 갖기 때문에 일반화의 성능을 향상시킬 수 있다. 또한 의사결정나무의 특징을 물려받아 이상값에 민감하지 않다는 장점이 있다. 이것은 무엇인가?

정답 : 랜덤 포레스트

더보기

1341번 문제

3과목 | 3과목 | 서브노트

이것은 앙상블분석의 방법 중 하나로, 이전 모델을 구축한 뒤 다음 모델을 구축할 때 이전 분류기에 의해 잘못 분류된 데이터에 더 큰 가중치를 주어 붓스트랩을 구성한다. 따라서 약한 모델들을 결합하여 나감으로써 점차적으로 강한 분류기를 만들어 나가는 과정이다. 이것은 무엇인가?

정답 : 부스팅

더보기

1340번 문제

3과목 | 3과목 | 서브노트

( ) 분석은 모형의 예측력을 높이고자 여러 번의 데이터 분할을 통하여 구축된 다수의 모형을 결합하여 새로운 모형을 만드는 방법이다. ( ) 분석의 대표적인 방법으로 배깅(bagging), 부스팅(boosting), 랜덤 포레스트(random forest)가 있다.

정답 : 앙상블

더보기

1339번 문제

3과목 | 3과목 | 서브노트

( ) 는(은) 이산형 변수의 이진 분할을 위한 CART 알고리즘에서 사용되는 불순도 측도로 통계적 분산 정도를 정량화해서 표현한 값이다. ( ) (을)를 가장 감소시키는 변수를 활용하여 최적분리를 수행, 자식마디를 형성한다.

정답 : 지니지수

더보기

1338번 문제

3과목 | 3과목 | 서브노트

의사결정나무는 종속변수가 연속형인 회귀트리와 종속변수가 범주형인 ( ) 트리로 구분된다.

정답 : 분류

더보기

1337번 문제

3과목 | 3과목 | 서브노트

재표본추출(resampling) 방법의 일종으로 중복추출을 허용하는 데이터 분할 방식을 무엇이라 하는가?

정답 : 붓스트랩

더보기