전체 데이터를 무작위로 중복되지 않는 k개의 데이터셋으로 나눈 후 k-1개의 데이터를 훈련용 데이터로 사용해 학습하고 나머지 1개의 데이터셋을 검증 데이터로 사용하는 데이터 분할 방식을 무엇이라 하는가?
정답 : k-Fold 교차검증
더보기비지도학습 중 하나로 여러 이질적인 데이터들 사이의 유사성을 측정하여 유사성이 높은 객체끼리 하나의 그룹으로 묶기 위한 분석 방법은 무엇인가?
정답 : 군집분석
더보기시계열은 추세요인, 계절요인, 순환요인, 불규칙요인 등으로 구성되며 이들 요인이 서로 복잡하게 혼합되어 하나의 시계열 데이터를 구성한다. 이때 분석 목적에 따라 특정요인만을 분리해 분석하거나 제거하는 작업을 하게 되는데, 이러한 방법을 무엇이라 하는가?
정답 : 분해 시계열
더보기최근 자료가 과거 자료보다 예측에 효과적이라는 가정하에 최근 데이터 일수록 큰 가중치를 부여하고, 오래된 데이터일수록 작은 비중을 부여하는 방식을 사용해 평균을 계산하는 시계열 분석 기법은 무엇인가?
정답 : 지수평활법
더보기다음이 설명하는 것이 무엇인지 쓰시오 - 두 개의 확률 변수의 선형관계를 나타낸다. 하나의 확률 변수의 증감에 따른 다른 확률 변수의 증감의 경향에 대한 측도다. 분산이라는 개념을 확장하여 두 개의 확률 변수의 흩어진 정도를 표현한 것이다. 대부분의 시계열 자료들은 자기상관성을 가지기 때문에 ( ) 은 0이 아니다.
정답 : 공분산
더보기여러 개의 변수 중 서로 상관성이 높은 변수들의 선형결합으로 새로운 변수(주성분)를 만들어 기존 변수를 요약 및 축소하는 분석 방법은 무엇인가?
정답 : 주성분 분석
더보기다음의 설명은 어떤 분석 방법을 의미하는가? - 다변량 데이터에 내재된 특성 및 구조를 통해 개체 간의 유사성/비유사성을 측정하고, 이를 원래의 차원보다 낮은 차원의 공간에 점으로 표현하는 분석 방법이다. 2차원 혹은 3차원 공간상에 표현된 점들은 유사한 개체들은 가깝게, 아닌 개체들은 멀게 표현되며, 이를 통해 개체 간의 관계를 직관적으로 이해할 수 있고 고차원 데이터의 차원을 축소하는 데 사용할 수 있다.
정답 : 다차원 척도법
더보기회귀분석에 있어 자기상관성이 존재하는지 검정하는 방법은 무엇인가? (오차항이 독립성을 만족하는지=오차항이 서로 연관성이 없는지)
정답 : 더빈 왓슨 검정
더보기다음이 설명하는 시계열 데이터의 특성은 무엇인가? - 시계열 데이터들은 연속적인 일련의 관측치들이 서로 상관되어 있다. 즉, 하나의 잔차항의 크기가 이웃하는 다른 잔차항의 크기와 서로 일정한 관련이 있다.
정답 : 자기상관성
더보기