내 퀴즈
오답노트
캘린더
탐색
로그인
회원가입
QUIZ · 문제 풀이
빅데이터 분석기사 필기 : 빅데이터 탐색 (2과목) 문제은행
자격증
·
총 10문제
·
낱말카드
💡 위퀴즈는 객관식·주관식·낱말카드 모드를 지원해요
📝
한번에 풀기
1 / 10문제
0:00
Q1.
'감성 분석(Sentiment Analysis)'에 대한 설명으로 가장 옳은 것은?
1
텍스트에서 긍정·부정·중립 등 감성 극성을 자동으로 분류하는 자연어 처리 기법이다.
2
텍스트 내 개인·장소·기관 등 고유명사를 인식하고 분류하는 기법이다.
3
문서 집합에서 잠재 주제를 확률적으로 추출하는 기법이다.
4
두 텍스트 간의 의미적 유사도를 코사인 거리로 계산하는 기법이다.
정답 처리
(₩)
복습 큐
💡 해설
감성 분석은 SNS·리뷰·뉴스 등의 텍스트에서 감정 방향을 탐지해 소비자 반응·브랜드 평판 분석에 활용된다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q2.
다음 상황에서 가장 적절한 개념은?
거래 금액 데이터에서 상위 5% 극단값을 박스플롯 기준으로 탐지했다.
1
IQR 기반 이상값 탐지
2
z-점수 이상값 탐지
3
Isolation Forest
4
DBSCAN
정답 처리
(₩)
복습 큐
💡 해설
박스플롯은 IQR 기반으로 경계를 시각화하며 이를 통해 이상값 탐지를 수행하는 방법이다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q3.
'스피어만 순위 상관계수'에 대한 설명으로 가장 옳은 것은?
1
두 변수의 값 대신 순위(rank)를 이용해 단조 관계를 측정하는 비모수 상관계수로, 이상값에 강건하다.
2
두 연속형 변수의 선형 관계를 정규분포 가정 하에 측정하는 모수 상관계수다.
3
범주형 변수 간 독립성을 검정하는 비모수 통계량이다.
4
두 변수의 공분산을 각 표준편차의 곱으로 나눈 정규화된 통계량이다.
정답 처리
(₩)
복습 큐
💡 해설
스피어만 상관계수는 정규분포 가정이 불필요하며 순서형 변수나 이상값이 있는 데이터에 적합하다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q4.
다음 상황에서 가장 적절한 개념은?
거래금액 상위 1%와 하위 1%를 삭제하지 않고 해당 경계값으로 교체해 분석에 활용한다.
1
윈저라이징
2
트리밍
3
정규화
4
로그 변환
정답 처리
(₩)
복습 큐
💡 해설
이상값을 백분위 경계값으로 대체(클리핑)해 표본 크기를 유지하는 방법이 윈저라이징이다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q5.
다음 상황에서 가장 적절한 개념은?
마트 구매 데이터에서 '라면과 함께 계란을 같이 구매하는 패턴'을 지지도·신뢰도로 정량화한다.
1
연관 규칙 분석
2
군집 분석
3
로지스틱 회귀
4
요인 분석
정답 처리
(₩)
복습 큐
💡 해설
트랜잭션 내 항목 간 동시 발생 패턴을 지지도·신뢰도·향상도로 탐색하는 연관 규칙 분석의 전형적 사례다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q6.
'보간법(Interpolation)'에 대한 설명으로 가장 옳은 것은?
1
시계열이나 정렬된 데이터에서 인접 관측값을 이용해 결측 지점의 값을 추정하는 방법으로, 선형·다항식·스플라인 보간이 있다.
2
결측값이 있는 레코드를 모두 제거하는 방법이다.
3
결측값을 해당 변수의 최빈값으로 채우는 방법이다.
4
여러 대체 데이터셋을 생성해 불확실성을 반영하는 방법이다.
정답 처리
(₩)
복습 큐
💡 해설
보간법은 시계열 데이터에서 센서 단절로 생긴 결측값을 연속성을 유지하며 채울 때 적합하다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q7.
'모수(Parameter)와 통계량(Statistic)의 차이'로 가장 옳은 것은?
1
모수는 모집단의 특성을 나타내는 고정된 값이고, 통계량은 표본에서 계산한 추정값으로 표본마다 다르다.
2
모수는 표본에서 계산한 추정값이고, 통계량은 모집단 전체를 이용한 고정값이다.
3
모수는 연속형 변수에만 적용되고, 통계량은 범주형 변수에 적용된다.
4
모수는 비모수 검정에서 사용되고, 통계량은 모수 검정에서 사용된다.
정답 처리
(₩)
복습 큐
💡 해설
모평균 μ는 모수, 표본평균 x̄는 통계량이다. 통계량은 표본마다 달라지는 확률변수이며 모수를 추정하는 데 사용된다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q8.
'산점도 행렬(Pair Plot)'에 대한 설명으로 가장 옳은 것은?
1
여러 변수의 모든 쌍에 대해 산점도를 한 화면에 행렬 형태로 배치해 변수 간 관계를 동시에 탐색하는 시각화 기법이다.
2
단일 변수의 분포를 여러 집단 별로 나란히 비교하는 시각화 기법이다.
3
시계열 데이터의 추세·계절·잔차를 분해해 보여주는 시각화 기법이다.
4
대용량 데이터를 샘플링 후 지도 위에 밀도로 표현하는 기법이다.
정답 처리
(₩)
복습 큐
💡 해설
산점도 행렬(seaborn의 pairplot 등)은 변수 간 선형·비선형 관계와 분포를 한눈에 파악하는 다변량 EDA 도구다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q9.
다음 상황에서 가장 적절한 개념은?
회귀 분석 시 독립변수 A와 B의 상관계수가 0.97로 VIF 값이 20 이상 나타난다.
1
다중공선성
2
이분산성
3
자기상관
4
과적합
정답 처리
(₩)
복습 큐
💡 해설
독립변수 간 높은 상관과 VIF 과다는 다중공선성을 가리킨다. 변수 제거·PCA·릿지 회귀 등으로 처리한다.
🤔
정답 확인
(Enter)
다음 문제
→
(Tab)
Q10.
'텍스트 데이터 탐색'에 대한 설명으로 가장 옳은 것은?
1
단어 빈도·TF-IDF·워드 클라우드 등으로 텍스트 내 주요 키워드와 어휘 분포를 파악하는 비정형 데이터 탐색 과정이다.
2
이미지 픽셀값의 히스토그램으로 밝기 분포를 분석하는 탐색 과정이다.
3
시계열 텍스트 로그에서 자기상관으로 반복 패턴을 찾는 탐색 과정이다.
4
범주형 텍스트 변수를 원핫 인코딩해 모델 입력으로 변환하는 과정이다.
정답 처리
(₩)
복습 큐
💡 해설
텍스트 탐색은 어휘 빈도·문서 길이 분포·불용어 비율 등을 확인해 전처리 방향과 피처 엔지니어링 전략을 수립한다.
🤔
정답 확인
(Enter)
채점 및 종료
🏁
(Tab)
홈
탐색
공부하기
내 퀴즈
로그인
전체 메뉴
✕
학습
홈
탐색
캘린더
공식자료
회원가입
로그인
위퀴즈를 앱으로 설치하여 더 빠르고 편리하게 이용해보세요!
닫기
설치하기
×
위퀴즈를 앱처럼 사용하기
Safari에서 아래 3단계만 따라하시면 끝!
① 공유 버튼 누르기
화면 하단 가운데의
공유
버튼(↑)을 눌러주세요.
② "홈 화면에 추가" 선택
메뉴를 아래로 스크롤해서
홈 화면에 추가
를 눌러주세요.
③ 추가 누르기
우측 상단
추가
를 누르면 홈 화면에 위퀴즈 아이콘이 생깁니다.
확인했어요