계속 정리하면서 틀을 잡아가야겠다.
공부를 이렇게 하는게 난 집중이 잘 되는데, 이게 괜찮은건지.. 원작자에게 연락해봐야하나..?
테이블 데이터
데이터 분석에서 가장 대표적으로 사용 되는 객체는 테이블 데이터.
일반적인 행, 피처(변수)를 나타내는 이차원 행렬의 테이블.
- Data Frame: 통계와 머신러닝 모델에서 가장 기본이 되는 테이블 형태의 데이터 구조
- Feature: 일반적으로 테이블의 각 열이 하나의 피처를 의미 (변수)
- Outcome: 데이터 분석/과학에서의 대부분의 목표는 결과를 예측하는데 있음. -> 결과를 예측하기 위해 Feature을 사용
- Record: 일반적으로 테이블의 각 행은 하나의 레코드. (관측값)
용어 차이
Statistician | Data Scientists |
예측 변수 (Predictor Variable) for Response/Dependent Variable |
피처 (Feature) for Target |
*꼭 테이블 형식이 아닌 다른 형태의 데이터 구조도 있음
ex: 지도나 위치분석에 사용되는 데이터의 경우, 공간좌표가 중심이 되고 측정 기준값에 중점을 둔다
'Machine Learning > Practical Statistics' 카테고리의 다른 글
[Practical Statistics] 이진 데이터와 범주 데이터 탐색 (0) | 2022.03.12 |
---|---|
[Practical Statistics] 데이터 분포 탐색하기 (0) | 2022.03.04 |
[Practical Statistics] 변이 추정 (0) | 2022.03.03 |
[Practical Statistics] 위치 추정 (0) | 2022.03.01 |
[Practical Statistics] 탐색적 데이터 분석 (EDA) (0) | 2022.02.25 |