cs

계속 정리하면서 틀을 잡아가야겠다. 

공부를 이렇게 하는게 난 집중이 잘 되는데, 이게 괜찮은건지.. 원작자에게 연락해봐야하나..? 


테이블 데이터

데이터 분석에서 가장 대표적으로 사용 되는 객체는 테이블 데이터. 

일반적인 행, 피처(변수)를 나타내는 이차원 행렬의 테이블.

 

  • Data Frame: 통계와 머신러닝 모델에서 가장 기본이 되는 테이블 형태의 데이터 구조
  • Feature: 일반적으로 테이블의 각 열이 하나의 피처를 의미 (변수)
  • Outcome: 데이터 분석/과학에서의 대부분의 목표는 결과를 예측하는데 있음. -> 결과를 예측하기 위해 Feature을 사용
  • Record: 일반적으로 테이블의 각 행은 하나의 레코드. (관측값)

 

용어 차이

Statistician Data Scientists
예측 변수 (Predictor Variable)
for Response/Dependent Variable
피처 (Feature) for Target

 

 

*꼭 테이블 형식이 아닌 다른 형태의 데이터 구조도 있음 

ex: 지도나 위치분석에 사용되는 데이터의 경우, 공간좌표가 중심이 되고 측정 기준값에 중점을 둔다

 

+ Recent posts