[기초통계] 회귀분석(Regression Analysis) 회귀분석이란? : 연속형 변수들에 대해 두 변수 간의 관계를 수식으로 나타내는 분석 방법 쉽게 말해서 x라는 독립변수와 y라는 종속변수가 존재할 때 이 두 변수 간의 관계를 y=ax+b와 같은 형태의 수식으로 나타낼 수 있는 방법입니다. 이 데이터 간의 관계를 가장 적합한 하나의 직선으로 표현하는 방법이 회귀분석이며, 이를 위해 직선과 개별 값들 간의 오차를 최소화하는 직선을 찾는 것을 목표로 합니다. 종속변수가 1개, 독립변수가 2개 이상이면 다중 회귀분석이라고 하고, 종속변수와 독립변수 간의 관계가 log나 거듭제곱과 같은 비선형 관계일 경우에는 비선형 회귀분석이라고 합니다. 단순 선형 회귀분석 단순 선형 회귀분석은 종속변수(y)와 독립변수(x)가 각각 하나씩 존재하며 서로 션형적인 관계를 가질 때 .. 2023. 10. 11. [기초통계] 상관분석(Correlation Analysis) 상관분석이란? : 연속형 변수들 간에 어떤 선형적인 또는 비선형적인 관계를 갖고 있는지 분석하는 방법 상관분석은 두 변수 간의 관계를 상관계수(Correlation Coefficient)로 나타냅니다. 상관계수는 -1과 1 사이의 값을 갖으며, 음의 부호일 경우에는 반비례 관계인 음의 상관관계를 나타내고, 양의 부호일 때는 비례 관계인 양의 상관관계를 나타냅니다. 상관계수의 경우 두 변수 간에 연관된 정도만을 나타낼 뿐, 인과관계를 설명하는 것은 아닙니다. Kaggle의 Salary_data를 토대로 나이, 경력, 그리고 급여의 상관관계에 대해 간단하게 분석해보고자 합니다. Salary_Data Salary Data based on Experience,Age,Gender,Job Title and Educ.. 2023. 10. 11. 이전 1 다음