파이썬 선형회귀 예제

선형 회귀를 구현할 때 5가지 기본 단계가 있습니다. SLR 모델에서는 데이터(기울기 및 Y-절편이 데이터에서 파생되는) 데이터를 기반으로 모델을 작성합니다. 또한 X와 Y 간의 관계가 정확히 선형일 필요는 없습니다. SLR 모델에는 데이터의 오류(잔차라고도 함)도 포함됩니다. 나는 지금 너무 많이 가지 않을 것 이다, 어쩌면 나중에 게시물에, 하지만 잔차는 기본적으로 Y의 실제 값과 Y의 예측/추정된 값 사이의 차이. 선형 회귀에서는 연속 변수를 예측하려고 합니다. 회귀 모델에서는 “최적 맞춤 선”을 찾아 이러한 오류를 최소화하려고 합니다. 빨간색 선에서 검은 색 선의 길이 (또는 더 정확하게는 파란색 점의 거리)를 가능한 0에 가깝게 최소화하려고합니다. 평균 제곱 오차(MSE) 또는 “잔류 제곱 합계”라고도 하는 오류(SSE)의 합을 최소화하는 것과 관련이 있습니다. (RSS)하지만 이 블로그 게시물의 범위를 벗어났을 수 있습니다 🙂 3. 금융: 자본 가격 자산 모델은 선형 회귀를 사용하여 투자의 체계적인 위험을 분석하고 정량화합니다. 이 예제에서는 모든 매개 변수의 기본값을 사용합니다. 두 변수가 선형적으로 관련되어 있다고 가정합니다.

따라서 함수 또는 독립 변수(x)의 함수로 응답 값(y)을 가능한 한 정확하게 예측하는 선형 함수를 찾으려고 합니다. 여기서 출력은 차원에서만 이전 예제와 다릅니다. 예측된 응답은 이제 2차원 배열이 되었지만 이전 경우에는 한 차원이 있었습니다. p 피처의 회귀 선은 다음과 같이 표시됩니다: h(x_i)가 ith 관측값에 대한 응답 값을 예측하고 b_0, b_1, …, b_p는 회귀 계수입니다. 꽤 좋은 작업이 완료되었습니다, 선형 모델을 얻었다! 안녕 여러분! “팬더”라이브러리와 NumPy 라이브러리를 간단히 소개 한 후, 파이썬에서 모델을 구축하는 것에 대한 빠른 소개를 제공하고 싶었으며, 매우 기본적인 모델 중 하나 인 선형 회귀보다 시작하는 것이 더 좋은 곳은 무엇입니까? 이것은 기계 학습에 대한 첫 번째 게시물이 될 것이며 앞으로 더 복잡한 모델에 대해 쓸 계획입니다. 지켜! 그러나 지금은 선형 회귀에 초점을 맞출 수 있습니다. 이는 각 직원과 관련된 데이터가 하나의 관찰을 나타내는 회귀 문제입니다. 경험, 교육, 역할 및 도시는 독립적 인 특징이며 급여는 그들에 달려 있다고 가정합니다. 물론 다른 기본 함수도 가능합니다. 예를 들어 유용한 패턴 중 하나는 다항식 베이스의 합계가 아니라 가우시안 베이스의 합계인 모델에 맞추는 것입니다. 결과는 다음과 같은 그림처럼 보일 수 있습니다: 두 개의 독립 변수가 있는 경우 추정 회귀 함수는 f(xθ, x₂) = bθ + b +b₂x₂입니다.

3차원 공간에서 회귀 평면을 나타냅니다. 회귀의 목적은 이 평면이 실제 응답에 최대한 가깝도록 가중치 b의 값을 결정하고 최소한의 SSR을 산출하는 것입니다. 선형 회귀를 통해 목표는 모든 데이터 포인트와 라인 사이의 수직 거리를 최소화하는 것입니다. 이 문서의 끝에 도달, 우리는 아래 선형 회귀의 몇 가지 응용 프로그램에 대해 설명합니다. 파이썬에서 선형 회귀를 구현하기 시작할 차례입니다. 기본적으로 적절한 패키지와 해당 기능 및 클래스를 적용하기만 하면 됩니다. 원래 여기에 게시: http://blog.contactsunny.com/data-science/linear-regression-in-python-using-scikit-learn 출력 해석 — 우리는이 모델은 훨씬 더 높은 R-제곱 값을 가지고 여기에서 볼 수 있습니다 – 0.948, 이 모델은 설명하는 것을 의미 종속 변수의 분산의 94.8%입니다. 회귀 모델에 변수를 추가할 때마다 R²는 더 높아지지만 이것은 꽤 높은 R²입니다.