Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 상관관계
- 불순도제거
- %in%
- count
- 순위출력
- 정보획득량
- 막대그래프
- 데이터분석가
- difftime
- if문 작성법
- 단순회귀 분석
- sql
- 빅데이터분석
- max
- 빅데이터
- 데이터분석
- 회귀분석
- 여러 데이터 검색
- sqld
- Dense_Rank
- loop 문
- Sum
- Intersect
- 총과 카드만들기
- 팀스파르타
- 그래프시각화
- 그래프 생성 문법
- 히스토그램 그리기
- merge
- 회귀분석 알고리즘
Archives
- Today
- Total
ch0nny_log
[빅데이터분석] R _ 59. 상관관계 본문
다중회귀 분석에 앞서서 상관관계 분석을 하는 이유 ?
독립변수들간의 강한 상관관계를 보이게 되는 다중 공선성 여부를 확인해야
회귀분석 결과에 대한 가장 중요한 결정계수(설명력)에 대한 신뢰를 할 수있기 때문입니다.
상관관계와 회귀분석의 차이
상관관계는 두 변수간의 관계의 강도를 측정한 수치입니다.
회귀분석은 한 변수간의 변화가 다른 변수에 미치는 영향력을 예측하는데 사용됩니다
※ 상관관계 시각화 예제 1
cha <-read.csv('challenger.csv', header =T) pairs(cha,pch='')
※ 상관관계 시각화 예제 2 (산포도행렬)
cha <-read.csv('challenger.csv', header =T) install.packages('psych') library(psych) pairs.panels(cha,pch='.')
★ 마지막문제: 미국 대학 입학 점수 데이터로 단순회귀분석하시오. ( x 축 : 학과점수(academic) y 축 : 승인점수(acceptance))
x 축 : 학과점수(academic) y 축 : 승인점수(acceptance)
회귀방정식: 승인점수= 26.0466+ 0.1761* 학과점수
해석: 학과점수가 1점 증가할때 승인점수가 평균적으로 0.1761점 증가한다.
+ p-value가 0.05보다 작기 때문에 승인점수와 학과점수와의 관계가 유의미하다.
'빅데이터 분석(with 아이티윌) > R' 카테고리의 다른 글
[빅데이터분석] R _ 61. 다중 공선성 (0) | 2024.07.18 |
---|---|
[빅데이터분석] R _ 60. 다중회귀 (0) | 2024.07.18 |
[빅데이터분석] R _ 58. 단순 회귀분석 알고리즘 (1) | 2024.07.16 |
[빅데이터분석] R _ 57. 의사 결정 트리 (5) | 2024.07.16 |
[빅데이터분석] R _ 56. 규칙기반 알고리즘(one r/riper 알고리즘) (0) | 2024.07.12 |