Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 그래프시각화
- %in%
- Intersect
- loop 문
- 빅데이터
- 여러 데이터 검색
- max
- difftime
- merge
- 팀스파르타
- count
- 데이터분석
- 히스토그램 그리기
- 회귀분석 알고리즘
- 불순도제거
- 순위출력
- 상관관계
- 데이터분석가
- 단순회귀 분석
- Dense_Rank
- Sum
- sqld
- 빅데이터분석
- 회귀분석
- if문 작성법
- 그래프 생성 문법
- 막대그래프
- 정보획득량
- sql
- 총과 카드만들기
Archives
- Today
- Total
ch0nny_log
[빅데이터분석] R _9. IS.NA (결측치) 본문
■ is.na (결측치 데이터를 검색할 때)
: 데이터 분석은 결측치 처리를 어떻게 해야 하는가가 가장 중요함 (얼마나 있는지 조사해서 적절한 다른 데이터로 변경)
숫자 -> 평균값 / 문자 -> 최빈값
※ 현장 tip
emp 데이터 프레임에 결측치가 어떻게 있는지 한 번에 확인하는 방법
colSums(is.na(emp))
문제 1. 커미션이 null인 사원들의 이름과 커미션을 출력하시오.
emp[is.na(emp$comm),c('ename','sal','comm')]
문제 2. 커미션이 null이아 사원들의 이름과 커미션을 출력하시오.
emp[!is.na(emp$comm),c('ename','sal','comm')]
문제 3. 사원 테이블의 커미션이 null인 사원들은 모두 몇 명인가?
a<-emp[is.na(emp$comm),c('ename','comm')] print(length(a))
마지막 문제. tatanic2.csv 데이터를 데이터 프레임으로 생성하고 결측치가 얼마나 있는지 가장 결측치가 많은 칼럼은 어떤 건지 확인하시오!
## tatanic2 파일 열기기 setwd("c:\\data") tatanic2 <- read.csv("tatanic2.CSV",header=T) tatanic2 ## NULL 값 구하기 colSums(is.na(tatanic2))
'빅데이터 분석(with 아이티윌) > R' 카테고리의 다른 글
[빅데이터분석] R _ 11. 특정 철자 검색 (0) | 2024.06.27 |
---|---|
[빅데이터분석] R _ 10. 범위 데이터 검색 (0) | 2024.06.27 |
[빅데이터분석] R _8. %IN% (여러 데이터 검색) (0) | 2024.06.27 |
[빅데이터분석] R _7. %IN% (여러 데이터 검색) (0) | 2024.06.27 |
[빅데이터분석] R _6. R에서 사용하는 연산자 (0) | 2024.06.27 |