ch0nny_log

[빅데이터분석] R _9. IS.NA (결측치) 본문

빅데이터 분석(with 아이티윌)/R

[빅데이터분석] R _9. IS.NA (결측치)

chonny 2024. 6. 27. 10:56
 is.na (결측치 데이터를 검색할 때) 
: 데이터 분석은 결측치 처리를 어떻게 해야 하는가가 가장 중요함 (얼마나 있는지 조사해서 적절한 다른 데이터로 변경)
숫자 -> 평균값 / 문자 -> 최빈값

※ 현장 tip
emp 데이터 프레임에 결측치가 어떻게 있는지 한 번에 확인하는 방법
colSums(is.na(emp))

문제 1. 커미션이 null인 사원들의 이름과 커미션을 출력하시오.
emp[is.na(emp$comm),c('ename','sal','comm')]

 



문제 2. 커미션이 null이아 사원들의 이름과 커미션을 출력하시오.
emp[!is.na(emp$comm),c('ename','sal','comm')]


문제 3. 사원 테이블의 커미션이 null인 사원들은 모두  몇 명인가?
a<-emp[is.na(emp$comm),c('ename','comm')]
print(length(a))
마지막 문제. tatanic2.csv  데이터를 데이터 프레임으로 생성하고 결측치가 얼마나 있는지 가장 결측치가 많은 칼럼은 어떤 건지 확인하시오!
## tatanic2 파일 열기기
setwd("c:\\data")
tatanic2 <- read.csv("tatanic2.CSV",header=T)
tatanic2


## NULL 값 구하기
colSums(is.na(tatanic2))