ch0nny_log

[빅데이터분석] R _ 28. Google Colab 본문

빅데이터 분석(with 아이티윌)/R

[빅데이터분석] R _ 28. Google Colab

chonny 2024. 7. 1. 10:10
★ 점심시간 문제
부서명과 부서명별 토탈월급의 비율을 다음과 같이 원형 그래프로 시각화 하시오 !


# emp, dept 테이블 합치기
a <- merge(emp, dept, by = 'deptno')

# 필요한 열만 선택하여 보기
print(a[, c('ename', 'deptno', 'dname')])

# 부서별로 급여 합계 구하기
x <- aggregate(sal ~ deptno, a, sum)
print(x)

# 부서별 급여의 총 급여 대비 비율 계산
pct <- round(x$sal / sum(emp$sal) * 100, 1)
print(pct)

# 부서 이름 가져오기
dept_labels <- sapply(x$deptno, function(deptno) {
  dept_name <- dept[dept$deptno == deptno, "dname"]
  return(dept_name)
})

# 라벨 생성
job_label <- paste(dept_labels, ':', pct, '%')
print(job_label)

# 원형 차트 그리기
pie(x$sal, labels = job_label, col = rainbow(14), density = 80)

 

# emp, dept 테이블 합치기
a <- merge(emp, dept, by = 'deptno')

# 부서별로 급여 합계 구하기
x <- aggregate(sal ~ deptno + dname, a, sum)

# 부서별 급여의 총 급여 대비 비율 계산
pct <- round(x$sal / sum(a$sal) * 100, 1)

# 라벨 생성
dept_label <- paste(x$dname, ':', pct, '%')

# 원형 차트 그리기
pie(x$sal, labels = job_label, col = rainbow(14), density = 80)

 

 


Google Colab 을 사용하면 좋은점?

 

Google Colab

 

colab.research.google.com

 

1. 현업처럼 데이터의 양이 많을 때 로컬 컴퓨터의 자원으로는 데이터 분석이 어려움
         -> 구글 서버 엔비디아 하드웨어 이용

2. 인터넷만 되면 어디서든 내가 작성했던 코드를 바로 수행해 볼 수 있음.
         -> 꼭 R studio를 이용하지 않아도 됨

3. 코드와 수행 결과에 대한 팀원들 끼리의 공유가 쉬움

4. 구글 제미나이 인공지능을 이용하여 빠른 데이터 분석이 가능함

 

-> scv 파일 업로드 하여 코드 작성

문제1. 구글 코렙에서 emp 와 dept 데이터 프레임을 조인해서 이름과 부서위치를 출력하시오 !
x<- merge(emp, dept,by='deptno')
x [   , c('ename','loc')]​