Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 회귀분석
- 불순도제거
- 총과 카드만들기
- 그래프시각화
- 빅데이터
- difftime
- Sum
- 히스토그램 그리기
- merge
- 빅데이터분석
- 회귀분석 알고리즘
- 상관관계
- 막대그래프
- 데이터분석가
- 단순회귀 분석
- loop 문
- count
- 순위출력
- if문 작성법
- 팀스파르타
- sqld
- %in%
- max
- 그래프 생성 문법
- sql
- 정보획득량
- Dense_Rank
- Intersect
- 여러 데이터 검색
- 데이터분석
Archives
- Today
- Total
ch0nny_log
[빅데이터분석] R _ 28. Google Colab 본문
★ 점심시간 문제
부서명과 부서명별 토탈월급의 비율을 다음과 같이 원형 그래프로 시각화 하시오 !
# emp, dept 테이블 합치기 a <- merge(emp, dept, by = 'deptno') # 필요한 열만 선택하여 보기 print(a[, c('ename', 'deptno', 'dname')]) # 부서별로 급여 합계 구하기 x <- aggregate(sal ~ deptno, a, sum) print(x) # 부서별 급여의 총 급여 대비 비율 계산 pct <- round(x$sal / sum(emp$sal) * 100, 1) print(pct) # 부서 이름 가져오기 dept_labels <- sapply(x$deptno, function(deptno) { dept_name <- dept[dept$deptno == deptno, "dname"] return(dept_name) }) # 라벨 생성 job_label <- paste(dept_labels, ':', pct, '%') print(job_label) # 원형 차트 그리기 pie(x$sal, labels = job_label, col = rainbow(14), density = 80)
# emp, dept 테이블 합치기 a <- merge(emp, dept, by = 'deptno') # 부서별로 급여 합계 구하기 x <- aggregate(sal ~ deptno + dname, a, sum) # 부서별 급여의 총 급여 대비 비율 계산 pct <- round(x$sal / sum(a$sal) * 100, 1) # 라벨 생성 dept_label <- paste(x$dname, ':', pct, '%') # 원형 차트 그리기 pie(x$sal, labels = job_label, col = rainbow(14), density = 80)
Google Colab 을 사용하면 좋은점?
1. 현업처럼 데이터의 양이 많을 때 로컬 컴퓨터의 자원으로는 데이터 분석이 어려움
-> 구글 서버 엔비디아 하드웨어 이용
2. 인터넷만 되면 어디서든 내가 작성했던 코드를 바로 수행해 볼 수 있음.
-> 꼭 R studio를 이용하지 않아도 됨
3. 코드와 수행 결과에 대한 팀원들 끼리의 공유가 쉬움
4. 구글 제미나이 인공지능을 이용하여 빠른 데이터 분석이 가능함
-> scv 파일 업로드 하여 코드 작성
문제1. 구글 코렙에서 emp 와 dept 데이터 프레임을 조인해서 이름과 부서위치를 출력하시오 !
x<- merge(emp, dept,by='deptno') x [ , c('ename','loc')]
'빅데이터 분석(with 아이티윌) > R' 카테고리의 다른 글
[빅데이터분석] R _ 30. 서브쿼리 (0) | 2024.07.01 |
---|---|
[빅데이터분석] R _ 29. 집합연산(rbind, rbind + unique,intersect,setdiff) (1) | 2024.07.01 |
[빅데이터분석] R _ 27. EQUI JOIN/OUTER JOIN/SELF JOIN (0) | 2024.06.28 |
[빅데이터분석] R _ 26. GROUP BY절 두개의 컬럼 사용 (0) | 2024.06.28 |
[빅데이터분석] R _ 25. 그룹함수 MEAN (0) | 2024.06.28 |