일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- sql
- loop 문
- 막대그래프
- max
- 불순도제거
- sqld
- 데이터분석
- 순위출력
- 빅데이터분석
- Dense_Rank
- if문 작성법
- merge
- difftime
- Intersect
- 단순회귀 분석
- 그래프 생성 문법
- 회귀분석 알고리즘
- 팀스파르타
- 여러 데이터 검색
- 상관관계
- 정보획득량
- 데이터분석가
- 히스토그램 그리기
- 그래프시각화
- 회귀분석
- Sum
- %in%
- 빅데이터
- count
- 총과 카드만들기
- Today
- Total
목록빅데이터 분석(with 아이티윌)/R (76)
ch0nny_log
산포도란?- 두개의 변수간 관계를 확인할 때 유용한 그래프- 이상치를 탐지하기 좋음 (선형관계/ 비선형관계/ 양의 상관관계/ 음의 상관관계/ 상관관계가 없음)문법1. 중고차 데이터의 x 축을 주행거리로 하고 y축을 가격으로 해서 산포도 그래프 를 plotly 로 그리시오 !# 데이터 불러오기library(plotly)setwd("c:\\data")usedcars 시설명: 주행거리가 높을 수록 중고차가격이 하락하는 패턴을 보입니다.문법 2. 위 그래프에 추세선을 추가하시오.# 데이터 불러오기library(plotly)setwd("c:\\data")usedcars %add_trace(x=usedcars$mileage, y=fitted(lm(price~mileage, d..
★ [7월 2일 화요일] 점심시간 문제 타이타닉(tatanic2.csv) 의 성별별 인원수를 plotly 막대 그래프로 시각화 하시오. # 타이타닉 테이블 불러오기setwd('c:\\data')tat 문법1. R 내장 함수를 이용해서 원형 그래프 그리기 !emp ★ 문법2. plotly 시각화 패키지로 원형 그래프 그리기원형그래프는 데이터간 비율을 한눈에 파악할 때 유용한 그래프임.# 데이터 로드library(plotly)emp 설명: plotly를 이용하면 더 세련된 그래프를 그릴수 있고 홈페이지에 그래프를 넣을때 아주편함.문제 3. 중고차의 모델별 건수를 가지고 다음과 같이 원형 그래프를 그리시오.# 데이터 로드library(plotly)setwd('c:\\data')usedcars 문제 4. 데이..
1960-1970년대초기 컴퓨터 시각화 도구IBM's GPSS: General Purpose Simulation System은 1960년대에 개발되어 컴퓨터 시뮬레이션과 함께 시각화 도구로 사용되었습니다.SYMAP (Synagraphic Mapping System): 1966년 하버드 대학의 하워드 피셔가 개발한 프로그램으로, 초기 컴퓨터 지도 제작 시스템 중 하나입니다.1980년대SAS (Statistical Analysis System)1976년 SAS Institute가 설립되었고, 1980년대에 데이터 분석 및 시각화를 위한 주요 도구로 발전했습니다.Matlab1984년 MathWorks에 의해 출시된 Matlab은 수치 계산 및 데이터 시각화를 위한 강력한 도구로 자리 잡았습니다.1990년대Ex..
※ 기계 학습 도중 하이퍼 파라미터를 찾을 때 일일히 수작업 하지 않고 찾으려면 IF문과 LOOP문을 잘알아야함 ■ IF 문문제1. IF문 기본문법if(조건식 a){ 조건식이 true 일 때 실행되는 식}else if (조건식 b) { 조건식a가 true 일때 시행되는식}else { 위 조건식들에 만족되지 않는경우 시행되는식 } check_number 0) { print('양수입니다.') } else if(num문제 2. 나이를 입력받아 다음의 조건에 따른 메세지를 출력하게 하시오.check_age = 0 && age = 13 && age =20) { print('성인입니다.') } else { print('유효하지 않은 ..
※ R에서 함수생성하면 좋은점- 필요한 코드들만 따로 잘 모아서 편하게 작업하기 위해 (점진적 코드 디벨롭) 문제1. 함수 기본 생성 문법 작성법함수 Q. 이름을 입력하면 해당 사원의 월급이 출력되는 함수를 생성하시오.income 문제2. 위의 함수를 수정해서 문자로 입력해도 출력이 되게끔 수정하시오.income 문제3. 직업을 입력하면 해당 직업의 토탈월급이 출력되게하는 함수를 출력하시오. job_sumsal 문제 4. 위의 코드를 수정해서 직업을 물어보게하고 입력하게 하시오 ! job_sumsal
문제1. 이름, 월급, 월급에 대한 순위를 출력하시오.1) SQLselect ename, sal, rank() over(order by desc) 순위;2) R emp$rnk 설명: rank( -emp$sal, ties.method="min") 여기서 마이너스(-) 를 써야 월급이 높은 사원부터 순위를 부여합니다. ※ ties.method 의 옵션 이란? ?1. min : 오라클의 rank 함수와 똑같음2. max: 2등이 두명이면 둘다 3등으로 출력함.3. first: 오라클의 rank와 같은데 순위가 같은 데이터가 있으면 인덱스 순서가 먼저 나온 데이터를 높은 순으로 부여함. 문제2. 아래의 SQL을 R 로 구현하시오.1) SQLselect ename, sal, rank() over (or..
※ 서브쿼리1. SQL1. single row subquery서브쿼리에서 메인 쿼리로 하나의 값이 리턴되는 경우2. multiple row subquery서브쿼리에서 메인 쿼리로 여러의 값이 리턴되는 경우3. multiple column subquery서브쿼리에서 메인쿼리로 여러개의 컬럼값들이 리턴되는 경우문제1. 아래의 sql을 r로 구현하시오1) SQLselect ename, sal from emp where sal >(select sal from emp where ename ='JONES';2) Rjones_sal jones_sal , c('ename','sal')]문제2. 아래의 sql을 r로 구현하시오1) SQLselect ename, ..
※ 집합연산자 SQLVSR union allrbind unionrbind + unique※ RBIND 는 두개의 결합집합을 위아래 출력하고 싶을 때 사용하는 함수※ CBIND는 두개의 결과 집합을 양 옆으로 출력하고 싶을 때 사용하는 함수intersectintersect minussetdiff※ SETDIFF 의 경우 R에 내장된 SETDIFF를 사용하면 안되고 DPLYR패키지에서의 SETDIFF를 사용해야함■ RBIND문제1. 아래의 SQL을 R로 구현하시오.1) SQL select ename, sal, deptno from emp where deptno in ( 10 , 20 ) union all select ename, s..