일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- merge
- 정보획득량
- 막대그래프
- 히스토그램 그리기
- 회귀분석
- Intersect
- 빅데이터분석
- loop 문
- 데이터분석가
- 여러 데이터 검색
- sqld
- 불순도제거
- 상관관계
- 팀스파르타
- 데이터분석
- 빅데이터
- 그래프 생성 문법
- %in%
- 회귀분석 알고리즘
- max
- difftime
- count
- 단순회귀 분석
- sql
- 총과 카드만들기
- 순위출력
- if문 작성법
- Dense_Rank
- Sum
- 그래프시각화
- Today
- Total
목록빅데이터 분석(with 아이티윌)/R (76)
ch0nny_log

SQLVSRto_charas.characterto_numberas.integerto_dateas.Date ※ 옵션의 종류 format(특정날짜, 옵션)1) %A요일2) %Y년도 4자리3) %y: 년도 2자리 4) %m달문제 1. 이름과 입사한 요일을 출력하시오.1) SQLselect enmae, to_char(hiredate,'day') from emp;2) Remp$hire_yoli 설명: format(특정날짜, 옵션)문제 2. 내가 무슨 요일에 태어났는지 출력하시오. 1) SQLselect to_char(to_date('1999/11/17','RRRR/MM/DD'),'day') from dual;2) Rformat(as.Date('1995/12/10'),'%A') ## 이 자체로만 보면 문자..

SQLVSRsysdateSys.Date()months_between difftimeadd_monthslubridate 패키지 이용last_daylubridate 패키지 이용next_daylubridate 패키지 이용 ※ R에서 날짜 연산을 하려면 반드시 날짜형으로 변환해야 함문제 1. EMP 데이터 프레임의 hiredate가 어떤 데이터 유형인지 확인하시오. str(emp)서명: csv 파일의 데이터를 불러와서 데이터 프레임을 구성하게 되면 R이던 파이썬던 둘 다 날짜형이 아니라 문자형으로 만들어집니다.문제 2. r에서 오늘 날짜를 출력하시오.Sys.Date()★ 문제 3.(빅분기 실기 유형 1) 아래의 SQL을 R로 구현하시오.1) SQLselect ename, sysdate-hire..

문제1. 이름과 월급을 출력하는데 월급을 출력할 때 십의 자리에서 끝까지는 다 버리고 출력되게 하시오.1) SQLselect ename, trunc(sal,-2) from emp;2) RTRUNC(1223.57,-2)-- 오류뜸--> 오라클은 1200이 출력되는데 R은 1233이 출력됨.--> R은 소숫점 이하면 버릴수 있는데 소숫점 이전은 버릴 수 없음.문제2. 아래의 SQL을 R로 구현하시오1) SQLselect mod(10,2) from dual;2) R10%%2문제3. EMP20데이터 프레임에서 이름,나이를 출력하는데 나이가 짝수인 학생들만 출력하시오.emp20[(emp20$age%%2==0),c('ename','age')]

SQLVSRROUNDROUNDTRUNCTRUNCMOD%%POWER2^3 (2의 3승) ※ R과 파이썬은 짝수를 좋아함. round(컬럼, 자릿수)round(122.5) -> 122round(123.2) -> 124문제1. 이름, 월급으로 출력하는데 월급을 출력할 때 십의 자리에서 반올림되게하시오.data.table(이름=emp$ename,월급=emp$sal, 월급반올림 =round(emp$sal,-2))설명: 2975는 십의 자리에서 반올림되서 3000이 나왔지만 1250은 1200이 나옴 (sql은 정확하게 나옴)

1) SQLselect ename, replace(sal, 0, '*') from emp;2) Rlibrary(data.table)data.table(이름=emp$ename,월급=gsub(0,'*',emp$sal))설명:GSUB (변경전 데이터, 변경후 데이터, 컬럼)문제1. 아래의 SQL을 R로 구현하시오.1) SQLselect ename, regexp_replace(sal, '[0-2]','*') from emp;2) Rlibrary(data.table)data.table(이름=emp$ename,월급=gsub('[0-2]','*',emp$sal))설명: 정규 표현식은 SQL, R, 파이썬, 리눅스, 쉘, 자바 모두 공통

SQL의 substr VSR 의 substr 컬럼, 시작인덱스, 시작인덱스로부터 몇개를 가져올건지 갯수컬럼, 시작인덱스 번호, 끝 인덱스 번호문제1. 이름의 첫번째 철자가 S로 시작하는 사원의 이름, 월급을 출력하시오.1) SQLselect ename, sal from emp where substr(ename,1,1) ='S';2 Remp[substr(emp$ename,1,1)=='S',c('ename','sal')]문제 2. emp20 테이블에서 성씨가 김씨인 학생들의 이름,나이를 출력하시오.emp20[substr(emp20$ename,1,1)=='김',c('ename','age')]

SQLVSRUPPERTOUPPERLOWERTOLOWERSUBSTRSUBSTRREPLACEGSUB문제1. 이름과 직업을 출력하는데 전부 소문자로 출력하시오. > data.table(이름=tolower(emp$ename),직업=tolower(emp$sal))문제2. emp 데이터 프레임의 ename 컬럼을 소문자로 변환합니다.emp$ename 문제 3. emp 데이터 프레임의 직업도 소문자로 변환한 후에 이름과 직업을 emp 데이터 프레임에서 출력하시오.emp$job 문제 4. 이름이 scott인 사원의 이름,월급을 출력하시오. (이름을 소문자로 검색해도 출력될 수 있게) emp[tolower(emp$ename)=='scott',c('ename','sal')]

SQLvsRorder bydataframe에 내장된 order 함수 사용※ 좀더 쉽게 하려면 doby 패키지를 설치하고 orderBy 함수를 이용해서 정렬함. 문제1. 이름, 월급을 출력하는데 월급이 높은 사원부터 출력하시오.emp[order (emp$sal, decreasing = T),c('ename','sal')]문제2. emp20에서 이름과 나이를 출력하는데 나이가 높은 학생부터 출력하시오.emp20[order (emp20$age,decreasing = T),c('ename','age')]문제3. 내가 현재 접속한 R세션에서 활성화 되어 있는 변수 리스트를 출력하시오. ls()문제 4. emp20 변수를 현재 작업공간에서 지워버리고 싶다면?rm(emp20)ls()문제 5. r을 사용하다보..