일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 막대그래프
- 회귀분석 알고리즘
- 정보획득량
- 여러 데이터 검색
- 데이터분석
- sql
- 불순도제거
- 빅데이터분석
- Sum
- 팀스파르타
- 회귀분석
- %in%
- Intersect
- 상관관계
- 총과 카드만들기
- difftime
- loop 문
- 그래프시각화
- 순위출력
- if문 작성법
- 단순회귀 분석
- merge
- max
- count
- Dense_Rank
- sqld
- 빅데이터
- 그래프 생성 문법
- 데이터분석가
- 히스토그램 그리기
- Today
- Total
목록빅데이터 분석(with 아이티윌)/R (76)
ch0nny_log
지도 그래프를 시각화를 해야하는 이유 ? 1. 공공 정책 및 행정 예: 범죄 지도, 선거 결과 분석, 교통 관리, 도시 계획등에서 지리적 데이터를 이용해서 정책결정을 지원 범죄 발생지도를 통해 경찰 순찰 경로를 최적화 하거나, 교통 혼잡 직역을 분석하여 교통 신호 체계를 개선할 수있다. 2. 건강 과 질병 질병 발생 지도, 전염병확상 경로 분석을 통해 공중 보건 전략을 수립합니다. 3. 마케팅 및 소매업 고객분포 분석, 상권 분석, 지점 위치등을 최적화 할때 활용 예: sk telecom 에서 기지국 세울 때 적절곳에 기지국을 만들어야 할때 활용 ( 지도 그래프, 비지도 학습의 k-means 머신..
★ 점심시간 문제cbs 라디오 그대와 여는 아침에 노래는 주로 어떤 노래들이 반복해서 선곡되는지 워드 클라우드로 확인하세요.김용신의_그대와_여는_아침_선곡표_7월부터_9월까지install.packages("wordcloud2")install.packages("tm")install.packages("RColorBrewer")install.packages("plyr")install.packages("data.table")# 라이브러리 로드library(wordcloud2)library(tm)library(RColorBrewer)library(plyr)library(data.table)# 텍스트 데이터 로드setwd("c:\\data") file_path ■ 감정분석 데이터 분석문제 1. 조바이든 연설문을 워..
원드클라우드 그래프란?텍스트 데이터 탐색 및 요약주요 단어 강조등을 시작화 하고 싶을 때 사용하는 그래프트랜드를 분석하거나 쇼셜 미디어와 뉴스에서 언급하는 주요 내용들을 분석할 때■ Rjava 설치하기1. 아래에서 java 64비트를 다운로드 받는다 https://www.java.com/en/download/manual.jsp2. Windows Offline (64-bit) 으로 설치3. 아래와 같이 환경설정을 한다. Sys.setenv(JAVA_HOME='C:\\Program Files\\Java\\jre-1.8') ※ 설명 : R 에서 지금 자바홈 위치가 어디있다는 것을 알려주는 것 4. 설치를 한다. install.packages("rJava")library(rJa..
박스 그래프 평균값과 중앙값과 최빈값만으로는 데이터 분석을 하기 부족한 경우가 있습니다. 평균 데이터는 데이터의 중심이 어디즘인지는 알려주지만 특정 데이터가 평균을 중심으로 어떻게 분포가 되어 있는지는 알려주지 않습니다. 그래서 범위와 사분위수 범위를 알아야합니다. 박스 그래프는 사분위수 범위에 대한 데이터 분포를 볼 수 있는 그래프입니다. 문법1. 어느 농군단의 감독이 아래의 3명의 농구선수중 한명을 선택하려한다. 아래의 3명의 선수의 게임별 점수(득점) 를 가지고 한명을 고른다면 어떤 선수는 골라야하나 ?각각의 게임당 득점한 점수 x1 1. 평균값mean(x1)mean(x2)mean(x3)2. 중앙값median(x1)median(x2)median(x3)3. 최빈값names(table(x1))[ t..
■ 원형 그래프 생성# 데이터 로드library(plotly)setwd('c:\\data')usedcars ■ 막대 그래프 생성# 타이타닉 테이블 불러오기setwd('c:\\data')tat■ 산포도 그래프 생성# 데이터 불러오기library(plotly)setwd("c:\\data")usedcars %add_trace(x=usedcars$mileage, y=fitted(lm(price~mileage, data=usedcars)), type='scatter', mode='lines', line=list(color='red'), ..
★ 점심시간 문제: 커미션을 받는 사원들의 월급의 분포를 산포도 그래프로 시각화 하세요 # 데이터 불러오기library(plotly)setwd("c:\\data")emp % layout( xaxis = list(title = 'ename'), yaxis = list(title = 'sal'))# 그래프 출력fig# 필요한 라이브러리 로드install.packages("modeest")# 그래프 지우기 graphics.off() library(modeest) # R 에서 최빈값을 출력하고 사용함, mlv 함수 이용하여 최빈값 추출# 1. 대칭분포 데이터 생성# 아래의 rnrom 함수가 값을 랜덤하게 생성하기 때문에 모든 자리에서 동일하게# 랜덤한 값을 생성하기 위해서 s..
막대그래프와 차이막대 그래프히스토그램 그래프개별항목의 수량이나 빈도 비교 (ex. 직업, 연도별)연속형 데이터의 분포를 시각화 할때 사용 (ex. 시험점수 분) 문제 1. 날씨 데이터로 히스토 그램 그래프를 그리시오.## 데이터 업로드 및 상태확인setwd('c:\\data')weather설명: x축이 평균 기온값(10,40도사이) /y축이 각구간에 해당하는 빈도수 -> 대부부의 데이터가 24도~29도에 밀집해있음 -> 왜도(skewness)를 보면 히스토그램의 분포는 대칭적이지 않고 약간 왼쪽으로 치우쳐져 있음. -> 확률 밀도그래프로 데이터의 치우침을 시각화 할 수 있음. ## 확률 밀도 히스토그램램hist(ahot, breaks = seq(10,40, by=1),col='grey',borde..
라인 그래프란?- 시간에 따른 변화를 추적 확인할 때 매우 효과적인 그래프ex. 제품의 가격 변동과 판매량과의 관계- 두변수간의 관계를 시각화 할때 유용- 경향성 분석 ex. 년도별로 출산율이 저하되는지 확인 문법1. plotly 로 강남역 시간대별 승하차수를 라인 그래프로 시각화 하시오.#예제1. 승차수 라인만 출력하시오# plotly 패키지 로드library(plotly)# 작업 디렉토리 설정setwd("c:\\data")# 데이터 로드data % add_trace(y = ~in_cnt, name = '승차', type = 'scatter', mode = 'lines+markers', line = list(color = 'blue'))# 그래프 출력fig문법2. 위 그래프의 하차수도 라인그래프로 추..