일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 빅데이터
- sql
- 불순도제거
- 회귀분석
- loop 문
- 정보획득량
- 그래프 생성 문법
- %in%
- if문 작성법
- count
- 그래프시각화
- 단순회귀 분석
- 데이터분석가
- 빅데이터분석
- 상관관계
- 총과 카드만들기
- Intersect
- Dense_Rank
- 순위출력
- Sum
- 막대그래프
- max
- 회귀분석 알고리즘
- 히스토그램 그리기
- 팀스파르타
- merge
- difftime
- sqld
- 여러 데이터 검색
- 데이터분석
- Today
- Total
목록빅데이터 분석(with 아이티윌)/SQL (35)
ch0nny_log
★점심시간문제어제 마지막 문제로 만든 테이블에서 살인기수가 많이 일어나는 요일과 건수, 순위를 출력하는데 순위가1등, 3등, 5등만 출력하시오! select 요일, 건수, 순위from ( select week_day AS 요일, c_cnt AS 건수, dense_rank() over (order by c_cnt desc) as 순위 from crime_week_pivot where c_small_type = '살인기수')where 순위 in (1, 3, 5);[TIL 22] 240613복습 1. 테이블에 대한 설명이 있는지 알아보는 방법?-> 테이블 정의서를 열어보거나 user_tab_comments를 보면 됨됨124. 정규표현예제 124. 정규 표현식 오라클 함수 5..
[오늘의 점심시간 문제] 미국도 우리나라 처럼 강주변의 집값이 더 비쌀까?가설검정하기에 앞서서 찰스강 경계에 있는 집값들의 평균값과 찰스강 경계에 있지 않는 집값들의 평균값을 먼저구해서어디가 더 비싼지를 알아봅니다. 집값을 예측하는 머신러닝 모델을 만들고 싶다면 훈련과 테스트로 나누는 경우면 나누는데 그냥 가설검정만 하고 싶다면 훈련과 테스트로 나누지말고 테이블 전체를 다 사용해서 가설검정을 하세요 ~1. 가설검정:귀무가설: 찰스강 경계에 집이 위치하는것은 집값에 영향이 없다.대립가설: 찰스강 경계에 집이 위치하는것은 집값에 영향이 있다.신뢰수준은 95% 입니다. 2. 데이터: 3. 컬럼설명: 첨부된 파일 1개▼ ** 풀이1) 테이블생성create table boston (b_id number(2..
★ 점심시간문제: 다음의 from 절의 서브쿼리를 with 절로 변경하세요. 1) 튜닝전select deptno, ename, sal, 순위 from ( select deptno, ename, sal, dense_rank() over ( partition by deptno order by sal desc ) 순위 from emp ) where 순위 = 1; 2) 튜닝후with dept_rank as (sel..
★ 점심시간문제: 우리반 테이블에 나이 컬럼에 체크 제약을 거시오. 나이가 20~ 40 까지의 데이터만 입력 또는 수정되겠금 체크 제약을 거시오. 제약을 걸고 자신의 나이를 41로 업데이트를 해서 안되는 화면을 검사 받으시면 됩니다.alter table emp19 add constraint emp19_age_ck check(age between 20 and 40); update emp19 set age =41;[TIL 19] 240610[복습] 제약을 거는 방법 2가지1. 테이블 생성 시 제약을 거는 방법2. 만들어진 테이블에 제약을 거는 방법1) 저장된 파일 demo를 cmd로 열기sqlplus c##scott/tiger @demo.sq..
★ 점심시간문제: 아래의 인덱스를 생성한 후 다음의 SQL을 튜닝하시오!실행계획도 같이 출력해서 검사받으세요. create index emp19_ename on emp19(ename); 튜닝 전: select ename, age from emp19 where substr(ename,1,1)='김';-- 실행후 & 실행계획 (buffers:2)select ename, age from emp19 where ename like '김%';select /*+ gather_plan_statistics */ ename, age from emp19 where ename like '김%'; SELECT * FROM TABLE(dbms_xplan.display_cu..
★ 점심시간문제나이가 많으면서 비만이면 의료비가 더 많이 드는가?귀무가설: 나이가 많으면서 비만이면 의료비와 연관이 없다.대립가설: 나이가 많으면서 비만이면 의료비와 연관이 있다.나이는 60살을 기준으로 60살 이상이면 1 아니면 0으로 하는 파생컬럼을 추가하세요.비만지수는 30을 기준으로 1과 0으로 구분된 bmi30을 그대로 사용합니다. bmi_age_old 라는 파생 컬럼을 만들어서 가설검정을 하면 됩니다. 나이는 60살을 기준으로 60살 이상이면 1 아니면 0으로 하는 파생컬럼을 추가하세요.비만지수는 30을 기준으로 1과 0으로 구분된 bmi30을 그대로 사용합니다. bmi_age_old 라는 파생 컬럼을 만들어서 가설검정을 하면 됩니다. --파생 컬럼 만들기alter table insurance..
★ 점심시간문제스티브 잡스 연설문에 포함된 긍정단어, 긍정단어 빈도수, 순위를 출력하는데 순위가 긍정단어 빈도수를 기준으로 순위를 출력하세요 select s.word, count(*) positive_jobs, dense_rank () over (order by count(*)desc) 순위 from stev_word2 s where exists (select p_word from positive_eng p where lower(p.p_word) =lower(s.word)) group by s.word;[TIL 16] 24060394. CREATE ..
★ 점심시간 문제우리반 테이블에서 태어난 요일을 출력하고 태어난 요일별 인원수를 출력하는데 태어난 요일별 인원수가 4명이상인것만 출력하고 태어난 요일별 인원수가 높은것부터 출력하시오 select to_char(birth, 'day')요일, count(*) from emp19 group by to_char(birth, 'day') having count(*) >= 4 order by 2 desc;[TIL 15]240531* SQL을 통해서 데이터 분석 질문들1. 순위를 통한 데이터분류2. 데이터간 상관관계 분석3. SQL로 회귀분석(수치예측) 89. 계층형 질의문_서열1. ORDER SIBLINGS BY2. 가지치기 (PRUNING) 3. SYS_CONNECT_BY_PATH예제 89...