일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 상관관계
- 히스토그램 그리기
- merge
- 데이터분석
- Dense_Rank
- 총과 카드만들기
- 데이터분석가
- 정보획득량
- sql
- 그래프시각화
- 단순회귀 분석
- 불순도제거
- max
- 회귀분석
- Intersect
- 여러 데이터 검색
- 팀스파르타
- sqld
- 순위출력
- difftime
- count
- 회귀분석 알고리즘
- loop 문
- 빅데이터분석
- Sum
- 빅데이터
- %in%
- 막대그래프
- if문 작성법
- 그래프 생성 문법
- Today
- Total
목록2024/09 (22)
ch0nny_log
✨ 유형 2번 문제를 풀기위해 반드시 암기하고 가야할 코드 1. 랜덤 포레스트 from sklearn.ensemble import RandomForestClassifierr_model = RandomForestClassifier(n_estimators=100) 2. 서포트 백터 머신from sklearn import svmsvm_model = svm.SVC(C=100, gamma=3) 3. 신경망 from sklearn import MLPClassifiermodel = MLPClassifier(hidden_layer_sizes=(100, 200)) 1. 데이터 생성from sklearn.datasets import make_blobsx, y = make_blobs( centers =2, ran..
분류from sklearn.neural_network import MLPRegressor수치예측from sklearn .neural_network import MLPClassfier-> 분류모델: knn, 나이브베이즈, 의사결정트리, 랜덤포레스트, 신경망, 서포트 백터# 랜덤포레스트 모델 생성 (시험장에갈때 꼭 외워가야하는 코드)# 진행순서#1. 데이터 로드import pandas as pdiris = pd.read_csv("c:\\data\\iris2.csv")iris.head()#2. 결측치 확인iris.isnull().sum()#3. 종속변수와 독립변수 분리x = iris.iloc[ : , :4 ]y = iris.iloc[ : , 4 ]#4. 데이터 정규화from sklearn.preproce..
빅분기 시험에서 머신러닝은 랜덤포레스트와 다중회귀면 됨인공지능 — 머신러닝 — 딥러닝 데이터 분석통계 데이터 분석 (가설검정)기계학습 데이터 분석 (분류,회귀) 분류회귀knn, 나이브 베이즈, 의사결정트리, 서포트 벡터 머신, 신경망단순회귀, 다중회귀 머신러닝1. 분류: knn, 나이브베이즈, 의사결정트리, 서포트 백터머신, 신경망, 로지스틱 회귀 , 랜덤 포레스트 2. 회귀: 단순회귀, 다중회귀, 랜덤 포레스트숫자 --> knn문자 --> naivebayes 데이터 분석가 데이터 사이언티스트 데이터 엔지니어 딥러닝 개발자 데이터 검색 및 시각화 , 현상분석 , 통계분석( porduct / 금융 / 마케팅 (노코딩, 코딩))데이터 분석가의 업무 + 머신러닝데이터..
예제1. 아래의 SQL을 판다스로 구현하시오 1) SQLselect ename, sal from emp where sal > ( select sal from emp where ename='JONES' ); 2) pythonjones_sal = emp['sal'][ emp.ename=='JONES'].values[0]emp[['ename', 'sal']] [ emp.sal > jones_sal ] 예제2. 위의 결과를 loc 함수를 이용해서 검색하시오,jones_sal = emp.loc..
* SQL 의 조인을 판다스로 구현하기 SQL vs 판다스equi joinpd.merge 함수non equi join outer join self join 문제1. dept.csv 를 dept 데이터 프레임으로 구성하시오 import pandas as pd emp = pd.read_csv('c:\\data\\emp.csv')dept = pd.read_csv('c:\\data\\dept.csv')문제2. 아래의 sql을 판다스로 구현하시오. (join)1) SQLselect e.ename, d.loc from emp e, dept d where e.deptno = d.deptno2) pythonemp_dept = pd.merge(emp, dept, on ='deptno..
■ 복습문제 문제1. 아래의 sql을 판다스로 구현하기 1) SQLselect sum(sal) from emp where deptno = 20; 2) pythonimport pandas as pdemp = pd.read_csv("c://data500//emp.csv")#empresult = emp['sal'][emp['deptno'] == 20]print(result.sum()) ### 결과 : 10875시리즈 = 컬럼문법 : emp[컬럼명 리스트][검색조건]문제2. 1)SQLselect deptno,sum(sal) from emp group by deptno; 2)pythonemp.groupby('deptno')['sal'].sum().reset_index()result = emp...