일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- merge
- 팀스파르타
- 불순도제거
- max
- Intersect
- 회귀분석 알고리즘
- 상관관계
- 빅데이터분석
- 여러 데이터 검색
- loop 문
- 순위출력
- %in%
- 막대그래프
- sql
- 단순회귀 분석
- 히스토그램 그리기
- 그래프 생성 문법
- 데이터분석
- 데이터분석가
- 빅데이터
- 회귀분석
- Sum
- Dense_Rank
- if문 작성법
- sqld
- count
- 총과 카드만들기
- difftime
- 정보획득량
- 그래프시각화
- Today
- Total
목록빅데이터 분석(with 아이티윌)/python (59)
ch0nny_log

분류from sklearn.neural_network import MLPRegressor수치예측from sklearn .neural_network import MLPClassfier-> 분류모델: knn, 나이브베이즈, 의사결정트리, 랜덤포레스트, 신경망, 서포트 백터# 랜덤포레스트 모델 생성 (시험장에갈때 꼭 외워가야하는 코드)# 진행순서#1. 데이터 로드import pandas as pdiris = pd.read_csv("c:\\data\\iris2.csv")iris.head()#2. 결측치 확인iris.isnull().sum()#3. 종속변수와 독립변수 분리x = iris.iloc[ : , :4 ]y = iris.iloc[ : , 4 ]#4. 데이터 정규화from sklearn.preproce..

빅분기 시험에서 머신러닝은 랜덤포레스트와 다중회귀면 됨인공지능 — 머신러닝 — 딥러닝 데이터 분석통계 데이터 분석 (가설검정)기계학습 데이터 분석 (분류,회귀) 분류회귀knn, 나이브 베이즈, 의사결정트리, 서포트 벡터 머신, 신경망단순회귀, 다중회귀 머신러닝1. 분류: knn, 나이브베이즈, 의사결정트리, 서포트 백터머신, 신경망, 로지스틱 회귀 , 랜덤 포레스트 2. 회귀: 단순회귀, 다중회귀, 랜덤 포레스트숫자 --> knn문자 --> naivebayes 데이터 분석가 데이터 사이언티스트 데이터 엔지니어 딥러닝 개발자 데이터 검색 및 시각화 , 현상분석 , 통계분석( porduct / 금융 / 마케팅 (노코딩, 코딩))데이터 분석가의 업무 + 머신러닝데이터..

예제1. 아래의 SQL을 판다스로 구현하시오 1) SQLselect ename, sal from emp where sal > ( select sal from emp where ename='JONES' ); 2) pythonjones_sal = emp['sal'][ emp.ename=='JONES'].values[0]emp[['ename', 'sal']] [ emp.sal > jones_sal ] 예제2. 위의 결과를 loc 함수를 이용해서 검색하시오,jones_sal = emp.loc..

* SQL 의 조인을 판다스로 구현하기 SQL vs 판다스equi joinpd.merge 함수non equi join outer join self join 문제1. dept.csv 를 dept 데이터 프레임으로 구성하시오 import pandas as pd emp = pd.read_csv('c:\\data\\emp.csv')dept = pd.read_csv('c:\\data\\dept.csv')문제2. 아래의 sql을 판다스로 구현하시오. (join)1) SQLselect e.ename, d.loc from emp e, dept d where e.deptno = d.deptno2) pythonemp_dept = pd.merge(emp, dept, on ='deptno..

■ 복습문제 문제1. 아래의 sql을 판다스로 구현하기 1) SQLselect sum(sal) from emp where deptno = 20; 2) pythonimport pandas as pdemp = pd.read_csv("c://data500//emp.csv")#empresult = emp['sal'][emp['deptno'] == 20]print(result.sum()) ### 결과 : 10875시리즈 = 컬럼문법 : emp[컬럼명 리스트][검색조건]문제2. 1)SQLselect deptno,sum(sal) from emp group by deptno; 2)pythonemp.groupby('deptno')['sal'].sum().reset_index()result = emp...

판다스(pandas) 란?테이블 형태의 데이터를 파이썬에서 검색하기 편하도록 만들어놓은 파이썬 모듈 ※ 장점 1. 배우기가 쉽다.2. 시각화 기능이 있다.3. 데이터 검색과 통계함수들이 내장되어있다.4. 머신러닝 기능들 이 내장되어 있다. 문제1.c:\\data500 폴더를 만들고 emp.csv를 폴더에 넣으시오.문제2. pandas를 이용하지 않고 emp.csv에서 모든 컬럼을 출력하시오. import csvfile_path = 'c:\\data500\\emp.csv'with open(file_path, mode='r', encoding='utf-8') as file: csv_reader = csv.reader(file) header = next(csv_r..

※ 실습. 화면 개발하기 1탄 (국내 신문사)# 화면 개발에 필요한 모듈을 임폴트 합니다.import tkinter as tkfrom tkinter import ttk, messagebox# 6. 한국일보 데이터 수집 함수 2개 import urllib.requestfrom bs4 import BeautifulSoupimport time# 상세 기사 url 수집함수def hankook_detail_url(keyword, num): text1 = urllib.parse.quote(keyword) params = [ ] # 비어있는 리스트를 생성합니다. for i in range(1,num+1): list_url = "https..

※ 비교분석 데이터 시각화 실습1. 시기별 언급량 확인 (뉴진스, 아이브) _240828 일 기준 중앙일보2. 2개의 파일 합치기# 2개의 파일 합치기file1_path = 'c:\\data\\joongang_뉴진스.txt'file2_path = 'c:\\data\\joongang_아이브.txt'# 합친 파일의 경로output_file_path = 'c:\\data\\new_ive.txt'with open(file1_path,'r', encoding='utf8') as file1,\ open(file2_path,'r', encoding='utf8') as file2,\ open(output_file_path,'w', encoding='utf8') as output_file: # 첫번..