'빅데이터 분석(with 아이티윌)/python' 카테고리의 글 목록 (2 Page)

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

[빅데이터분석] Python_52. 판다스 머신러닝2 (의사결정트리, 랜덤 포레스트)

분류from sklearn.neural_network import MLPRegressor수치예측from sklearn .neural_network import MLPClassfier-> 분류모델: knn, 나이브베이즈, 의사결정트리, 랜덤포레스트, 신경망, 서포트 백터# 랜덤포레스트 모델 생성 (시험장에갈때 꼭 외워가야하는 코드)# 진행순서#1. 데이터 로드import pandas as pdiris = pd.read_csv("c:\\data\\iris2.csv")iris.head()#2. 결측치 확인iris.isnull().sum()#3. 종속변수와 독립변수 분리x = iris.iloc[ : , :4 ]y = iris.iloc[ : , 4 ]#4. 데이터 정규화from sklearn.preproce..

빅데이터 분석(with 아이티윌)/python 2024. 9. 5. 13:43

[빅데이터분석] Python_51. 판다스 머신러닝1 (나이브베이즈 분류모델)

빅분기 시험에서 머신러닝은 랜덤포레스트와 다중회귀면 됨인공지능 — 머신러닝 — 딥러닝 데이터 분석통계 데이터 분석 (가설검정)기계학습 데이터 분석 (분류,회귀) 분류회귀knn, 나이브 베이즈, 의사결정트리, 서포트 벡터 머신, 신경망단순회귀, 다중회귀 머신러닝1. 분류: knn, 나이브베이즈, 의사결정트리, 서포트 백터머신, 신경망, 로지스틱 회귀 , 랜덤 포레스트 2. 회귀: 단순회귀, 다중회귀, 랜덤 포레스트숫자 --> knn문자 --> naivebayes 데이터 분석가 데이터 사이언티스트 데이터 엔지니어 딥러닝 개발자 데이터 검색 및 시각화 , 현상분석 , 통계분석( porduct / 금융 / 마케팅 (노코딩, 코딩))데이터 분석가의 업무 + 머신러닝데이터..

빅데이터 분석(with 아이티윌)/python 2024. 9. 5. 11:14

[빅데이터분석] Python_50. 판다스 기본문법3 (1 유형) - 서브쿼리

예제1. 아래의 SQL을 판다스로 구현하시오 1) SQLselect ename, sal from emp where sal > ( select sal from emp where ename='JONES' ); 2) pythonjones_sal = emp['sal'][ emp.ename=='JONES'].values[0]emp[['ename', 'sal']] [ emp.sal > jones_sal ] 예제2. 위의 결과를 loc 함수를 이용해서 검색하시오,jones_sal = emp.loc..

빅데이터 분석(with 아이티윌)/python 2024. 9. 3. 16:30

[빅데이터분석] Python_49. 판다스 기본문법2 (1 유형)

* SQL 의 조인을 판다스로 구현하기 SQL vs 판다스equi joinpd.merge 함수non equi join outer join self join 문제1. dept.csv 를 dept 데이터 프레임으로 구성하시오 import pandas as pd emp = pd.read_csv('c:\\data\\emp.csv')dept = pd.read_csv('c:\\data\\dept.csv')문제2. 아래의 sql을 판다스로 구현하시오. (join)1) SQLselect e.ename, d.loc from emp e, dept d where e.deptno = d.deptno2) pythonemp_dept = pd.merge(emp, dept, on ='deptno..

빅데이터 분석(with 아이티윌)/python 2024. 9. 3. 14:51

[빅데이터분석] Python_48. 판다스 기본 문법 1 (2 유형)

■ 복습문제 문제1. 아래의 sql을 판다스로 구현하기 1) SQLselect sum(sal) from emp where deptno = 20; 2) pythonimport pandas as pdemp = pd.read_csv("c://data500//emp.csv")#empresult = emp['sal'][emp['deptno'] == 20]print(result.sum()) ### 결과 : 10875시리즈 = 컬럼문법 : emp[컬럼명 리스트][검색조건]문제2. 1)SQLselect deptno,sum(sal) from emp group by deptno; 2)pythonemp.groupby('deptno')['sal'].sum().reset_index()result = emp...

빅데이터 분석(with 아이티윌)/python 2024. 9. 3. 11:41

[빅데이터분석] Python_47. 판다스 기본 문법 1 (1 유형)

판다스(pandas) 란?테이블 형태의 데이터를 파이썬에서 검색하기 편하도록 만들어놓은 파이썬 모듈 ※ 장점 1. 배우기가 쉽다.2. 시각화 기능이 있다.3. 데이터 검색과 통계함수들이 내장되어있다.4. 머신러닝 기능들 이 내장되어 있다. 문제1.c:\\data500 폴더를 만들고 emp.csv를 폴더에 넣으시오.문제2. pandas를 이용하지 않고 emp.csv에서 모든 컬럼을 출력하시오. import csvfile_path = 'c:\\data500\\emp.csv'with open(file_path, mode='r', encoding='utf-8') as file: csv_reader = csv.reader(file) header = next(csv_r..

빅데이터 분석(with 아이티윌)/python 2024. 8. 29. 16:36

[빅데이터분석] Python_46. 크몽 디지털 화면 개발

※ 실습. 화면 개발하기 1탄 (국내 신문사)# 화면 개발에 필요한 모듈을 임폴트 합니다.import tkinter as tkfrom tkinter import ttk, messagebox# 6. 한국일보 데이터 수집 함수 2개 import urllib.requestfrom bs4 import BeautifulSoupimport time# 상세 기사 url 수집함수def hankook_detail_url(keyword, num): text1 = urllib.parse.quote(keyword) params = [ ] # 비어있는 리스트를 생성합니다. for i in range(1,num+1): list_url = "https..

빅데이터 분석(with 아이티윌)/python 2024. 8. 28. 16:40

[빅데이터분석] Python_45. 데이터 시각화 4. (비교분석)

※ 비교분석 데이터 시각화 실습1. 시기별 언급량 확인 (뉴진스, 아이브) _240828 일 기준 중앙일보2. 2개의 파일 합치기# 2개의 파일 합치기file1_path = 'c:\\data\\joongang_뉴진스.txt'file2_path = 'c:\\data\\joongang_아이브.txt'# 합친 파일의 경로output_file_path = 'c:\\data\\new_ive.txt'with open(file1_path,'r', encoding='utf8') as file1,\ open(file2_path,'r', encoding='utf8') as file2,\ open(output_file_path,'w', encoding='utf8') as output_file: # 첫번..

빅데이터 분석(with 아이티윌)/python 2024. 8. 28. 14:21

ch0nny_log

목록빅데이터 분석(with 아이티윌)/python (59)

ch0nny_log

티스토리툴바