Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 회귀분석 알고리즘
- merge
- 데이터분석
- 회귀분석
- if문 작성법
- 단순회귀 분석
- sqld
- Intersect
- 그래프시각화
- 정보획득량
- 상관관계
- 그래프 생성 문법
- 빅데이터
- max
- 데이터분석가
- 빅데이터분석
- difftime
- 히스토그램 그리기
- 순위출력
- Dense_Rank
- count
- %in%
- loop 문
- 막대그래프
- 불순도제거
- Sum
- 팀스파르타
- sql
- 총과 카드만들기
- 여러 데이터 검색
Archives
- Today
- Total
ch0nny_log
[빅데이터분석] Python_52. 판다스 머신러닝2 (의사결정트리, 랜덤 포레스트) 본문
분류 | from sklearn.neural_network import MLPRegressor |
수치예측 | from sklearn .neural_network import MLPClassfier |
-> 분류모델: knn, 나이브베이즈, 의사결정트리, 랜덤포레스트, 신경망, 서포트 백터
# 랜덤포레스트 모델 생성 (시험장에갈때 꼭 외워가야하는 코드)
# 진행순서
#1. 데이터 로드
import pandas as pd
iris = pd.read_csv("c:\\data\\iris2.csv")
iris.head()
#2. 결측치 확인
iris.isnull().sum()
#3. 종속변수와 독립변수 분리
x = iris.iloc[ : , :4 ]
y = iris.iloc[ : , 4 ]
#4. 데이터 정규화
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(x)
x_scaled = scaler.transform(x)
#5. 훈련 데이터와 테스트 데이터로 분리 ( 훈련과 테스트 9:1 )
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x_scaled, y, test_size=0.1, random_state=1)
#6. 랜덤 포레스트 모델 생성
# print(help('sklearn.ensemble')) <-- 이것을 외워가세요 !
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier( n_estimators=5, random_state=3)
#설명 : n_estimators 로 의사결정 나무의 갯수 지정
#7. 모델 훈련
model.fit(x_train, y_train)
#8. 모델 예측
result = model.predict(x_test)
#9. 모델 평가
#from sklearn.metrics import accuracy_score
#accuracy_score( y_test, result )
sum( y_test == result )/ len(y_test) * 100
✨ 와인의 품질을 분류하는 인공신경망 만들기
#1. 데이터 로드
import pandas as pd
wine = pd.read_csv('c:\\data\\wine2.csv')
wine.head()
#2. 결측치 확인
wine.isnull().sum()
#3. 독립변수와 종속변수 분리
x = wine.iloc[ : , 1: ] # 독립변수
y = wine.iloc[ : , 0 ] # 종속변수
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(x)
x2 = scaler.transform(x)
x2
#4. 훈련과 테스트 분리 (9:1)
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split( x2, y, test_size=0.1,\
random_state=1)
# print(x_train.shape) # (159, 13)
# print(x_test.shape ) # (18, 13)
# print(y_train.shape) # (159,)
# print(y_test.shape) # (18,)
#5. 모델 생성
from sklearn.neural_network import MLPClassifier
model = MLPClassifier(random_state =1)
#6. 모델 훈련
model.fit(x_train, y_train)
#7. 모델 예측
result = model.predict(x_test)
result
#8. 모델 평가
sum(result == y_test) / len(y_test) * 100
문제. iris2.csv 의 아이리스 꽃의 품종을 분류하는 인공신경망 모델을생성하고 정확도를 확인하시오 !
#1. 데이터 로드
import pandas as pd
wine = pd.read_csv("c:\\data\\iris2.csv")
#wine.head()
#2. 결측치 확인
iris.isnull().sum()
#3. 정규화 작업
# 독립변수와 종속변수 분리
x = iris.iloc[ : , :4 ] # 독립변수
y = iris.iloc[ : , 4 ] # 종속변수
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(x)
x2 = scaler.transform(x)
x2
#4. 훈련과 테스트 분리 (9:1)
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split( x2, y, test_size=0.1,\
random_state=1)
# print(x_train.shape) # (159, 13)
# print(x_test.shape ) # (18, 13)
# print(y_train.shape) # (159,)
# print(y_test.shape) # (18,)
#5. 모델 생성
from sklearn.neural_network import MLPClassifier
model = MLPClassifier(hidden_layer_sizes =(100,200),random_state=1)
#6. 모델 훈련
model.fit(x_train, y_train)
#7. 모델 예측
result = model.predict(x_test)
result
#8. 모델 평가
sum(result == y_test) / len(y_test) * 100
'빅데이터 분석(with 아이티윌) > python' 카테고리의 다른 글
[빅데이터분석] Python_54. 판다스 머신러닝4. (단순회귀, 신경망 수치예측) (1) | 2024.09.06 |
---|---|
[빅데이터분석] Python_53. 판다스 머신러닝3 (로지스트 회귀, SVC,다중회귀분석 모델 ) (0) | 2024.09.05 |
[빅데이터분석] Python_51. 판다스 머신러닝1 (나이브베이즈 분류모델) (4) | 2024.09.05 |
[빅데이터분석] Python_50. 판다스 기본문법3 (1 유형) - 서브쿼리 (0) | 2024.09.03 |
[빅데이터분석] Python_49. 판다스 기본문법2 (1 유형) (0) | 2024.09.03 |