목록Machine Learning/파이썬 머신러닝 완벽 가이드 (2)
dew's CSE Studying

회귀의 평가는 대부분 실제값과 예측값의 오차평균값에 기반한다. 분류의 평가는 정확도만으로는 판단할 수 없다.분류의 성능 평가 지표(이진/다중 모두 가능)정확도(Accuracy)오차 행렬(Confusion Matrix)정밀도(Precision)재현율(Recall)F1 scoreROC AUC 01 정확도(Accuracy)정확도: 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표정확도(Accuracy)=예측 결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 binary classification에서는 정확도 지표가 어떻게 ML 모델의 성능을 왜곡할까?이렇게 단순한 코드로도 수치가 나올 수 있기 때문에 적합한 평가지표가 필요하다. 정확도 평가 지표의 맹점: 무조건 특정한 결과로 찍어도 데이터 분..

01 사이킷런 소개와 특징사이킷런(scikit-learn)은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리!설치 후 버젼 확인을 해줬다 02 첫 번째 머신러닝 만들어 보기 - 붓꽃 품종 예측하기sklearn.datasets: 사이킷런에서 자체적으로 제공하는 데이터 세트를 생성하는 모듈의 모임sklearn.tree: 트리 기반 ML 알고리즘을 구현한 클래스의 모임sklearn.model_selection: 학습 데이터와 검증 데이터, 예측 데이터로 데이터를 분리하거나 최적의 hyper parameter으로 평가하기 위한 다양한 모듈의 모임사이킷런에서 사용할 모듈을 importload_iris()함수를 이용하여 붓꽃 데이터 세트를 로딩붓꽃 데이터를 dataframe으로 변환했다 학습용데이터와 ..