AI/머신러닝13 [조사] 나이브 베이즈 분류기 모델 ⏺ 나이브 베이즈 분류기 나이브 베이즈 분류기|정의 나이브 베이즈 분류기는 확률론과 베이즈 정리를 기반으로 하는 간단하고 강력한 분류 알고리즘입니다.이 알고리즘은 각 feature(특징)가 독립적(서로 연관성이 없다)이라고 가정하는 "나이브"(naive)한 가정을 하여 작동합니다.즉, 특정 feature의 값이 다른 feature의 값에 영향을 받지 않는다고 간주합니다. 나이브 베이즈 분류기|특징단순성과 효율성: 계산이 간단하고 빠르며, 메모리 사용량이 적습니다.적용 분야: 텍스트 분류, 스팸 필터링, 문서 분류 등 다양한 분야에서 사용됩니다.가정의 제한: 모든 feature가 독립적이라는 가정이 현실적인 데이터에서는 자주 위배되지만, 실질적인 성능은 여전히 좋습니다. 나이브 베이즈 분류기|종류 나.. 2024. 6. 18. 12. K-평균 군집화 (KMeans) | Marketing 1. Clusters* 유사한 특성을 가진 개체들의 집합 * 고객 분류, 유전자 분석, 이미지 분할 import import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns from sklearn.datasets import make_blobs make_blobs 함수 : 가상 데이터를 생성 X, y = make_blobs(n_samples=100, centers=3, random_state=2024) n_samples=100은 100개의 샘플 데이터를 생성centers=3은 3개의 중심(클러스터).. 2024. 6. 17. 11. 다양한 모델 성능비교 | Air Quality UCI 1. Air Quality UCI 데이터셋 작업파일 import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 데이터 불러오기 air_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/AirQualityUCI.csv') air_df 정보보기 air_df.info() 필요없는 열 삭제 air_df.drop(['Unnamed: 15','Unnamed: .. 2024. 6. 17. 10. lightGBM | Credit 1. Credit 데이터셋 작업파일 import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 데이터 불러오기 credit_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/credit.csv') credit_df 정보보기 credit_df.info() 필요없는 데이터 지우기 credit_df.drop(['ID', 'Customer_I.. 2024. 6. 13. 이전 1 2 3 4 다음 LIST