본문 바로가기

AI/머신러닝13

[조사] 나이브 베이즈 분류기 모델 ⏺ 나이브 베이즈 분류기   나이브 베이즈 분류기|정의 나이브 베이즈 분류기는 확률론과 베이즈 정리를 기반으로 하는 간단하고 강력한 분류 알고리즘입니다.이 알고리즘은 각 feature(특징)가 독립적(서로 연관성이 없다)이라고 가정하는 "나이브"(naive)한 가정을 하여 작동합니다.즉, 특정 feature의 값이 다른 feature의 값에 영향을 받지 않는다고 간주합니다.  나이브 베이즈 분류기|특징단순성과 효율성: 계산이 간단하고 빠르며, 메모리 사용량이 적습니다.적용 분야: 텍스트 분류, 스팸 필터링, 문서 분류 등 다양한 분야에서 사용됩니다.가정의 제한: 모든 feature가 독립적이라는 가정이 현실적인 데이터에서는 자주 위배되지만, 실질적인 성능은 여전히 좋습니다. 나이브 베이즈 분류기|종류 나.. 2024. 6. 18.
12. K-평균 군집화 (KMeans) | Marketing 1. Clusters* 유사한 특성을 가진 개체들의 집합 * 고객 분류, 유전자 분석, 이미지 분할 import               import matplotlib.pyplot as plt        import numpy as np        import pandas as pd        import seaborn as sns        from sklearn.datasets import make_blobs   make_blobs 함수 : 가상 데이터를 생성               X, y = make_blobs(n_samples=100, centers=3, random_state=2024) n_samples=100은 100개의 샘플 데이터를 생성centers=3은 3개의 중심(클러스터).. 2024. 6. 17.
11. 다양한 모델 성능비교 | Air Quality UCI 1. Air Quality UCI 데이터셋  작업파일  import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt  데이터 불러오기             air_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/AirQualityUCI.csv')      air_df  정보보기             air_df.info()   필요없는 열 삭제                air_df.drop(['Unnamed: 15','Unnamed: .. 2024. 6. 17.
10. lightGBM | Credit 1.  Credit 데이터셋  작업파일  import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt    데이터 불러오기              credit_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/credit.csv')        credit_df  정보보기               credit_df.info()  필요없는 데이터 지우기                 credit_df.drop(['ID', 'Customer_I.. 2024. 6. 13.
LIST