본문 바로가기

전체 글192

01. 파이토치(Pytorch) 1. 파이토치(Pytorch)* Python을 기반으로 한 오픈 소스 기계 학습 라이브러리 * 텐서플로우(Tensorflow)와 함께 머신러닝, 딥러닝에서 가장 널리 사용되는 프레임워크 * 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들어졌으나, 파이썬 기반으로 변경한 것이 Pytorch *  뉴욕대학교와 페이스북이 공동으로 개발하였고, 현재 가장 대중적이고 널리 사용됨int32)주요 특징동적 계산 그래프 (Dynamic Computation Graphs):파이토치는 동적 계산 그래프를 사용하여 계산을 수행합니다. 이는 연산 그래프를 실행 중에 변경할 수 있음을 의미하며, 복잡한 모델을 구현하거나 디버깅하기 쉽게 합니다.자동 미분 (Automatic Differentiation):파이토치의 au.. 2024. 6. 18.
12. K-평균 군집화 (KMeans) | Marketing 1. Clusters* 유사한 특성을 가진 개체들의 집합 * 고객 분류, 유전자 분석, 이미지 분할 import               import matplotlib.pyplot as plt        import numpy as np        import pandas as pd        import seaborn as sns        from sklearn.datasets import make_blobs   make_blobs 함수 : 가상 데이터를 생성               X, y = make_blobs(n_samples=100, centers=3, random_state=2024) n_samples=100은 100개의 샘플 데이터를 생성centers=3은 3개의 중심(클러스터).. 2024. 6. 17.
11. 다양한 모델 성능비교 | Air Quality UCI 1. Air Quality UCI 데이터셋  작업파일  import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt  데이터 불러오기             air_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/AirQualityUCI.csv')      air_df  정보보기             air_df.info()   필요없는 열 삭제                air_df.drop(['Unnamed: 15','Unnamed: .. 2024. 6. 17.
10. lightGBM | Credit 1.  Credit 데이터셋  작업파일  import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt    데이터 불러오기              credit_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/credit.csv')        credit_df  정보보기               credit_df.info()  필요없는 데이터 지우기                 credit_df.drop(['ID', 'Customer_I.. 2024. 6. 13.
09. 랜덤 포레스트 (Random Forest) | Hotel 1. Hotel 데이터셋   파일 가져오기         hotel_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/hotel.csv')      hotel_df     정보보기          hotel_df.info()   * hotel: 호텔 종류* is_canceled: 취소 여부* lead_time: 예약 시점으로부터 체크인 될 때까지의 기간(얼마나 미리 예약했는지)* arrival_date_year: 예약 연도* arrival_date_month: 예약 월* arrival_date_week_number: 예약 주* arrival_date_day_of_month: 예약 일* stays_in_weekend_.. 2024. 6. 12.
08. SVM, Scaling | 손글씨 1. 손글씨 데이터셋    scikit-learn 라이브러리에서 손글씨 숫자 데이터셋을 불러오기         from sklearn.datasets import load_digits    digits 변수에 load_digits() 함수의 결과를 할당           digits = load_digits()        digits      digits 데이터셋에서 사용 가능한 키(속성)들을 확인data.shape: data 배열의 형태(shape)를 확인            digits.keys()         data = digits['data']        data.shape     digits 데이터셋에서 'target' 키에 해당하는 값을 가져와 target 변수에 할당 * 'target.. 2024. 6. 12.
07. 로지스틱 회귀(Logistic Regression) | 인사자료 1. 인사자료 데이터셋   작업파일   import           import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt    데이터 가져오기               hr_df=pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/hr.csv')          hr_df.head()    정보보기                hr_df.info()     통계치보기          hr_df.describe()    고과점수에 따른 승진여부 그래프로 보기           sn.. 2024. 6. 12.
06. 의사결정 나무(Decision Tree) | 자전거 1. 자전거 데이터셋   작업파일  import           import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt     데이터 가져오기          bike_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/bike.csv')        bike_df    정보보기           bike_df.info()     평균치 보기          bike_df.describe()   count: 데이터의 개수 (결측값을 제외한 값의 개수)mean: 평균값st.. 2024. 6. 11.
05. 선형회귀(Linear Regression) | Rent 1. Rent 데이터셋 - 집월세 매물정보- 출처: 캐글 작업파일   import         import numpy as np        import pandas as pd        import seaborn as sns     파일 가져오기         rent_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/rent.csv')        rent_df    정보보기           rent_df.info()     통계량, 평균치 보기          # describe() 함수는 수치 기준으로 나온 데이터들을 테이블로 변환        rent_df.describe()    소수점 둘째 자리까지.. 2024. 6. 11.