넘파이6 07. 로지스틱 회귀(Logistic Regression) | 인사자료 1. 인사자료 데이터셋 작업파일 import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 데이터 가져오기 hr_df=pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/hr.csv') hr_df.head() 정보보기 hr_df.info() 통계치보기 hr_df.describe() 고과점수에 따른 승진여부 그래프로 보기 sn.. 2024. 6. 12. 06. 의사결정 나무(Decision Tree) | 자전거 1. 자전거 데이터셋 작업파일 import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 데이터 가져오기 bike_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/bike.csv') bike_df 정보보기 bike_df.info() 평균치 보기 bike_df.describe() count: 데이터의 개수 (결측값을 제외한 값의 개수)mean: 평균값st.. 2024. 6. 11. 05. 선형회귀(Linear Regression) | Rent 1. Rent 데이터셋 - 집월세 매물정보- 출처: 캐글 작업파일 import import numpy as np import pandas as pd import seaborn as sns 파일 가져오기 rent_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/rent.csv') rent_df 정보보기 rent_df.info() 통계량, 평균치 보기 # describe() 함수는 수치 기준으로 나온 데이터들을 테이블로 변환 rent_df.describe() 소수점 둘째 자리까지.. 2024. 6. 11. 04. 데이터 전처리 | 타이타닉 1. 타이타닉 데이터 자료: https://bit.ly/fc-ml-titanic import import numpy as np import pandas as pd 데이터 불러오기 # 데이터 불러오기 df = pd.read_csv('https://bit.ly/fc-ml-titanic') df 데이터 전처리- 데이터 정제 작업을 뜻함 - 필요없는 데이터를 삭제하고, null이 있는 행을 처리하고, 정규화/표준화 등의 많은 작업들을 포함 - 머신러닝, 딥러닝 실무에서 전처리가 차지하는 중요도는 50% 이상을 차지한다. @. 데이터전처리1. 종속변수와 독립변수 나누기 종속변수와 독립변수 나누기 .. 2024. 6. 10. 02. 행렬연산 1. 행렬 연산넘파이에서는 다차원 배열인 ndarray를 사용하여 행렬 연산을 수행할 수 있다(덧셈, 뺄셈, 곱셈, 나눗셈은 shape이 같아야 함/행렬의 크기가 같아야 함)행렬 연산은 선형 대수와 관련이 깊어, 데이터 과학, 머신러닝, 통계 등 다양한 분야에서 사용 차원출력 ($행 ,$열) a = np.array([[1, 2, 3], [2, 3, 4]]) b = np.array([[3, 4, 5], [1, 2, 3]]) print(a.shape, b.shape) 행열 덧셈 # 행렬 덧셈 print(a + b).. 2024. 5. 22. 01. 넘파이(Numpy) 넘파이(Numpy) 넘파이(Numpy)는 파이썬에서 사용되는 과학 및 수학 연산을 위한 강력한 라이브러리주로 다차원 배열을 다루는 데에 특화되어 있어, 데이터 분석, 머신러닝, 과학 계산 등 다양한 분야에서 널리 사용넘파이 배열은 C 언어로 구현되어 있어 연산이 빠르고 효율적넘파이 배열은 특히 큰 데이터셋에서 수치 연산을 수행할 때 뛰어난 성능을 보입또한 메모리 사용을 최적화하고 효율적으로 관리합니다 설치 ! pip install numpy import import numpy as np #별칭 사용 1. ndarray ( n-dimensional array)다차원 배열 ndarray 은 생성 될 때 크기와 자료형이 결정된다. (다만, 자료형은 동일해야 함)다차원.. 2024. 5. 22. 이전 1 다음