본문 바로가기

AI67

04. 데이터 전처리 | 타이타닉 1. 타이타닉 데이터   자료: https://bit.ly/fc-ml-titanic  import             import numpy as np          import pandas as pd    데이터 불러오기            # 데이터 불러오기          df = pd.read_csv('https://bit.ly/fc-ml-titanic')          df     데이터 전처리- 데이터 정제 작업을 뜻함 - 필요없는 데이터를 삭제하고, null이 있는 행을 처리하고, 정규화/표준화 등의 많은 작업들을 포함 - 머신러닝, 딥러닝 실무에서 전처리가 차지하는 중요도는 50% 이상을 차지한다.  @. 데이터전처리1. 종속변수와 독립변수 나누기 종속변수와 독립변수 나누기      .. 2024. 6. 10.
03. SVC, accuracy_score | 아이리스 1. 아이리스 데이터셋 - 데이터셋:특정한 작업을 위해 데이터를 관련성 있게 모아놓은 것- 아이리스 데이터셋 : 머신러닝에서 분류 알고리즘을 학습하고 평가하는 데 자주 사용되는 예제 데이터셋  사이킷런 데이터셋 사이트 : https://scikit-learn.org/stable/api/sklearn.datasets.html#module-sklearn.datasets  아이리스 데이터 찾기  아이리스 데이터 import: scikit-learn 라이브러리에서 load_iris 함수를 불러오기         from sklearn.datasets import load_iris      load_iris 함수를 사용하여 아이리스 붓꽃 데이터셋을 로드한 후, 이를 iris 변수에 저장           iris.. 2024. 6. 10.
02. 사이킷런 (Scikit-learn) | LinearSVC 1. 사이킷런(Scikit-learn)   대표적인 파이썬 머신러닝 모듈다양한 머신러닝 알고리즘을 제공다양한 샘플 데이터를 제공머신러닝 결과를 검증하는 기능을 제공BSD 라이선스이기 때문에 무료로 사용 및 배포가 가능공식 홈페이지: https://scikit-learn.org scikit-learn: machine learning in Python — scikit-learn 0.16.1 documentation scikit-learn.org   2. Linear SVC -  클래스를 구분으로 하는 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘  - 지도학습 알고리즘을 사용하는 학습 전용 데이터와 결과 전용 데이터를 모두 가지고 있어야 사용이 가능  사용하기         .. 2024. 6. 10.
01. 머신러닝 | 데이터 사이트 1. 머신러닝(Machine Learning)    인공지능: 인공(Artificial) + 지능(Intelligence)     - 1956: 인간의 지능을 복제하거나 능가할 수 있는 지능형 기계를 만들고자 하는 컴퓨터 과학 분야개발자에 의한 인공지능, 데이터에 의한 인공지능머신러닝: 데이터를 기반으로 한 한습(learning)하는 기계(machine)     - 1997: 기계가 기존 데이터에서 학습하고 해당 데이터를 개선하여 의사 결정 또는 예측을 할 수 있도록 하는 AI의 하위 집합딥러닝 : 깊은(deep) 신경망 구조의 머신러닝     - 2017: 신경망 레이어를 사용하여 데이터를 처리하고 결정을 내리는 기계 학습 기술Generative AI     - 2021: 프롬프트나 기존 데이터를 기반.. 2024. 6. 10.