본문 바로가기

데이터분석20

06. 데이터프레임 합치기 1. 데이터프레임 합치기   데이터프레임 합치기concat()데이터를 합침sort=False 옵션으로 순서가 유지되도록 함axis=0는 기본값axis=1인 경우, 같은 index 결합reset_index()index를 새롭게 적용drop=True 옵션으로 기존 index를 삭제merge()특정 고유한 키(unique, id)값을 기준으로 합침  새로운 CSV 파일 다운 (결합할 데이터)   데이터 불러오고 복사           df1 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/idol.csv')         df2 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분서.. 2024. 5. 24.
05. 그룹, 중복값제거 1. 그룹으로 묶기   그룹으로 묶기group by데이터를 그룹으로 묶어 분석할 때 사용              # DataFrame을 'group' 열로 그룹화          df.groupby('group')           # DataFrame을 'group' 열로 그룹화하고, 각 그룹의 각 열에 대해 NA/결측값이 아닌 항목의 수          df.groupby('group').count()           # DataFrame을 'group' 열로 그룹화하고, 각 그룹의 숫자형 열에 대해 평균을 계산          df.groupby('group').mean(numeric_only=True)           # DataFrame을 'group' 열로 그룹화하고, 각 그룹의 숫자형 열.. 2024. 5. 24.
04. 행, 열 추가 삭제, 통계함수 1. 행, 열 추가 및 삭제하기행을 추가 할떄는 dict 형태를 만들고 append함수를 사용하여 데이터 추가ignore_index=True옵션을 추가해야 에러가 발생하지 않음 행 추가           # 추가할 행 딕셔너리 생성           dic = {                'name' : '김사과',                'group' : '과수원',                'company' : '애플',                'gender' : '여자',                'birthday' : '2000-01-01',                'height' : 160,                'blood' : 'A',                'bra.. 2024. 5. 24.
03. 결측값(NULL, NaN) 1. 결측값(NULL, NaN)비어 있는 값. 즉, 결측값이라고 부름pandas에서는 NaN(Not a Number)로 표기 된 것은 모두 결측값으로 취급 결측값 확인하기         # 원래 테이블 확인       df         # 비어있는 값 확인(비어있는 값 = true) _ Boolean  값은 뜨지 않음        df.isnull()        df.isna()   '키'열에서 null 값인 행 찾기           df['height'].isna()         df[df['height'].isna()]         df[df['height'].isna()]['name']         df[df['height'].notnull()]     문제: 회사가 있는 연예인의 이름,.. 2024. 5. 24.
LIST