1. 등수 매기기
- 등수 매기기
rank() |
|
astype() |
|
- rank() : 데이터프레임 또는 시리즈에 순위를 매기는 함수, 기본값은 ascending
df1['브랜드순위'] = df1['브랜드평판지수'].rank()
df1
# 새로운 열이 만들어짐(파생변수)
# 원랭 있는 브랜드 평판지수를 기반으로 변형되어 데이터프레임에 새로운 colunm이 추가됨
- astype(): 특정열의 자료형 바꿔주기
# '브랜드순위' 열을 정수형으로 변환
df1['브랜드순위'] = df1['브랜드순위'].astype(int)
df1
# '브랜드순위' 열의 데이터 유형을 확인
df1['브랜드순위'].dtypes
|
2. 날짜 타입
- 날짜 타입 사용하기
to_datetime() | object타입에서 datetime 타입으로 변환 |
dt.year | 연도 만 뽑기 |
dt.month | 월 만 뽑기 |
dt.day | 일 만 뽑기 |
dt.hour | 시간 만 뽑기 |
dt.mintue | 분 만 뽑기 |
dt.second | 초 만 뽑기 |
dt.isocalendar().week | 1년준 몇번째 주를 보여주기 |
- birthday 열 object ----> datetime으로 변환
# 데이터타입 정보보기
df.info()
# colonms 상세보기
df['birthday']
# 문자열이지 날짜타입은 아님 (변경이 필요함)
# to_datetime() : object 타입에서 datetime 타입으로 변환
df['birthday'] = pd.to_datetime(df['birthday'])
df['birthday']
- 날짜 뽑기
df['birthday'].dt.year # 년도 뽑기
df['birthday'].dt.month # 월 뽑기
df['birthday'].dt.day # 일 뽑기
df['birthday'].dt.hour # 시간 뽑기
df['birthday'].dt.minute # 분 뽑기
df['birthday'].dt.second # 초 뽑기
# 요일 뽑기 : 0(월요일) ~ 6(일요일)
df['birthday'].dt.dayofweek
# 년중 몇째주인지 뽑기
df['birthday'].dt.isocalendar().week
'데이터분석 > 판다스' 카테고리의 다른 글
08. apply, map, 산술연산, 원 핫 코딩 (0) | 2024.05.24 |
---|---|
06. 데이터프레임 합치기 (0) | 2024.05.24 |
05. 그룹, 중복값제거 (0) | 2024.05.24 |
04. 행, 열 추가 삭제, 통계함수 (0) | 2024.05.24 |
03. 결측값(NULL, NaN) (0) | 2024.05.24 |