데이터분석20 06. 데이터분석5 : 떡볶이 프렌차이즈의 입점전략 1. 떡볶이 프렌차이즈의 입점전략 import import pandas as pd @ 작업파일 불러오기 df = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv') df 데이터 프레임 정보보기 df.info() 파리바게트 데이터 필터링 shop = ['엽기떡볶이','죠스떡볶이','신전떡볶이','청년다방','감탄떡볶이'] # 파리바게트 데이터 필터링 # contains() : 특정 문자열 .. 2024. 6. 3. 05. 데이터분석4 : 서울시 따릉이 API 데이터 활용 1. 따릉이 API 데이터 확인 : https://www.bikeseoul.com/app/station/getStationRealtimeStatus.do더보기 import import requests import folium import json import pandas as pd import warnings warnings.filterwarnings('ignore') 데이터 요청하기 targetSite = 'https://www.bikeseoul.com/app/station/getStationRealtimeStatus.do' request = requests.post(targetS.. 2024. 6. 3. 04. 데이터분석3 : 전국 도시공원 데이터 1. 전국 도시공원 데이터 import import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns 파일을 인코딩하면서 가져오기 park=pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/전국도시공원표준데이터.csv' encoding='ms949') park.head() 'park' 데이터프레임 : 행과 열 갯수 확인 park.shape 한글 폰트 넣기 .. 2024. 5. 28. 03. 데이터분석2 : 상권별 업종 밀집 통계 데이터 1. 상권별 업종 밀집 통계 데이터 import import pandas as pd import numpy as np import matplotlib.pyplot as plt 오늘의 작업파일 불러오기 shop = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/shop_201806_01.csv') shop 생략된 데이터 40개 열까지 모두보기 pd.set_option('display.max_columns',40) shop.head() 표 확인하기 sh.. 2024. 5. 28. 02. 데이터분석1 : 가상 온라인 쇼핑몰 데이터 활용 1. 가상 온라인 쇼핑몰 데이터 활용 파일다운로드 확인 판다스 import import pandas as pd 파일 가져오기 retail = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/OnlineRetail.csv') retail 정보보기 retail.info() ### 컬럼 * InvoiceNo : 주문번호 * StockCode : 상품코드 * Description : 상품설명 * Quantity : 주문수량 * Invoice.. 2024. 5. 27. 01. Matplotlib 1. Matplotlib 파이썬 기반 시각화 라이브러리한글에 대한 지워이 완벽하지 않음pandas와 연동이 용이함 [Matplotlib 공식 홈페이지] : https://matplotlib.org 설치 ! pip install matplotlib import import matplotlib.pyplot as plt #별칭 사용 # MATLAB과 비슷하게 명령어 스타일로 동장하는 함수들의 모음 예시 # 리스트의 값들은 y값들이며, X값은 자동으로 만들어줌 plt.plot([1,2,3,4]) plt.show() # X값 [1,2,3,4] #.. 2024. 5. 27. 08. apply, map, 산술연산, 원 핫 코딩 1. apply 사용하기 Series나 DataFrame에 구체적인 로직을 적용하고 싶을때 사용apply를 적용하기 위해 별도의 함숙가 먼저 정의되야 함작성된 함수를 apply에 매개변수로 전달함 데이터 확인 df.head() 문자열의 성별정보를 숫자로 변환하기 # 성별이 남자는 1, 여자는 0으로 변환(loc를 사용) df.loc[df['gender'] == '남자', 'gender'] = 1 df.loc[df['gender'] == '여자', 'gender'] = 0 df.head() 데이터 다시 담기 df = pd.read_csv('/content/drive/MyDrive/1. K.. 2024. 5. 24. 07. 등수, 날짜타입 1. 등수 매기기 등수 매기기rank()데이터프레임 또는 시리즈에 순위를 매기는 함수기본값은 ascendingastype()특정열의 자료형을 변경 rank() : 데이터프레임 또는 시리즈에 순위를 매기는 함수, 기본값은 ascending df1['브랜드순위'] = df1['브랜드평판지수'].rank() df1 # 새로운 열이 만들어짐(파생변수) # 원랭 있는 브랜드 평판지수를 기반으로 변형되어 데이터프레임에 새로운 colunm이 추가됨 더보기 astype(): 특정열의 자료형 바꿔주기 # '브랜드순위' 열을 정수형으로 변환 df1['브랜드순위'] = df1['브랜드순위'].astype(int) .. 2024. 5. 24. 06. 데이터프레임 합치기 1. 데이터프레임 합치기 데이터프레임 합치기concat()데이터를 합침sort=False 옵션으로 순서가 유지되도록 함axis=0는 기본값axis=1인 경우, 같은 index 결합reset_index()index를 새롭게 적용drop=True 옵션으로 기존 index를 삭제merge()특정 고유한 키(unique, id)값을 기준으로 합침 새로운 CSV 파일 다운 (결합할 데이터) 데이터 불러오고 복사 df1 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/idol.csv') df2 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분서.. 2024. 5. 24. 이전 1 2 3 다음