본문 바로가기

전체 글192

파이썬 비동기 1. 동기(Synchronous)- 작업이 순차적으로 실행되는 것 - 하나의 작업이 끝나기 전에는 다음 작업을 시작하지 않음 동기 원리             def func1():              print('1')              print('2')              print('3')          def main():              func1()           main()     1 2 3  시간차를 두었을 때            # main 함수는 smile 함수가 종료될 때까지 기다림        # smile 함수가 종료되기 전에 main 함수에서 더 처리해야 할 일이 있다면? --> 비동기        import time          def smile(.. 2024. 6. 3.
데이터베이스와 MongoDB 연결 1. 데이터베이스와 MongoDB 연결   * MongoDB 새로운 Project 만들기더보기        설치하기             #MongoDB와 연결하기 위한 드라이버 모듈을 설치(설치 후 "세션 다시 시작 및 모두 실행")          !python -m pip install "pymongo[srv]"==3.11  런타임 다시 실행  import            from pymongo import MongoClient    MongoDB와 연결하기             url = 'mongodb+srv://leesarah721:9mTiuY6G1vsxBg4A@cluster0.s6fyzfr.mongodb.net/?retryWrites=true&w=majority&appName=Cluste.. 2024. 6. 3.
04. 데이터분석3 : 전국 도시공원 데이터 1. 전국 도시공원 데이터   import                 import pandas as pd        import numpy as np        import matplotlib.pyplot as plt        import seaborn as sns    파일을 인코딩하면서 가져오기           park=pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/전국도시공원표준데이터.csv' encoding='ms949')        park.head()    'park' 데이터프레임 : 행과 열 갯수 확인             park.shape     한글 폰트 넣기        .. 2024. 5. 28.
03. 데이터분석2 : 상권별 업종 밀집 통계 데이터 1. 상권별 업종 밀집 통계 데이터   import               import pandas as pd            import numpy as np            import matplotlib.pyplot as plt     오늘의 작업파일 불러오기           shop = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/shop_201806_01.csv')          shop     생략된 데이터 40개 열까지 모두보기               pd.set_option('display.max_columns',40)            shop.head()    표 확인하기            sh.. 2024. 5. 28.
02. 데이터분석1 : 가상 온라인 쇼핑몰 데이터 활용 1. 가상 온라인 쇼핑몰 데이터 활용   파일다운로드 확인 판다스 import                import pandas as pd      파일 가져오기            retail = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/OnlineRetail.csv')          retail     정보보기            retail.info()             ### 컬럼          * InvoiceNo : 주문번호          * StockCode : 상품코드          * Description : 상품설명          * Quantity : 주문수량          * Invoice.. 2024. 5. 27.
01. Matplotlib 1. Matplotlib 파이썬 기반 시각화 라이브러리한글에 대한 지워이 완벽하지 않음pandas와 연동이 용이함 [Matplotlib 공식 홈페이지] : https://matplotlib.org  설치                !  pip install matplotlib      import            import  matplotlib.pyplot  as plt  #별칭 사용      # MATLAB과 비슷하게 명령어 스타일로 동장하는 함수들의 모음   예시            # 리스트의 값들은 y값들이며, X값은 자동으로 만들어줌          plt.plot([1,2,3,4])          plt.show()                 # X값 [1,2,3,4]        #.. 2024. 5. 27.
08. apply, map, 산술연산, 원 핫 코딩 1. apply 사용하기 Series나 DataFrame에 구체적인 로직을 적용하고 싶을때 사용apply를 적용하기 위해 별도의 함숙가 먼저 정의되야 함작성된 함수를 apply에 매개변수로 전달함 데이터 확인            df.head()    문자열의 성별정보를 숫자로 변환하기             # 성별이 남자는 1, 여자는 0으로 변환(loc를 사용)          df.loc[df['gender'] == '남자', 'gender'] = 1          df.loc[df['gender'] == '여자', 'gender'] = 0           df.head()  데이터 다시 담기             df = pd.read_csv('/content/drive/MyDrive/1. K.. 2024. 5. 24.
07. 등수, 날짜타입 1. 등수 매기기   등수 매기기rank()데이터프레임 또는 시리즈에 순위를 매기는 함수기본값은 ascendingastype()특정열의 자료형을 변경 rank() : 데이터프레임 또는 시리즈에 순위를 매기는 함수, 기본값은 ascending            df1['브랜드순위'] = df1['브랜드평판지수'].rank()        df1        # 새로운 열이 만들어짐(파생변수)        # 원랭 있는 브랜드 평판지수를 기반으로 변형되어 데이터프레임에 새로운 colunm이 추가됨   더보기 astype(): 특정열의 자료형 바꿔주기              # '브랜드순위' 열을 정수형으로 변환        df1['브랜드순위'] = df1['브랜드순위'].astype(int)       .. 2024. 5. 24.
06. 데이터프레임 합치기 1. 데이터프레임 합치기   데이터프레임 합치기concat()데이터를 합침sort=False 옵션으로 순서가 유지되도록 함axis=0는 기본값axis=1인 경우, 같은 index 결합reset_index()index를 새롭게 적용drop=True 옵션으로 기존 index를 삭제merge()특정 고유한 키(unique, id)값을 기준으로 합침  새로운 CSV 파일 다운 (결합할 데이터)   데이터 불러오고 복사           df1 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분석/데이터/idol.csv')         df2 = pd.read_csv('/content/drive/MyDrive/1. KDT/5. 데이터 분서.. 2024. 5. 24.