본문 바로가기

AI67

16. YOLO v8를 활용한 안전모 탐지 🟠. 안전모 데이터셋을 가지고 안전모 탐지하기  데이터셋더보기  ◼ ultralytics 설치            ! pip install ultralytics   ◼ import               import os        import random        import shutil        import yaml        import cv2        import glob        import ultralytics        import matplotlib.pyplot as plt        import xml.etree.ElementTree as ET        from ultralytics import YOLO        from torchvision import .. 2024. 8. 8.
15. YOLO v8을 이용한 폐질환 분류 🟠. 폐암데이터 세트를 가지고  yolo v8 을 통해 암환자 찾기 데이터셋: https://www.kaggle.com/datasets/hamdallak/the-iqothnccd-lung-cancer-dataset The IQ-OTH/NCCD lung cancer datasetLung Cancer CT Scans from Iraqi hospitals: Normal, Benign, and Malignant Caseswww.kaggle.com 더보기  ◼ import                import os        import random        import shutil        import cv2        import glob        import yaml        impor.. 2024. 8. 7.
14. YOLO | 객체탐지 1. YOLO이미지 분류, 객체 탐지, 인스턴스 분할 작업에 사용할 수 있는 모델 이미지 분류, 객체 탐지, 인스턴스 분할 작업에 사용할 수 있는 모델YOLO는 2015년 Joseph Redmond가 처음 출시한 이후 컴퓨터 비전 커뮤니티에 의해 성장초기버전(1~4)에서의 YOLO는 Redmon가 작성한 커스텀 딥러닝 프레임워크인 Darknet에서 유지YOLOv3 레포를 PyTorch로 작성하여 Ultralytics에서 YOLOv5를 출시유연한 Python 구조 덕분에 YOLOv5는 SOTA 레포가 되었음Ultralytics는 2023년 1월에 YOLOv8을 출시아키텍쳐: https://docs.ultralytics.com/ko/yolov5/tutorials/architecture_description/.. 2024. 8. 6.
@. 과제 1. Faster R-CNNhttps://arxiv.org/abs/1506.01497  2. SSD (Single Shot MultiBox Detectorhttps://arxiv.org/pdf/1506.02640 https://arxiv.org/pdf/1512.02325    3. YOLO (You only Look Once 1)https://arxiv.org/pdf/1506.02640   4. U-Nethttps://arxiv.org/abs/1505.04597 2024. 8. 5.
13. Faster R-CNN | 객체 탐지 1. 객체 탐지 (Object Detection)- 컴퓨터 비전과 이미지 처리와 관련된 컴퓨터 비전 기술로써, 디지털 이미지와 비디오로 특정한 계열의 시맨틱 객체 인스턴스를 감지하는 일 - 얼굴 검출, 보행자 검출 등이 포함 데이터확인더보기   🟠.  컴퓨터 비전의 Task 비교Image Classification: 이미지에 있는 객체 범주 목록 생성Single-Object Localization: 이미지에 있는 개체 범주의 한 인스턴스의 위치와 배율을 나타내는 Bounding Box를 생성Object Detection: 각 개체 범주의 모든 인스턴스의 위치와 배율을 나타내는 경계 상자와 함께 이미지에 이쓴 개체 목록을 생성참고 사이트 : https://oniss.tistory.com/39  ◼  모듈.. 2024. 7. 25.
12. VGG19 | 분류 1. 분류 ( Classification )* 분류는 기계 학습과 통계학에서 시스템이 일련의 특성을 기반으로 미리 정의된 여러 범주 또는 클래스 중 하나에 주어진 입력을 할당하도록 훈련되는 과정 * 입력 기능과 클래스 레이블 사이의 학습된 관계를 기반으로 샘플의 클래스 레이블을 예측하는 것 1. Binary Classification    * 이진 분류: 데이터 요소를 두 클래스 중 하나로 분류     * 질병 vs 질병이 아님2. Multiclass Classification    * 다중 클래스 분류: 데이터 요소를 여러 클래스 중 하나로 분류     * 고양이, 강아지, 코끼리 ...3. Multi-label Classification    * 다중 레이블 분류 : 단일 데이터 요소가 여러 클래스에.. 2024. 7. 24.
11. OCR 1. OCR(Optical Character Recognition)- 광학 문자 인식 - 영상나 문서에서 텍스트를 자동으로 인식하고 컴퓨터가 이행할 수 있는 텍스트 데이터로 변환하는 프로세스 - Tesseract, EasyOCR, PaddleOCR, CLOVA OCR(네이버 API), Cloud Vision(구글 API).. ◼ 테서렉트(Tesseract)- 오픈 소스 OCR 라이브러리로 구글에서 개발하고 현재는 여러 커뮤니티에 의해 유지보수- 사이트: https://github.com/UB-Mannheim/tesseract/wiki HomeTesseract Open Source OCR Engine (main repository) - UB-Mannheim/tesseractgithub.com- 설치방법더보.. 2024. 7. 23.
10. 레이블링 1. 레이블링- 이진화, 모폴로지를 수행하면 객체와 배경 영역을 구분할 수 있게됨- 객체 단위 분석을 통해 각 객체를 분할하여 특징을 분석하고 객체의 위치, 크기 정보, 모양 분석, ROI 추출등이 가능함- 서로 연결되어 이쓴 객체 픽셀에 고유번호를 할당하여 영역 기반 모양분석, 레이블맵, 바운딩 박스 픽셀 개수, 무게 중심, 좌표 등을 반환할 수 있게 함 ◼ 레이블링                 cv2.connectedComponents(영상, 레이블맵)          레이블맵: 픽셀 연결 관계(4방향 연결, 8방향 연결)          return: 객체 객수, 레이블 맵 행렬    ◼ 예제: 문자 잡아내기             import cv2      img = cv2.imread('./ke.. 2024. 7. 23.
09. 모폴로지 변환 1. 모폴로지 변환영상의 밝은 영역이나 어두운 영역을 축소 또는 확대 하는 기법 ◼ 모폴로지 처리             cv2.getStructuringElement(구조 요소의 모양, 사이즈)   [ 구조 영상의 모양 ]    1. 직사각형(cv2.MORPH_RECT)     - 가장 단순한 형태로, 모든 요소가 같은 값을 가지는 정사각형 또는 직사각형     - 행창과 침식 연산에서 동일하게 작동     - 객체 가장자리를 따라 명확한 변화를 줄 때 유용    2. 타원형(cv2.MORPH_ELLIPSE)     - 가장자리 부분을 더 부드럽게 처리     - 객체의 둥근 모양을 유지하면서 노이즈를 제거할 때 유용    3. 십자형(cv2.MORPH_CROSS)     - 중심을 기준으로 수직 및 수.. 2024. 7. 23.