본문 바로가기

자연어처리3

04. 자연어처리 - 임베딩 1. 자연어의 특성 자연어를 기계가 처리하도록 하기 위해서 먼저 자연어를 기계가 이해할 수 있는 언어로 바꾸는 방법을 알아야 함토큰화 작업의 결과인 단어 사전을 기계가 이해할 수 있는 언어로 표현하는 과정이고, 단어 사전 내 단어 하나를 어떻게 표현할까의 문제로 볼 수 있음  1. 단어의 유사성과 모호성단어의 의미는 유사성과 모호성을 가지고 있는데 단어는 겉으로 보이는 형태인 표제어안에 여러가지 의미를 담고 있음 사람은 주변 정보에 따라 숨겨진 의미를 파악하고 이해할 수 있으나, 기계는 학습의 부재 또는 잘못된 데이터로 의미를 파악하지 못하는 경우가 있음 한 가지 형태의 단어에 여러 의미가 포함되어 생기는 중의성 문제는 자연어 처리에서 매우 중요동형어: 형태는 같으나 뜻이 서로 다른 단어 _예) 배다의어.. 2024. 6. 25.
03. 자연어처리 - 전처리 실습 1. 자연어 전처리   ◼ 뉴스 기사 크롤링 라이브러리 설치            # 웹 스크래핑을 통해 뉴스 기사를 수집하고 분석하는데 사용되는 라이브러리      !pip install newspaper3k   ◼ 지원 언어 확인                import newspaper        newspaper.languages()Your available languages are: input code full name   vi   Vietnamese   it   Italian   de   German   sr   Serbian   zh   Chinese   fa   Persian   be   Belarusian   sv   Swedish   el   Greek   da   Danish   no .. 2024. 6. 24.
01. 자연어처리 - 개요 1. 자연어(Natural Language Processing, NLP)프로그래밍 언어와 같이 인공적으로 만든 기계언어와 대비되는 단어로, 우리가 일상에서 주로 사용하는 언어 1. 자연어 처리컴퓨터가 한국어나 영어와 같은 인간의 자연어를 읽고 이해할 수 있도록 돕는 인공지능의 한 분야자연어에서 의미 있는 정보를 추출하여 활용기계가 자연어의 의미를 이해하게 함기계가 사람의 언어로 소통할 수 있게 함2. 자연어처리의 활용문서 분류, 스팸 처리와 같은 분류 문제부터 검색어 추천과 같은 추천기능, 음성인식, 질의 응답, 번영 등의 다양한 분야에서 사용되고 있음반복 업무 자동화검색 효율 향상 및 검색 엔진 최적화대규모 문석 분석 및 정리소셜 미디어 분석3. 용어 정리자연어 이해(Natural Language Un.. 2024. 6. 24.
LIST