Natural Language Processing/딥 러닝을 이용한 자연어 처리 입문

[딥 러닝을 이용한 자연어 처리 입문]실습 환경 만들기

림밤빵 2021. 2. 9. 23:50
728x90

자연어(natural language)

: 우리가 일상 생활에서 사용하는 언어

 

자연어 처리(natural language processing)

: 자연어의 의미를 분석하여 컴퓨터가 처리할 수 있도록 하는 일

 

머신러닝 실습을 위한 환경을 만들어 보자.

 

1. 아나콘다(Anaconda) 설치

아래의 사이트에서 아나콘다를 다운 받는다.

https://www.anaconda.com/distribution/

 

Anaconda | Individual Edition

Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine.

www.anaconda.com

 

설치 후, 아나콘다 프롬프트를 열어 아래의 명령어를 통해 아나콘다 파이썬 패키지를 전부 업데이트 해준다.

 

> conda update -n base conda
> conda update --all

 

2. 텐서플로우(Tensorflow) 설치

텐서플로우는 구글이 2015년에 공개한 머신 러닝 오픈소스 라이브러리이다.

머신 러닝과 딥 러닝을 직관적이고 손쉽게 할 수 있도록 설계되었다. 

아나콘다 프롬프트에서 아래의 명령을 통해 tensorflow를 설치한다.

> pip install tensorflow

 

제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 tesorflow를 import한다. 

 

 

3. 케라스(Keras) 설치

케라스(Keras)는 딥 러닝 프레임워크인 텐서플로우에 대한 추상화 된 API를 제공한다.

케라스는 백엔드로 텐서플로우를 사용하며, 좀 더 쉽게 딥 러닝을 사용할 수 있게 해준다.

쉽게 말해, 텐서플로우 코드를 훨씬 간단하게 작성할 수 있다.

아나콘다 프롬프트에서 아래의 명령을 통해 케라스를 설치한다.

> pip install keras

 

제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 keras를 import한다. 

 

 

4. 젠심(Gensim) 설치

젠심(Gensim)은 머신 러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리이다.

아나콘다 프롬프트에서 아래의 명령을 통해 젠심을 설치한다.

> pip install gensim

 

제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 gensim를 import한다. 

 

 

5. KoNLPy 설치

코엔엘파이(KoNLPy)는 한국어 자연어 처리를 위한 형태소 분석기 패키지이다.

아나콘다 프롬프트에서 아래 커맨드로 설치한다.

> pip install konlpy

 

제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 konlpy를 import한다. 

 

 

 

 

참고자료

wikidocs.net/book/2155

728x90