자연어(natural language)
: 우리가 일상 생활에서 사용하는 언어
자연어 처리(natural language processing)
: 자연어의 의미를 분석하여 컴퓨터가 처리할 수 있도록 하는 일
머신러닝 실습을 위한 환경을 만들어 보자.
1. 아나콘다(Anaconda) 설치
아래의 사이트에서 아나콘다를 다운 받는다.
https://www.anaconda.com/distribution/
설치 후, 아나콘다 프롬프트를 열어 아래의 명령어를 통해 아나콘다 파이썬 패키지를 전부 업데이트 해준다.
> conda update -n base conda
> conda update --all
2. 텐서플로우(Tensorflow) 설치
텐서플로우는 구글이 2015년에 공개한 머신 러닝 오픈소스 라이브러리이다.
머신 러닝과 딥 러닝을 직관적이고 손쉽게 할 수 있도록 설계되었다.
아나콘다 프롬프트에서 아래의 명령을 통해 tensorflow를 설치한다.
> pip install tensorflow
제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 tesorflow를 import한다.
3. 케라스(Keras) 설치
케라스(Keras)는 딥 러닝 프레임워크인 텐서플로우에 대한 추상화 된 API를 제공한다.
케라스는 백엔드로 텐서플로우를 사용하며, 좀 더 쉽게 딥 러닝을 사용할 수 있게 해준다.
쉽게 말해, 텐서플로우 코드를 훨씬 간단하게 작성할 수 있다.
아나콘다 프롬프트에서 아래의 명령을 통해 케라스를 설치한다.
> pip install keras
제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 keras를 import한다.
4. 젠심(Gensim) 설치
젠심(Gensim)은 머신 러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리이다.
아나콘다 프롬프트에서 아래의 명령을 통해 젠심을 설치한다.
> pip install gensim
제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 gensim를 import한다.
5. KoNLPy 설치
코엔엘파이(KoNLPy)는 한국어 자연어 처리를 위한 형태소 분석기 패키지이다.
아나콘다 프롬프트에서 아래 커맨드로 설치한다.
> pip install konlpy
제대로 설치 되었는지 확인하기 위해 ipython을 실행하여 konlpy를 import한다.
참고자료
'Natural Language Processing > 딥 러닝을 이용한 자연어 처리 입문' 카테고리의 다른 글
[딥 러닝을 이용한 자연어 처리 입문] 원-핫 인코딩(One-Hot Encoding) (0) | 2021.03.15 |
---|---|
[딥 러닝을 이용한 자연어 처리 입문]텍스트 전처리(text preprocessing) (0) | 2021.03.09 |
[딥 러닝을 이용한 자연어 처리 입문]머신 러닝 워크플로우(Machine Learning Workflow) (1) | 2021.02.13 |
[딥 러닝을 이용한 자연어 처리 입문]판다스 프로파일링(Pandas -Profiling) (0) | 2021.02.13 |
[딥 러닝을 이용한 자연어 처리 입문]데이터 분석 패키지 (0) | 2021.02.13 |