본문 바로가기
IT, 정보통신/etc

페이스북, 자연어 처리 프로젝트를 오픈소스로 전환

by newly everyday 2018. 12. 18.


페이스북, 자연어 처리 프로젝트를 오픈소스로 전환


Serdar Yegulalp | InfoWorld
페이스북이 자연어 처리를 위한 프로젝트를 현재 오픈소스로 공개했다. 이로써 더 나은 텍스트 마이닝 방법이 가능해졌다. 
 
Credit: GettyImages

페이스북이 실험 프로젝트와 프로덕션 시스템을 손쉽게 결합할 수 있도록 자연어 처리(NLP)를 위한 머신러닝 라이브러리인 파이텍스트(PyText) 프로젝트를 오픈소스로 전환했다.

파이토치(PyTorch)는 머신러닝을 위해 페이스북의 기존 파이토치 라이브러리로 구축됐으며 회사에서 내부적으로 사용하는 것으로 특히 신경망(예 : NLP)을 사용해 머신러닝을 수행하는 방법을 다루기 위해 작성되었다. 이러한 라이브러리는 전형적으로 실험을 위해 최적화된 프레임워크와 프로덕션을 위해 최적화된 프레임워크 사이의 절충점이었다.

실험을 위해 만들어진 프레임워크는 빠른 프로토타이핑을 가능하게 했지만 페이스북의 엔지니어들은 "지연 시간과 메모리 사용량이 증가했다"고 게시물에서 밝혔다. 반면 프로덕션을 위해 제작된 프레임워크는 로드가 잘 걸렸지만 빠르게 개발하기가 어려웠다.

파이텍스트의 가장 큰 차이점은 실험이나 프로덕션 용도로 페이스북의 주장을 최적화할 수 있는 워크플로우라는 데 있다. 프레임워크의 구성 요소는 서로 꿰매어 전체 NLP 파이프라인을 만들거나 개별 조각을 다른 상황에서 분리하여 재사용할 수 있다.

새로운 모델 교육은 여러 노드에 분산될 수 있으며 여러 모델을 동시에 교육할 수 있다. 또한 파이텍스트는 텍스트 분류를 위해 기존의 많은 모델을 사용할 수 있으며 이러한 경우 전체적으로 꼭 교육을 받아야 하지 않아도 될 수 있다.

..

원문 전체 보기: 
http://www.ciokorea.com/news/113247#csidxfa81af52c79e62e87ad052e7d8d2901 


댓글