naverNewsParser를 이용한 네이버 뉴스 크롤링

  텍스트를 분석할 때 가장 먼저 할 일은 크롤링(Crawing)이다. 크롤링은 특정 사이트 내 웹페이지를 가져와 수집하는 행위를 말한다. 이런 작업을 도와주는 어플리케이션을 일컬어 크롤러(Crawler)라고 부른다. 여기에서는 깃허브에 공개된 R 라이브러리를 활용해 네이버 뉴스를 크롤링하려고 한다. 사용할 라이브러리는 ‘naverNewsParser’다. 네이버 뉴스만을 목표한 라이브러리로 범위는 협소하지만, 사용법이 매우 간단해서 활용도가 높다. naverNewsParser는 R에 등록된 정식 라이브러리가 아니다.…