naverNewsParser를 이용한 네이버 뉴스 크롤링

  텍스트를 분석할 때 가장 먼저 할 일은 크롤링(Crawing)이다. 크롤링은 특정 사이트 내 웹페이지를 가져와 수집하는 행위를 말한다. 이런 작업을 도와주는 어플리케이션을 일컬어 크롤러(Crawler)라고 부른다. 여기에서는 깃허브에 공개된 R 라이브러리를 활용해 네이버 뉴스를 크롤링하려고 한다. 사용할 라이브러리는 ‘naverNewsParser’다. 네이버 뉴스만을 목표한 라이브러리로 범위는 협소하지만, 사용법이 매우 간단해서 활용도가 높다. naverNewsParser는 R에 등록된 정식 라이브러리가 아니다.…

R 기술통계 코드

  아래 코드는 R에서 기본적인 통계에 사용되는 코드다. 엑셀 함수로도 가능하지만 R에서는 무엇보다 자동화가 가능하다.

  통계용어 설명 아웃라이어(outlier) : 평균을 구할 때 값의 급격한 변화를 주는 값. 예를 들어 1, 3, 5, 100의 평균의 값을 구하고자 했을 때 100은 네 개 값의 평균을 왜곡하는게 급격한 영향을 끼친다. 이때 100을 통계용어로 ‘아웃라이어’라고 한다. 때문에…

가볍고 쉽고 빠른 프리웨어 에디터 ‘Brackets’

  코딩을 할 때 가장 많이 쓰는 에디터는 노트패드++이다. 범용 문서작성 프로그램이지만 다양한 프로그래밍 언어를 포함하고 있어 코딩 학습이나 작업 할 때 편하다. 사실, 에디터도 프로그래밍 언어 수만큼 다양하다. 가깝게는 메모장이 있고, 각 언어에 특화된 IDLE이 있다. 최근 들어 주가를 올리고 있는 코딩 에디터는 cloud9 이다. 별도로 설치할 필요없이 클라우드 형태로 웹에서 가동할 수 있다.…

네이버의 새로운 개발자 도구 ‘음성합성 API’

네이버는 지난해부터 인링크(in-link) 기사에 음성합성(tts) 기능을 서비스하고 있다. 이 기능은 텍스트를 음성 형태의 음원으로 변환해 사용자들이 기사를 읽지 않고도 스피커나 이어폰을 통해 들을 수 있도록 제공한다. 지하철이나 버스에서 스크롤 없이 기사를 접할 수 있다는 점에서 사용자 편의성이 극대화됐다. 이 서비스는 네이버 개발자 센터를 통해서 개발자들이 이용할 수 있게 공개돼 있다. 한글 뿐 아니라 영어, 중국어,…

백엔드와 프론트엔드, 그리고 풀스택 “나는 어떤 개발자가 될 것인가”

코딩의 문턱에서 가장 먼저 해야할 질문은 ‘어떤 언어를 사용할 것인가?’가 아니다. 그보다 더 본질적인 질문이 있다. “자신은 어떤 개발자가 되고 싶은가?”다. 철학적인 질문처럼 보이지만, 사실 기술적인 질문이다. 여기에는 세 가지의 답이 존재한다. 백엔드(Back-end), 프론트엔드(Front-end), 그리고 풀스택(Full-stack). 최근 개발자 채용 공고를 보면 C++, java, python 등 사용할 기반 언어를 공고함과 동시에 백엔드와 프론트엔드 개발자를 구분해 모집하는…

엑셀 함수 LEN, SUBSTITUTE – 특정 단어 개수 세기

  일정한 조건에 맞는 셀이 몇 개인지를 찾기 위해서는 COUNT 함수를 사용한다. 하지만 입력된 셀 값에서 특정 단어 수를 세어야 한다면 LEN과 SUBSTITUTE 함수를 써야한다.   함수이해하기 LEN (텍스트) – 텍스트 : 문자를 세려는 텍스트 또는 해당 값이 입력된 셀 =(LEN(F3)-LEN(SUBSTITUTE(F3, “경제”, “”)))/2

엑셀 함수 IF, 판단 결과를 원하는 방식으로 반환

IF – 판단 결과를 원하는 방식으로 반환 엑셀에서 가장 많이 사용하는 함수 중 하나다. IF 함수는 사용자가 지정한 조건을 판단해 결과가 맞으면 A 작업을, 틀리면 B 작업을 지시한다. 함수 이해하기 IF (조건, 참일 때 반환, 거짓일 때 반환) 조건 : 참, 거짓 값을 반환하는 값 또는 계산식 참일 때 반환 : 조건의 값이 참일 때…

HELLPY#1. 파이썬으로 할 수 있는 일들

코딩(Coding)의 시대. 전문가의 영역이라 여겼던 코딩은 이제, 2018년 부터 초, 중, 고등학교 교육과정에서 전면 의무화가 된다. 이미 영국, 인도 등의 나라에서는 의무 교육화 돼 교실에서 스크래치(Scratch)나 앱인벤터(appinventor) 등 GUI 기반의 소프트웨어를 통한 코딩 교육이 활발하게 이뤄지고 있다. 심지어 아두이노(Arduino)나 라즈베리파이(Rasberry-Pi) 등의 하드웨어를 활용한 IoT(사물인터넷) 교육도 진행된다. 이같은 흐름에 맞춰 국내에도 여러 코딩 전문 교육기관이 생겨나고…