본문 바로가기

짜투리

[OpenRefine] 강력한 데이터 분석 도구

728x90

다운로드

https://openrefine.org/download.html

 

Download · OpenRefine

On this page you will find a list of OpenRefine distributions and extensions available for download. Are we missing something? Want to fix a typo? You can submit changes. Official Distribution Read the installation instructions. You can also download all o

openrefine.org

 

 1은 로컬에 자바가 깔려있을 때, 2는 없을 때인데. 나는 로컬에 깔려있는데 안 되길래 걍 2로 다시 깔았음

 

(window의 pc 보호)

 다운 받고 열면 파란색으로 보호창이 뜰 수도 있는데. 그냥 프로그램 우클릭>속성>일반>보안-차단 해제 체크박스를 클릭하면 된다.

 


파일 올리기

 1. 파일 선택

 2. create project

 


사용법

1. null 값 삭제

  • 원하는 행 옆에 화살표 누르고 Facet>형식에 맞는 facet 누르기

 

  • 그러면 좌측에 뜰텐데 스크롤 내려서 맨 아래 내려가면 (blank)가 있을 거다

 

  • blank 한 번만 클릭하면 선택한 열에 null값이 들어간 행만 출력된다

 

  • 거기서 열에서 All>Edit rows>Remove matching rows 하면 깔끔하게 null값 행 제거할 수 있다

 


 

2. 비슷한 값 묶기

  • 일단 대여일시 facet > 좌측에서 cluster

 

  • 아래 창에서 method>Mearest neighbor

 

  • select all하고 merge selected & close누르면 묶인다

 


 

3. 데이터 타입 바꾸기

  • 이번에는 한 요소(2019-11-01 9:01) 위에 마우스를 올리면 edit 버튼이 나타나는데 그거 클릭한다.
  • 그리고 data type변경하면 됨

 

  • 그리고 Apply누르면 변경 됨