본문 바로가기

python

[python] konlpy 모듈 돌려버리기★colab에서 구글 드라이브 파일 가져오기

728x90

 연구실 자리 치우고, 연구실 사물함 치우고, 데이터 백업시키고, 교수님과 상담하고.. 눈치 챘겠지만 연구실을 나갔다.

 

 나가게 된 계기에 대해서는 글 끝에 적어놓았따. 대학교 일문학과 전과 출신 컴퓨터 학과 학사 연구실생의 퇴사 이유가 궁금하다면 읽어보시길 바란다.

 


 학과 프로젝트를 진행하다보니 konlpy(형태소 분석 모듈)을 사용해야 하는 코드가 생겻다. 근데 주피터에서 안 돌아가더라.. 후.. 무슨무슨 에러떠서 일일이 다 수정하고 cmd창 켜서 명령어 입력하고... 

 

근데 ㅅㅂ 안돼1!!

 그래서 다른 해결법을 찾았다. 바로 구글 COLAB을 쓰는거다. 구글 창에다가 colab을 검색하면 나오고. 이걸로 몇 차례의 구글링을 거친 다음에야 돌릴 수 있었따. 

 

 sm양 왈 구글 colab은 사용자 서버가 아니라 구글 서버를 이용해서. 딥러닝 같이 크기가 큰 코드도 돌릴 수 있다고 한다. 우왕!

 


<konlpy모듈 import하기>

1. colab 입장

 

2. 파일>새노트

 

 를 들어가면 주피터처럼 코드를 쓸 수 있따. 주피터에서 나는 설명충이기 때문에 markdown 기능을 자주 썻는데 여기서도 코드/텍스트로 나눠져 있어서 흡족하다. 

 

3. 코드 작성!!!!

!pip install konlpy
from konlpy.tag import Hannanum
hannanum = Hannanum()

 

 일단 코랩에 konlpy 모듈이 없기 때문에 모듈을 수동으로 깔아준다.  

 

 

 그리고 konlpy모듈을 import해주는데 나는 한나눔만 쓸꺼라서 hannaum만 따로 import 해주었따. konlpy모듈에는 여러가지 형태소 분석기가 있으므로 궁금하다면 찾아보길!!

 

  같은 팀 오빠가 한나눔 태그 정리된 사이트 알려줬따. 아래 p.16쪽에 정리가 아주~ 잘 되잇따!!

https://www.sketchengine.eu/wp-content/uploads/Original-HanNanum-manual.pdf

 


 프로젝트의 현재 과정은 csv 파일에서 문장이 들어있는 칼럼만 빼내서 이 문장을 단어 단위로 분리하는 과정이다. 이 csv파일에 대한 썰도 엄~~~~청 길다. 이게 json 파일인데 필요한 칼럼만 뽑아서 csv 파일로 변환해야 한다는 거다. 한 번도 해본 적 없지만 구글링 열심히 해서 이틀에 걸쳐 코드를 완성했는데...

 같은 팀 오빠가 10분 만에 코드 작성해서 나한테 떤져준 거 보니까ㅋㅋㅋㅋㅋㅋ 내가 이틀간 뭘 햇나 싶은 기분이 들더라. 역시 경력은 무시할 수 없는 것..! 열심히 해야겟다는 생각이 들었따.

 

<colab에서 구글 드라이브 파일 가져오기>

 

1. 구글 드라이브 열기

from google.colab import drive
drive.mount('/drive')

 마운트 하다가 무슨 뜻인지 모르겟지만 대충 연결하다의 의미인 거 같다... 아래 코드는 마운트 연결 해제/재연결 코드다. 구글링 오지게 하다가 건짐. 

#!fusermount -u /drive 
#!google-drive-ocamlfuse drive

 아마 코드를 치면 drive를 찾는 것에 실패했다는 문구가 뜰 때도 있는데 그럴 때는 경로를 체크하고 파일이 있는지 확인하면 된다. 

 

 

 파일이 없으면 정확한 파일로 연결을 해야겟쥬?

 

2.  드라이브 마운트에 성공햇으면 다음과 같이 뜬다.

 

 그러면 저 왼쪽 바에서 맨 밑에 파일 모양을 눌러주면

 

 쨘~ 내 드라이브와 연결이 됐다!! 근데 아직 끝이 아니다.

 

3. 경로 설정

 

 파일을 열려면 경로가 필요한데 그 경로는 해당 파일 옆에 우클릭하면 경로 복사가 있따. 

 

 

 경로 설정 후 판다스 모듈의 read_csv() 함수를 쓰면 내 드라이브 파일 읽기 끗~~

 

 


대망의 연구실 나간 계기... 

 나가게 된 계기를 많이 생각해 봤지만. 내가 좀 더 성장할 수 있는 방향으로 가고 싶다-가 가장 큰 이유인 것 같다. 나는 이 연구실에서 내가 성장할 수 있는 최대치까지 성장했다고 생각한다. 단순히 지도 교수님의 가르침 뿐만 아니라. 연구실 생활을 하면서 이런 저런 일도 겪고. 사람과의 문제. 대화하는 방법. 생각하는 방법. 많은 부분들이 바뀌었고 나아졌다. 이 연구실에 남으면 사람으로서는 좀 더 성장할 수 있겠지만. 나의 졸업은 이제 1년 반이 남았고, 나는 사람으로서의 성장보다 IT 계열의 인재로서의 성장을 하고 싶었던 것 같다.