짜투리 (37) 썸네일형 리스트형 [xml/DB 프젝-데이터 통합] 엑셀로 xml문서 만들기+자바 DOM Parser+XML valid+XML 파일 XSD 만들기 3시간 걸려서 글 다 썼는데 왠지 모르게 다 날라가서 다시 쓴다... 오늘은 이번 학기 나의 노화의 주범.. xml/db 프로젝트의 데이터 통합 과정을 적으려고 한다. 솔직히 많은 사람의 도움을 받아서 온전히 내가 했다고 할 수 있는 것이 없어 굉장히 부끄럽다. 나의 프로젝트를 도와준 모든 분들에게 이 글을 바친다. 도움을 주신 분 : 싸가지 오빠 1. csv 파일 불러오기 + xml 문서 작성 데이터는 총 72,632개. 저 데이터를 xml로 만들기 위해서는 xml 문서가 필요하다. csv 파일을 xml로 만들건데 그러기 위해서는 xml문서가 필요한다는게 대게 모순적이라 생각했는데. 그냥 요렇게 원하는 xml 형식을 대충 정한다. 이때 중요한건 단위가 되는 태그(우리의 경우 sentence)를 하나만 .. [python] 엑셀과 판다스 DataFram으로 데이터 정제하기 하웅. 어제 1시까지 즐거운 프로젝트를 했ㄸㅏ.. 그리고 간맥하고 기숙사 들어와서 씻고 누우니 3시.. 아침 9시 수업이라 8시에 있어낫더니 지금 죽을 맛이다. 어제 DB/웹프 프젝을 하는데 핑퐁오빠가 데이터 전처리를 맡겼다. 바로 csv 파일에서 필요한 칼럼만 뽑고 데이터를 조금 수정하는 것! 나는 바보 같이 판다스의 read_csv를 하고 필요한 칼럼을 뽑으려고 했는데... 옛 직장 4학년 오빠가 우리 스터디룸에 놀러와서 나 하는 걸 보더니. "그냥 엑셀로 하면 되는 거 아니야?" ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ맞다. 엑셀로 하면 되었따... 데이터는 "연령별 도서 키워드 데이터- 빅데이터 마켓"이다. 1. 원본 데이터에서 필요한 칼럼 : 이 데이터에서 필요한 칼럼은 C열(연령대), D열(도서 순위), E열(키.. [JAVA] intelliJ에서 github에 코드 올리는 방법 하암... 프로젝트가 거의 막바지에 다다랐다. c언어 프젝 100% 진행 완료. (ppt까지 다 만들어서 발표 준비만 하면 됨ㅜㅜ) 자바 프젝 60% 진행 완료. 총체적 난국.. 기능 하나 구현 못 할까바 조마조마 DB/XML 프젝 60% 진행 완료. 어찌어찌 구현은 할 거 같음 프로젝트를 진행하다보니 느낀 점은 마지막에 쓰겠다! 요즘 github에 관해서 틈틈이 공부하고 있다. IT 업계에서 "C언어는 못해도 깃허브는 할 줄 알아야 한다"는 말이 돌 정도로 필수인 github짱.. 그치만 정말 쉽지 않더라... 2시간 동안 구글링 했는데 너무 어려웠따... 하지만 실습이 직빵인건지. 저번에 c언어 프젝을 실험 삼아 올렸는데 얼랑뚱땅 올려져 버렸다... 요즘 IDE가 잘 나와서 github에 올리는 것이.. [python] 2차원 리스트를 생성하고 요소 변경하는 차이 BFS하면서 생성한 2차원 리스트의 요소가 이상하게 변경돼서 한창 고민했엇따. 바로 39,40 연산에서 값이 이상하게 삽입되는거다..!!! 처음에 리스트를 저렇게 선언했는데, 디버깅하면서 보니까, 0,2값 뿐만 아니라 2열 값이 모두 변경된 것을 보고 에?? 모지 싶어서 리스트 함축을 써서 선언해서 바꿔보니까 그건 내가 원하는 대로 돌아갔다. 둘다 똑같은 리스트 선언인데 다른 연산이 되니까 신기하지 않은가용??? 그래서 랩실 사람들한테 물어보니까 JO오빠가 굉장히 싸가지 없이 말하는 것 같지만, 실제로도 싸가지가 좀 없는 것 같다. https://stackoverflow.com/questions/15654800/what-is-the-difference-between-0-for-in-range10-for-.. [python] 'is'와 '==' 오늘 연구실의 뉴비 K쿤과 이야기를 하다가 알아낸 사실이 잇다. 바로.. 'is'와 '=='이 다른 의미라는 것...!!! 사실 처음 파이썬 문법을 배울 때는 둘의 차이점이 아리송해서 그냥 넘어갓다. 연결리스트 하면서 node is not None 할 때도 그냥.. 코드가 그렇게 쓰는 게 더 직관적이어서 그러케 썻다. 딱 분류하자면, is 는 주소값 비교 ==은 값 비교이다. 위 코드를 보면 값을 비교하는 두번째 코드는 같다고 출력하지만, 첫번째 코드는 들어잇는 요소는 모두 같지만 리스트라는 주소값을 가리키는 포인터 즉, 주소값이 다르기 때문에 안 돌아간다고 출력하게 된다. 물론 넘파이 배열도 안 돌아간다. 헷갈린다 싶다면 id()를 사용해서 두 아이디가 동일하면 is가 똑같은 거라고 생각하면 편할 것 .. 이전 1 2 3 4 5 다음