본문 바로가기

반응형

한글

(5)
웹 통신에서 한글 깨짐 처리 %EA, utf-8 Prologue 과거에 파이썬 2에서는 유니코드 인식이 잘 되지 않아 한글 사용에 다양한 방법들이 필요했다. 하지만 파이썬3에서는 기본 인코딩이 utf-8로 채택이 되었고, 추가적인 설정 없이(?) 한글 사용이 편해졌다. plotting을 할 때는 글꼴을 바꿔서 추가적인 설정을 해주어야 하지만, 기본적으로 python상에서 한글을 사용하는데 큰 문제는 없다. 하지만, 보통 데이터 수집이나 웹통신을 하다 보면 한글이 있어야 할 자리에 흉악하게 생긴 것들을 볼 수 있다. 보통 한국어 관련 스크래핑을 하다 보면, 해당 주소의 url상에서 %EA%... 이렇게 수많은 %가 포함된 생긴 것을 볼 수 있다. 그냥 해도 무방한데, 특히 데이터파일을 받을 때 파일명에 저러한 문자가 섞여있는 경우, 적지않은 짜증이 올라..
파이썬 matplotlib 한글 사용 (ubuntu 18.04) Linux: Ubuntu 18.04 기준 약간의 변경을 하면 어느 OS이든 사용 가능 Install Font 나눔글꼴의 경우 설치 예시 다른 글꼴의 경우 받아서 그냥 그 경로를 사용하면 됨 sudo apt-get install fonts-nanum* # 나눔관련 모든 글꼴 설치 fc-cache -fv # 설치 후 재부팅 하면 폰트가 인식이 되지만 재부팅 안할 경우 이걸 실행해야 함 혹시 모르시는 분 계실까봐, jupyter 환경에서는 맨앞에 !를 붙이면 터미널 명령어 사용가능 Usage 보통 아래처럼 사용하라고 다른 설명을 보면 나옴 하지만 나같은 경우는 인식을 못함 !cp /usr/share/fonts/truetype/nanum/Nanum* /usr/local/lib/python3.6/dist-pack..
ubuntu 18.04 한글 입력 안될 때 ubuntu 18.04를 비롯한 이전 몇몇 버전들은 기본적으로 ibus를 한글 입력기로 사용하고 있다. 하지만 이 ibus가 종종 몇가지 프로그램(대표적으로 텔레그램)에서 입력을 제대로 못 주는 경우가 있다. ibus를 사용하면서 해결을 하면 좋겠지만, 그게 쉽지 않기 때문에 입력기를 fcitx로 변경해주면 된다. 설치 및 사용은 아주 쉽다. 1. Install sudo apt-get install fcitx-hangul fcitx-config-gtx 2. Setting apps (Ctrl + A) > Settings > Region & Language (지역 및 언어) > Manage Installed Languages (우측 최하단) > Language Tab > Keyboard input metho..
마스크를 이용한 워드클라우드 제작 깃헙 바로가기 Make the Word Cloud #1amueller의 wordcloud package를 이용한 mask를 활용한 wordcloud 만들기!참고:[1] https://github.com/amueller/word_cloud[2] http://minimaxir.com/2016/05/wordclouds/[3] https://github.com/minimaxir/stylistic-word-clouds/blob/master/wordcloud_github.py1. Package import & font, mask, message setup!이 코드는 mask를 다루는 부분, font를 다루는 부분, word를 다루는 부분으로 나뉜다. 먼저 필요한 패키지들을 불러오는데, numpy와 random, p..

반응형