본문 바로가기

반응형

Programing Language

(38)
[pandas] pd.DataFrame.to_csv()를 excel에서 열었을 때 한글 깨짐 Problem 문제는 심플하다. 아마 메모장이나 python, R 등에서 열었으면 아무 문제가 발생하지 않았을 텐데, 유독 excel에서만 발생한다. 원인은 엑셀에서 파일을 열 때 기본 인코딩인 cp땡땡땡 때문에 발쌩하는 문제이다. US Windows에선 CP1252 한국 windows에선 CP949 등에서 발생하는 고질적인 문제이다. CP949는 한글을 표현하기 위한 codepage이다. 우리는 codepage를 적합한 encoder/decoder를 통해서 입력/출력을 하게 된다 익숙한 codepage들을 예로 들자면 전세계 표준인 utf-8이나 컴퓨터 최초의 인코딩 방식인 ascii 등이 있을 수 있다. 이 CP949는 한글을 표현하기 위한 euc-kr의 확장 버전으로 한 문자를 2byte를 이용하여..
Networkx: 효과적인 node position with hierarchy (editing) Visualization: e(연결선 시각화의 모든 것):editing Python에서 plot을 하다 보면 가끔 연결선을 시각화해야하는 경우가 있다. 바로 다음과 같다. Network를 그릴 때 Hierarchy를 표현할 때 diagram 또는 관계도를 그릴 때 그외에 기타 등등 이런 경우에 시각화를 하다보면 맘에 드는 경우도 있고, 마음에 들지 않는 경우도 있다. 나는 첫 번째와 두 번째 경우가 모두 해당되는 경우였다. Louvain Method를 통해 군집에 대한 Hierarchy structure를 얻었고, 이를 시각화하기 위해 graphviz_layout의 prog='dot'옵션을 사용해서 다음과 같은 이미지를 얻었는데, graphviz_layout에는 우선 두 가지 문제점이 있었다. posit..
[Archiving] 파이썬 문법 꿀팁 100선 너무 좋은 내용이라 단물 쪽쪽 빨아먹을 때 까지 보고 다시 또 보고 할 필요가 있어서 공유 및 보관의 목적으로 글 자체를 아카이빙!!!! 파이썬 문법 꿀팁 100선
[JupyterLab] 필수 업데이트!!! 3.0.12 관련사항 거의 모든 것이 가능해졌다! JupyterLab (이하 JLab)은 Jupyter에 비해 확실한 장단점이 있는 UI였다. 하지만, 이번 3버전으로의 업데이트와 함께 거의 완벽해졌다. 아직 미흡한 부분이라면, Jupyter에서 되던 Extension이 JupyterLab에 최적화가 되지 않은 부분정도...? 바뀐 점 Sum-up 먼저 NBConverter 및 Reveal.js와의 상호작용이 완벽해졌다. 기존에 Slide Type을 설정할 수 없었던 탓에 JLab에서는 NBConverter를 사용할 수 없었다. JupyterLab? 작업(notebook)간 편리한 전환 범용성 높은 UI 기존 Jupyter의 대부분의 extension 지원 (3.0.12) JLab은 공식 문서의 표현을 빌리자면, Projec..

반응형