https://euriion.com/?p=548 Cosine Similarity - 코사인 유사도 - TOTAL DATA SCIENCE 삼각함수와 선형대수학에 대한 기본적인 배경지식이 있다면 코사인 유사도는 매우 쉽습니다. 아닌 경우에는 개념을 잡는 것이 어려울 수 있습니다. 이 글에 대해서 이 글은 조금 쉽게 풀어서 � euriion.com 위를 참고했다. 우선 나는 엑셀로 파일을 받아서 각 문서의 유사도를 알아보려고 했다. 1. 문서는 row마다 다르다. 2. 문서의 사이즈는 195개이다. 3. 문서의 column 중 유사도를 판단할 수 없는 것은 뺀다. 4. 문서는 한글로 되어있어 Konlpy를 쓴다. 5. 코사인 유사도를 사용해서 구해본다. 대충 위의 생각을 가지고 접근해보았다. 위와 같은 라이브..