http://voteinfo.owlize.net
꼼수듣다 혹시나 싶어 만든건데요.
추가할 아이디어나 이런거 있으심 조언을.....
유사도에서 수치가 나타내는게 어떤건지 정확히 알 수가 없어요.
90% 유사하다라는건 이전 10번의 투표중 1번만 다른곳에서 했다는건가요?
-는 무슨뜻인가요?
유사도는 문장의 유사도입니다.
기계적으로 데이터마이닝하다보니 자료를 보는 분들을 생각 안했네요...
각 투표소별 유사도 수치는 그 아래에 표시된 위치 문자열을 유사도 비교한 수치입니다.
100에 가까울수록 유사한 문장이라는 이야기이고요.
이게 같은 장소를 표현하는 문구가 여러개이다 보니 단순 등가 판정으로는 의미있는 결과가 안나오더군요.
min 님 : 선관위 웹사이트 들어가서 페이지 긁어다가, tidy library로 html 정리하고 그 정리된 html을 dom xpath로 파싱하여 데이터 추출한겁니다 ;)
헉 저 주소 링크 좀 가져갈게요^ㅁ^