[WEKA] Semi-superivsed leanrning & Collective classification

Weka doesn't have any semi-supervised learning algorithms. 

This Weka add-on for semi-supervised/collective classification might be of interest.

웨카 공식 홈페이지(http://www.cs.waikato.ac.nz/~fracpete/projects/collective-classification/)에

이렇게 세미 슈퍼바이즈 기능을 제공하지 않는다고 해서 실험 방향을 바꿨었는데, 방법을 찾았다.


웨카에서는 기본적으로 Classify(supervised learning) 기능과 Cluster(unsupervised learning) 기능을 제공하지만 

Semi-supervised learning에 대한 내용은 제공하지 않는다. 공식적으론!


그렇지만 비공식적으로 collective-classification의 기능을 제공한다.

http://weka.wikispaces.com/Unofficial+packages+for+WEKA+3.7



그런데 collective-classification은 과연 semi-supervised learning과 같은 것일까?

Collective classification is the area in machine learning, in which unknown nodes in the network are classified based on the classes assigned to the known nodes and the network structure only.

[Kajdzanowicz, Tomasz, Przemyslaw Kazienko, and Marcin Janczak. "Collective classification techniques: an experimental study." New Trends in Databases and Information Systems. Springer Berlin Heidelberg, 2013. 99-108.]


collective classification은 network의 분야에서 많이 쓰이는 말인 것 같은데, 

내 생각에는 unknown nodes를 unlabeled data로 known nodes를 labeled data로 해석하면 

labeled data를 기반으로 unlabeled data를 분류하는 semi-supervised 학습 방법과 같다고 볼 수 있다.


weka의 Collective 탭이은 Classify탭에서 Supervised, Cluster 탭에서 Unsupervised 학습을 하는 것처럼

Semi-superivsed 학습을 할 수 있게 도와주는 것이다.


웨카 메뉴얼에 보면

Since the collective classifiers should get built using labeled and unlabeled dataset, they cannot be run in the usual Classify tab in the Explorer. 

Hence the package provides a custom tab, to perform experiments with the collective classifiers, called Collective.

라고 쓰여있다.



******************************  Collective-Classification 설치 방법 ****************************** 


1. Weka 3.7.11 버전을 다운 받는다.

 중요한 것은 WEKA의 버전이 3.7 이상이어야 한다는 것이다. (이전 버전에서는 지원하지 않으므로)





2. http://code.google.com/p/collective-classification/ 의 Releases에서 버전에 맞는 collective-classification 압축파일을 다운 받는다.

즉, weka의 3.7.11 버전에는 2014년 8월 20일날 릴리즈된 파일(WEKA_3.7.11)이 필요



3. Weka의 첫 화면의 메뉴에서 Tools - Package Manager를 클릭한다.

아래와 같은 화면이 열릴 것이다.





4. Package Manager에서 오른쪽에 위치한 Unofficial 그룹의 File/URL 버튼을 클릭한다.



위와 같은 창이 뜨면 File/URL에 Browse를 클릭하여 2번에서 받아두었던 zip파일을 선택하고 OK를 누르면 package가 설치된다!

* 저기 입력된 것처럼 https://code.... 이렇게 쓰면 안되고 zip일이 저장된 나의 컴퓨터 경로를 써주는 것이다

(나의 경우에는 C:\Users\ASA2\Desktop\collective-classification-2014.8.20.zip 이었다)






☆성공★







이제 Explorer를 시작하면 collective-classification을 사용할 수 있게 된다! 야호!




Weka에서 제공하는 manual.pdf를 첨부합니다.

manual.pdf



반응형
그리드형

댓글

❤️김세인트가 사랑으로 키웁니다❤️