WEKA 라이브러리 톺아보기 자주 사용하는 패키지 패키지 설명 Weka.core 일반적인 컴포넌트들을 포함하는 패키지, 속성, 데이터셋, 컨버터, 행렬조작과 같은 모델링 관련 클래스 포함 weka.classifiers 다양한 분류 알고리즘을 구현 weka.clusters 다양한 클러스터링 알고리즘 구현 weka.attributeseletion 속성 선택을 위한 알고리즘 포함 weka.associations 연관 규칙을 찾기 위한 알고리즘 포함 weka.filters 데이터 셋에 적용하기 위한 필터 관련 패키지 weka.gui 각종 GUI에 대한 API 자주 사용하는 컴포넌트 Instances : 데이터 세트 Filter : 데이터 전처리 시 사용 Attribute selection : 데이터셋에서 관련없..
WEKA 프로그램은 GUI를 제공하며, 5가지 모드(Explorer/Experimenter/Workbench/Simple CLI)를 제공한다. 직관적인 UI를 제공하여 쉽게 접근가능한 Explorer모드가 보편적으로 쓰이지만, Explorer모드에서 하지 못하는 심도 있는 실험을 위해 Experimenter 모드를 사용한다. 말그대로 실험자를 위한 모드ㅋㅋ Experimenter 모드는 Explorer 모드에 비해 사용법이 복잡하지만 이 또한 직관적이어서 크게 어렵지는 않다. 실험 프로세스를 원하는 대로 직접 제어할 수 있기 때문에 간단하지 않은 실험을 할 때 좀 더 편하게 진행할 수 있었다. 아래는 이안 위튼의 Data mining 책을 바탕으로 정리한 내용이다. 예제 프로세스를 한 번 따라 해본다면 ..
Weka doesn't have any semi-supervised learning algorithms. This Weka add-on for semi-supervised/collective classification might be of interest.웨카 공식 홈페이지(http://www.cs.waikato.ac.nz/~fracpete/projects/collective-classification/)에이렇게 세미 슈퍼바이즈 기능을 제공하지 않는다고 해서 실험 방향을 바꿨었는데, 방법을 찾았다. 웨카에서는 기본적으로 Classify(supervised learning) 기능과 Cluster(unsupervised learning) 기능을 제공하지만 Semi-supervised learning에 대한 ..
WEKA 라이브러리 참조하기(feat. SVM모델) WEKA에서 SVM모델을 사용하고 싶을 때는 Classify 탭에서 LibSVM classifier을 사용하면 된다(function 폴더에 있음). 그러나 라이브러리를 참조할 수 없기 때문에 "libsvm classes not in CLASSPATH!"라는 경고창이 뜨게 된다. 에러 : libsvm classes not in CLASSPATH! 해결 방법 1) LibSVM 라이브러리 다운로드 2) 압축풀고 java 폴더안에 libsvm.jar 파일 찾기 3) libsvm.jar을 내컴퓨터 환경설정의 클래스 패스에 포함 자세히 살펴보면, 1. 사용하고싶은 라이브러리 다운받기 http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 위 사..
[ Data Mining with WEKA 강의 트레일러 영상 ] Data Mining with WEKA 홈페이지 : https://weka.waikato.ac.nz/dataminingwithweka/course 데이터마이닝 관련 논문 자료를 찾다가 뉴질랜드 Waikato 대학교에서 제공하는 오픈코스(MOOC) Waikato Course를 알게 되었다. 3월부터 수강하는 기간이라 하였기에 잘 기억하고 있다가 학기가 시작할 때 같이 신청했다. '데이터마이닝 강좌 수강 완료하기'는 2014년 나의 연간 계획 중 하나가 됐다. WEKA가 와이카토 대학에서 만든 소프트웨어인만큼 그리고 Ian Witten 교수님이 강의하는만큼 질이 확실하고 나에게 도움이 될 것이라 믿어 의심치 않았다. 강의 구성 얀 교수님이 쓴..
File csv = new File("C:\\Users\\pmk\\Desktop\\Book1.csv"); import java.io.BufferedReader;import java.io.FileReader; import weka.classifiers.Classifier;import weka.classifiers.bayes.net.search.fixed.NaiveBayes;import weka.core.Instances; public class MyNB {void NaiveBayes_ArffArff() throws Exception {// 모델 빌드에 사용할 학습 데이터 로드BufferedReader reader;reader = new BufferedReader(new FileReader("C://"));..
클러스터링 알고리즘 다음은 WEKA에서 지원하는 클러스터링 알고리즘들이다. CLOPE Cobweb DBSCAN EM FarthestFirst FilteredClusterer HierarchicalClusterer MakeDensityBasedClusterer OPTICS sIB SimpleKMeans XMeans 자동으로 클러스터 수를 결정하는 알고리즘 자동으로 클러스터 수가 결정되는 알고리즘의 성능을 비교하는 실험을 진행하기 위해 실험에 앞서 우선 WEKA에서 지원하는 클러스터링 알고리즘 중에서 자동으로 클러스터 수가 결정되는 알고리즘을 찾아보았다. 그동안 내가 공부해왔던 것과 WEKA 툴 메뉴얼에 설명되어 있는 것으로 보았을 때 WEKA에서 자동으로 클러스터 수가 결정되는 듯한 것은 EM 알고리즘과 ..