機械学習

決定木 (離散データ用)

概要 エントロピーを最も下げる、データ集合の分割方法を (再帰的に) 得たい 特徴値が連続値の場合は大小比較 (気温が25℃以上とか) 、離散値の場合はそのままカウント が、連続値の場合は前処理によって離散値に変換し直すことができる (離散値) の場合、値…

Fuzzy C-means法

概要 クラスタ中心との距離の逆数に応じた所属確率を用いる K-means法では最近傍のクラスタのみに所属させていた イメージ 自宅が吉祥寺駅と三鷹駅の間にあるとき、吉祥寺駅との距離をk、三鷹駅との距離をmとすると k 吉祥寺駅の近くに住んでいると自慢して…

k-means法をpythonで実装してみる

概要 実装してみた k-means法を実装してみたくなる一番の理由は「実装できそうな気がするから」 fit()、fit_predict()という2メソッドの名前だけsklearnを参考にした 実装 import numpy as np class MyKMeans(object): """クラスタリングを行うためのクラス"…