機械学習

自分の行動履歴からID行列を作成する

概要 (日数, 1日をN等分するN) のサイズの行列データを作りたい 自然言語処理 (CBoWとか) のそれと同じような感覚 python manage.py のコマンド → CSVファイルに書き込み、という流れとする 50 日分くらいのデータが溜まった Apple Home まだか イメージ ニ…

線形判別分析

概要 特徴空間をよく分離する尺度を見つけ出す そもそも 例えば以下のような場合に主成分分析は使えない。特徴空間の分散を最大化する方向に分布が存在するとは限らないため。というかそもそも主成分分析は複数の分布を区別するためのものでは(直接)ない。し…

決定木 (離散データ用)

概要 エントロピーを最も下げる、データ集合の分割方法を (再帰的に) 得たい 特徴値が連続値の場合は大小比較 (気温が25℃以上とか) 、離散値の場合はそのままカウント が、連続値の場合は前処理によって離散値に変換し直すことができる (離散値) の場合、値…

Fuzzy C-means法

概要 クラスタ中心との距離の逆数に応じた所属確率を用いる K-means法では最近傍のクラスタのみに所属させていた イメージ 自宅が吉祥寺駅と三鷹駅の間にあるとき、吉祥寺駅との距離をk、三鷹駅との距離をmとすると k 吉祥寺駅の近くに住んでいると自慢して…

k-means法をpythonで実装してみる

概要 実装してみた k-means法を実装してみたくなる一番の理由は「実装できそうな気がするから」 fit()、fit_predict()という2メソッドの名前だけsklearnを参考にした 実装 import numpy as np class MyKMeans(object): """クラスタリングを行うためのクラス"…