Pythonでコンテンツベースのレコメンドを作ったときに参考にしたURL

レコメンドについての説明で参考にしたURL

レコメンドには様々な種類がありますが、その辺りを理解する上で役にたったサイトや書籍はこちらです。

こちらは協調フィルタリングの説明がメインのため今回の実装方法と異なりますが、非常にわかりやすく説明されておりおススメ。

コンテンツベースでの推薦についてまとめられています。今回のテーマだとこの資料がかなり有用でした。

こちらも同じ人の投稿。勉強になります。

これも協調フィルタリングがメインですが、推薦システムの概論もあり必読。

これも協調フィルタリング。Rubyでコードがあるので参考にできます。

技術的な話には踏み込んでませんでしたが、一応。

あと書籍としては以下がおススメ。

今回、私は文字列コンテンツを対象としたレコメンドを作ったのでそこでtfidfを用いました。参考になったのは下記。

こちらはPythonでTFIDFを実装しているページです。TFIDFはロジックは平易であり、ソースもそこまで煩雑ではありません。一回流してみておくとよいです。

TFIDFとコサイン類似推定法の説明が非常にわかりやすく書いてあります。

TFIDFを自前で作るのは若干手間だと感じるならscikit-learnを利用するとよいと思います。その上で上記ページは非常にわかりやすく解説してくれています。

コサイン類似度、ジャカード係数、シンプソン係数の実装コードが記載されており参考になります。

今回はTFIDF->コサイン類似推定法を採用したのでkmeansは利用しませんでしたが、一応調べたので。

クラスタリングについて知りたい人は読んでおきたいページ。クラスタリングの分類やデメリットなど大枠を知ることができます。

こちらは共起の尺度について説明しています。解りやすい。

タイトルままですが、多分どこかで使う。