книги по machine learning (ML):
Я читал не все, но большую часть, оставшееся — лежит в очереди на чтение. Список книг собирался путем опроса знакомых, занимающихся ML... Я думал сделать страничку у себя на сайте с таким списком литературы, может быть и сделаю...
Научно популярные:
— Programming Collective Intelligence (PCI) — есть несколько глав, популярно описывающих основные алгоритмы классификации данных. (у Manning есть еще две книги похожего плана — Algorithms of Intelligent Web и Collective Intelligence in Action)
— Machine Learning in Action — похожа на PCI, также используется питон в качестве языка для примеров.
— Mahout in Action — неплохая книга про использование Apache Mahout для кластеризации, классификации и рекомендаций. Минимум
С боль'шим кол-вом теории:
— The Elements of Statistical Learning. Data Mining, Inference, and Prediction, 2ed. На
www-stat.stanford.edu есть свободная версия. Одна из самых полных книг по основным подходам в ML
— Data Mining: Practical Machine Learning Tools and Techniques, 3ed (
t.co). Также как в предыдущей книге, описаны основные алгоритмы ML. Народ в отзывах правда жалуется, что используются не совсем стандартные обозначения. Но имхо, книга написана неплохо, особенно для вводной книги.
— классика жанра "Pattern Recognition and Machine Learning" by Christopher M. Bishop (
t.co) — в очереди на чтение
— хочу еще посмотреть на "Machine Learning: An Algorithmic Perspective" by Stephen Marsland (
t.co) — судя по отзывам неплохая книга.
Видео-лекции:
— курс MIT 6.867 Machine learning — есть на MIT Courseware, iTunes & youtube. Достаточно подобные lecture notes...
Дополнительная литература:
— "The Modern Algebra of Information Retrieval" by Sándor Dominich (
t.co) хорошее введение в разделы алгебры, которые используются в information retrieval, и частично в machine learning.
— среди свободных книг на
intechweb.org есть и сборники со статьями по machine learning & advanced topics.
— серия Adaptive Computation and Machine Learning у MIT Press
ну и до кучи еще и софт:
—
mloss.org — сайт посвященный open source machine learning софту
— apache mahout (
mahout.apache.org) — фреймворк на яве, для кластеризации и классификации данных + рекомендации... Спроектирован для использования вместе с Hadoop, с соответствующей адаптацией алгоритмов
— weka (
cs.waikato.ac.nz) — тоже фреймворк на яве для data mining & ML.
Комментарии приветствуются...