P.S. особенно весело это в случае некритической функциональности продукта
Университет — само собой. В Джете, я в итоге занимался обучением клиентов. Сейчас вот тоже, начал учить внутренних и внешних девелоперов разработке для нашей системы...
Но это мне нравится, хотя часто после целого дня занятий, ощущаешь себя как выжатый лимон :-)
Я читал не все, но большую часть, оставшееся — лежит в очереди на чтение. Список книг собирался путем опроса знакомых, занимающихся ML... Я думал сделать страничку у себя на сайте с таким списком литературы, может быть и сделаю...
Научно популярные:
— Programming Collective Intelligence (PCI) — есть несколько глав, популярно описывающих основные алгоритмы классификации данных. (у Manning есть еще две книги похожего плана — Algorithms of Intelligent Web и Collective Intelligence in Action)
— Machine Learning in Action — похожа на PCI, также используется питон в качестве языка для примеров.
— Mahout in Action — неплохая книга про использование Apache Mahout для кластеризации, классификации и рекомендаций. Минимум
С боль'шим кол-вом теории:
— The Elements of Statistical Learning. Data Mining, Inference, and Prediction, 2ed. На www-stat.stanford.edu есть свободная версия. Одна из самых полных книг по основным подходам в ML
— Data Mining: Practical Machine Learning Tools and Techniques, 3ed (http://t.co/YQpu9yN). Также как в предыдущей книге, описаны основные алгоритмы ML. Народ в отзывах правда жалуется, что используются не совсем стандартные обозначения. Но имхо, книга написана неплохо, особенно для вводной книги.
— классика жанра "Pattern Recognition and Machine Learning" by Christopher M. Bishop (http://t.co/X6S96n1) — в очереди на чтение
— хочу еще посмотреть на "Machine Learning: An Algorithmic Perspective" by Stephen Marsland (http://t.co/lsCep5H) — судя по отзывам неплохая книга.
Видео-лекции:
— курс MIT 6.867 Machine learning — есть на MIT Courseware, iTunes & youtube. Достаточно подобные lecture notes...
Дополнительная литература:
— "The Modern Algebra of Information Retrieval" by Sándor Dominich (http://t.co/CeU14yE) хорошее введение в разделы алгебры, которые используются в information retrieval, и частично в machine learning.
— среди свободных книг на intechweb.org есть и сборники со статьями по machine learning & advanced topics.
— серия Adaptive Computation and Machine Learning у MIT Press
ну и до кучи еще и софт:
— mloss.org — сайт посвященный open source machine learning софту
— apache mahout (http://mahout.apache.org) — фреймворк на яве, для кластеризации и классификации данных + рекомендации... Спроектирован для использования вместе с Hadoop, с соответствующей адаптацией алгоритмов
— weka (http://www.cs.waikato.ac.nz/ml/weka/) — тоже фреймворк на яве для data mining & ML.
Комментарии приветствуются...
@zabivator на заметку... ailev.livejournal.com