Чтобы добавлять сообщения и комментарии, .

@alexott:
alexott

Коллеги из соседней группы пытаются доказать что единственным правильным методом организации REST API является асинхронный — клиент получает уникальный redirect и должен полить его до получения результата. Я первый раз когда услышал про такое, даже не знал что сказать...

@alexott:
alexott

эпопея продолжается — народ на полном серьезе утверждает что в файле с данными "text1\ntext2" всего одна строка...

@alexott:
alexott

чудны дела твои господи — развелось столько менеджеров и координаторов, что я только что обнаружил, что бага за которую я еще не брался, уже стоит в планах бакпорта в maintainance release, который выйдет на днях... Почему-то я об этом узнал самым последним, после того как пришли тестировщики, чтобы спросить — как проверять эту багу

@alexott:
alexott

"Research results from the psychology of programming indicate that expertise in programming is far more strongly related to the number of different programming styles understood by an individual that it is to the number years experience in programming" (from "Multiparadigm Programming in Leda" by Timothy Budd)

@alexott:
alexott

соседнее подразделение было успешно запинуто...

@alexott:
alexott

Соседнее подразделение ведет себя как режисер в сценке с никулиным и бревном — предлагают "быстренько, за пару недель" портировать наши наработки в свой проект... Там всего-то кода на 20 человеко-лет, согласно sloccount....

@alexott:
alexott

некоторые люди, страдающие синдромом NIH, почему-то сильно любят аргумент "а вдруг чужое сломается, как будем чинить?". Особенно этот аргумент смешен в отношении mature библиотек с открытыми исходниками и с большой пользовательской аудиторией... Плюс почему-то люди не берут во внимание тот факт, что нам самим надо эту функциональность сначала написать и отладить...

P.S. особенно весело это в случае некритической функциональности продукта

@alexott:
alexott

Люблю наблюдать как люди приходят к конкретным выводам. Наш самописный менеджер памяти не отдает ее назад, соответственно, при обработке больших документов, приходится выделять память под текст, и т.п., которая "освобождается" но не отдается в систему, соответственно это дело копится, пока не начинается активный своп. И делается такой вывод, что мы неправильно обрабатываем документы, и надо оптимизовывать извлечение текста, а не менеджер памяти...

@alexott:
alexott

как интересно складывается жизнь — на работе, в том или ином виде мне приходится быть преподавателем (кроме основной работы), несмотря на то, что есть люди работающие с продуктом(ами) больше меня...
Университет — само собой. В Джете, я в итоге занимался обучением клиентов. Сейчас вот тоже, начал учить внутренних и внешних девелоперов разработке для нашей системы...

Но это мне нравится, хотя часто после целого дня занятий, ощущаешь себя как выжатый лимон :-)

@alexott:
alexott

книги по machine learning (ML):
Я читал не все, но большую часть, оставшееся — лежит в очереди на чтение. Список книг собирался путем опроса знакомых, занимающихся ML... Я думал сделать страничку у себя на сайте с таким списком литературы, может быть и сделаю...

Научно популярные:
— Programming Collective Intelligence (PCI) — есть несколько глав, популярно описывающих основные алгоритмы классификации данных. (у Manning есть еще две книги похожего плана — Algorithms of Intelligent Web и Collective Intelligence in Action)
— Machine Learning in Action — похожа на PCI, также используется питон в качестве языка для примеров.
— Mahout in Action — неплохая книга про использование Apache Mahout для кластеризации, классификации и рекомендаций. Минимум

С боль'шим кол-вом теории:
— The Elements of Statistical Learning. Data Mining, Inference, and Prediction, 2ed. На www-stat.stanford.edu есть свободная версия. Одна из самых полных книг по основным подходам в ML
— Data Mining: Practical Machine Learning Tools and Techniques, 3ed (http://t.co/YQpu9yN). Также как в предыдущей книге, описаны основные алгоритмы ML. Народ в отзывах правда жалуется, что используются не совсем стандартные обозначения. Но имхо, книга написана неплохо, особенно для вводной книги.
— классика жанра "Pattern Recognition and Machine Learning" by Christopher M. Bishop (http://t.co/X6S96n1) — в очереди на чтение
— хочу еще посмотреть на "Machine Learning: An Algorithmic Perspective" by Stephen Marsland (http://t.co/lsCep5H) — судя по отзывам неплохая книга.

Видео-лекции:
— курс MIT 6.867 Machine learning — есть на MIT Courseware, iTunes & youtube. Достаточно подобные lecture notes...

Дополнительная литература:
— "The Modern Algebra of Information Retrieval" by Sándor Dominich (http://t.co/CeU14yE) хорошее введение в разделы алгебры, которые используются в information retrieval, и частично в machine learning.
— среди свободных книг на intechweb.org есть и сборники со статьями по machine learning & advanced topics.
— серия Adaptive Computation and Machine Learning у MIT Press

ну и до кучи еще и софт:
mloss.org — сайт посвященный open source machine learning софту
— apache mahout (http://mahout.apache.org) — фреймворк на яве, для кластеризации и классификации данных + рекомендации... Спроектирован для использования вместе с Hadoop, с соответствующей адаптацией алгоритмов
— weka (http://www.cs.waikato.ac.nz/ml/weka/) — тоже фреймворк на яве для data mining & ML.

Комментарии приветствуются...

@alexott:
alexott

from twitter: RT @kweiner Free Ebook: Programming Pig. Use discount code HSPIG until July 1 at t.co #HadoopSummit

@alexott:
alexott

@zabivator на заметку... ailev.livejournal.com