18 окт. 2012 г.

Pattern для любого датамайнинга на python

Речь сегодня пойдет о Pattern - модуле-комбаине для датамайнинга по разным "стихиям" (web, db, text analysis и пр.).
Самый, ожидаемо-популярный в Pattern пакет, как мне кажется, - web (документация). Он умеет возвращать, например, результаты поиска по поисковым системам Google, Bing, Yahoo. Также умеет искать в Twitter и Flickr.
Библиотека очень объемная, в том числе и потом, что включает некоторые другие библиотеки удобно используемые для решения задач Pattern'а.
В научной работе выделяют 2 взгляда на пользу научных изысканий: изобретение нового и обощения опыта в уже открытом. Программисты традиционно стремятся изобретать все с нуля, поэтому любой пакет обединяющий старый признанный опыт как глоток свежего воздуха.
Отправить комментарий