Исходя из моего опыта, российским компаниям пора прийти к пониманию того, что анализ Big Data — или больших данных — (датамайнинг) является обязательным инструментом для повышения эффективности бизнеса. Ключевое условие для этого — понятная модель рынка датамайнинга.

Давайте сначала точно определим суть анализа данных или датамайнинга. Ключевая задача этого инструмента — выявить среди данных компании ранее неизвестные, нетривиальные, практически полезные и доступные интерпретации знания. Иначе говоря, датамайнинг — это выявление скрытой полезности, которая приносит прибыль, уменьшает издержки, привлекает клиентов, помогает обойти конкурентов и т.д.

Ценность датамайнинга заключается в специфике данных и возможности извлечь максимум из них. Как не может быть двух одинаковых компаний, так и не может быть у них, соответственно, двух одинаковых алгоритмов.

На мой взгляд, сейчас есть три главных сдерживающих фактора развития датамайнинга: слабая прогнозируемость результатов, непрогнозируемые сроки и стоимость.

Дело в том, что специализированные программные решения для анализа больших данных, создаваемые крупными IT-корпорациями (IBM, Oracle, SAP и другими), дорого стоят и требуют специалистов по работе с ними. Кроме того, у любого датамайнерского софта есть главный недостаток — он априори универсален, что не дает ему возможность учесть специфические особенности данных конкретного клиента. И вот именно для этого нужен специально подготовленный человек, а именно — датамайнер.

РИА Новости digit.ru/.../412937632.html


Please, sign up or sign in to leave a comment.