Мандель И.Д. Кластерный анализ

Опубликовал: pvi777 в категорию Материалы по моделям и методам анализа данных - Дата добавления: 16.12.2018, 18:50


Данная книга посвящена как раз одному из наиболее обещающих в указанном смысле подходов к анализу многомерных процессов и явлений — кластер-анализу.

Кластер-анализ — это способ группировки многомерных объектов, основанный на представлении результатов отдельных наблюдений точками подходящего геометрического пространства с последующим выделением групп как «гсгустков» этих точек. Собственно, «кластер» (cluster) в английском языке и означает «сгусток», «гроздь (винограда)», «скопление (звезд)» и т. п. Этот термин необыкновенно удачно вписался в научную терминологию, поскольку его первый слог соответствует традиционному термину «класс», а второй как бы указывает на его искусственное происхождение. Мы не сомневаемся в том, что терминология кластерного анализа заменит все ранее использовавшиеся для этой цели конструкции (распознавание образов без учителя, стратификация, таксономия, автоматическая классификация и т. п.). Очевидны потенциальные возможности кластерного анализа для решения, скажем, проблем выделения групп предприятий, действующих в сходных условиях или с похожими результатами, однородных групп населения по различным аспектам жизнедеятельности или образа жизни в целом и т.п.

Как научное направление кластер-анализ заявил о себе в середине 60-х годов и с тех пор бурно развивается, являясь одной из ветвей наиболее интенсивного роста статистической науки. Достаточно сказать, что только число монографий по кластерному анализу, изданных к настоящему времени в разных странах, измеряется сотнями (тогда как, скажем, по такому «заслуженному» методу многомерного статистического анализа, как факторный анализ, едва ли удастся насчитать несколько десятков книг). И это вполне понятно. Ведь речь идет фактически о моделировании операции группирования, одной из важнейших не только в статистике, но и вообще — и в познании, и в принятии решений.

В нашей стране опубликован ряд монографий, посвященных исследованию конкретных социально-экономических проблем с использованием кластер-анализа, методологии использования кластер-анализа в социально-экономических исследованиях, методологии кластер-анализа как такового.

Предлагаемая книга И. Д. Манделя как бы перпендикулярна данной классификации: ее содержание связано с каждым из указанных трех направлений.

Цель книги — подытожить современное состояние кластерного анализа, проанализировать возможности его использования и задачи дальнейшего развития. Этот замысел сам по себе не может не вызвать уважения: непредвзятые анализ и обобщение требуют большого труда, эрудиции, смелости, а оцениваются научной общественностью значительно ниже, чем выдвижение и разработка собственных конструкций. (Впрочем, книга содержит и оригинальные разработки автора, связанные с «интенсиональным» анализом и двойственностью классификаций.)

С реализацией указанной цели связаны и достоинства книги, и ее недостатки. К достоинствам следует отнести:

методологическую проработку понятий однородности, группировки и классификации с учетом многомерности явлений и процессов;

систематизированный обзор подходов и методов кластер-анализа (включающий до 150 конкретных алгоритмов);

изложение технологии и результатов экспериментального сравнения процедур кластер-анализа; Данная книга посвящена как раз одному из наиболее обещающих в указанном смысле подходов к анализу многомерных процессов и явлений — кластер-анализу.

Кластер-анализ — это способ группировки многомерных объектов, основанный на представлении результатов отдельных наблюдений точками подходящего геометрического пространства с последующим выделением групп как «сгустков» этих точек. Собственно, «кластер» (cluster) в английском языке и означает «сгусток», «гроздь (винограда)», «скопление (звезд)» и т.п. Этот термин необыкновенно удачно вписался в научную терминологию, поскольку его первый слог соответствует традиционному термину «класс», а второй как бы указывает на его искусственное происхождение. Мы не сомневаемся в том, что терминология кластерного анализа заменит все ранее использовавшиеся для этой цели конструкции (распознавание образов без учителя, стратификация, таксономия, автоматическая классификация и т.п.). Очевидны потенциальные возможности кластерного анализа для решения, скажем, проблем выделения групп предприятий, действующих в сходных условиях или с похожими результатами, однородных групп населения по различным аспектам жизнедеятельности или образа жизни в целом и т.п.

Как научное направление кластер-анализ заявил о себе в середине 60-х годов и с тех пор бурно развивается, являясь одной из ветвей наиболее интенсивного роста статистической науки. Достаточно сказать, что только число монографий по кластерному анализу, разработку общих схем использования методов кластер-анализа, реализованных в достаточно наглядных таблицах; рекомендательный характер изложения.

Эти достоинства определяют самостоятельное место книги И. Д. Манделя среди других изданий.

Недостатки книги — неоднозначность некоторых рекомендаций и отсутствие систематического анализа вопросов использования методов кластер-анализа в предметных социально-экономических приложениях. Правда, последнее обусловливается недостаточным применением кластер-анализа в этой области.

Книга дает плацдарм, использование которого облегчает продвижение в самом трудном вопросе любой теории — практическом использовании даваемого ею инструментария.


Скачать:


  • Теги:

Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты