Text Mining Series - Automatically Classify Text Documents

Просмотры: 0 Добавил: pvi777 StatSoft Statistica 
Описание материала:

In this case study, there is a need to automatically classify text documents based on their content. Currently, the text articles are manually read and acted upon. Our goal is to automate as much as possible with a predictive model sorting the text files. Articles related to financial earnings should be flagged for review and sent to the appropriate individuals. In this video, we explore how STATISTICA Text Miner can be used to explore and index the text. The Text Mining results are used to build a predictive model to flag financial articles for review. Then the results are deployed to new articles as they become available. The video gives an overview of this analysis to show the possibilities available with Text Mining.

This video uses graphing and data mining techniques, which are covered in depth in other instructional videos. The following videos may also be of interest:

Getting Started With STATISTICA --Graphing: http://youtu.be/ac7BoV87cy8
Introduction to Data Mining -- Variable screening: http://youtu.be/XOLouxpuIOk
Introduction to Data Mining -- C&RT for Classification: http://youtu.be/f0eCYQY4gcQ
Introduction to Data Mining -- Exploring Model Lift and Gains: http://youtu.be/i1R33b1WTro
Introduction to Data Mining -- Model Deployment and Scoring: http://youtu.be/LDoQVbWpgKY

Want to be notified when new text mining videos are added? Visit http://www.statsoft.com/l/text-mining....

Язык: Русский


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.