Содержание
Данный пример иллюстрирует применение системы GeoStat.
Шаг 1. Импорт исходных данных
Предположим, вы имеете файл опробования, в котором собраны данные по всем известным пробам. Файл ProbeMet.xls.
В строчках содержится информация по каждой скважине. Помимо номера приводится номер пробы, длина пробы (от и до), содержание некоторых веществ в результате проведения химического анализа.

Рис. 1. Таблица с исходными данными в формате MS Excel
Исходные данные содержатся в таблице в формате .xls. Необходимо импортировать данные для дальнейшей работы в системе GeoStat.
Для корректной и удобной работы в системе, при импортировании в первой строчке таблицы .xls должны находиться названия факторов. См рисунок выше.

Рис. 2. Стартовое окно системы GeoStat
Импорт файла происходит автоматически, пользователю необходимо лишь указать в меню выбора файла источник исходных данных.

Рис. 3. Основное меню системы GeoStat
После импортирования пользователь попадает в Основное меню системы GeoStat. Здесь помимо импортированной информации в верхнем меню находятся инструменты для геостатистического анализа.
Шаг 2. Выбор метода визуального анализа
Следующий этап – статистическая обработка этого массива данных, для того чтобы получить первое представление об его основных свойствах. Рассмотрим инструменты для визуального анализа, доступные в системе GeoStat.

Рис. 4. Меню Визуального анализа
Смотрите на рисунке выше меню Визуальный анализ.
Шаг 3. Выбор переменных и задание параметров
Далее выбираем переменные для анализа и задаем параметры графика (кнопка «Задание параметров»). Содержимое меню задания параметров определяется в зависимости от конкретного типа анализа.

Рис. 5. Меню задания параметров и выбора переменных
Можно указать целый список переменных, когда пользователя интересует сразу несколько графиков на выходе. Выбирая несколько переменных в обоих списках, вы можете получить всевозможные диаграммы рассеяния (между всеми выбранными парами переменных).
Шаг 4. Просмотр результатов и сохранение в отчет
После нажатия на кнопку «Построить график» пользователь перемещается в меню «Просмотр результатов». После просмотра и изучения графиков, можно сохранить график в отчет (меню Файл/Сохранить результат).
Одномерная гистограмма
Аналогичным образом можно построить одномерные и двумерные гистограммы. Гистограммы позволяют определить распределение вещества в пробе. С помощью выбора распределения для подгонки и значений статистических критериев пользователь сможет выбрать наиболее подходящее распределение, описывающее, скажем, содержание золота в руде. См. рисунок ниже.

Рис. 6. Одномерная гистограмма в окне результатов
По гистограмме, например, становится ясно, что чаще всего содержание золота в пробе равно 5-6%.
Красная кривая есть результат подгонки нормального распределения по представленным данным. Выбор функции подгонки доступен в меню Задание параметров.
Диаграмма рассеяния
Диаграммы рассеяния используются при исследовании регрессионной зависимости между содержанием различных химических веществ. В данном примере мы рассмотрим диаграмму рассеяния между содержаниями свинца и цинка.
Красная линия означает кривую подгонки, в данном случае была выбрана линейная регрессия. Однако в меню задания параметров доступны также полиномиальная, экспоненциальная, логарифмическая, подгонка сплайнами и др.
По ней можно судить о зависимости между содержаниями веществ. Уравнение кривой подгонки выводится в заголовке. По нему можно получить количественные результаты зависимости.

Рис. 7. Диаграмма рассеяния свинца и цинка
Также на диаграмме рассеяния выводится коэффициент корреляции и детерминации (R-квадрат). См. значения слева внизу.
Полученный коэффициент корреляции (
) говорит о силе связи между переменными, а соответствующий p-уровень (<0.01) о ее значимости.
При построении диаграмм рассеяния также уместно строить и гистограммы по каждой переменной. Во-первых, гистограмма дает возможность получить распределение признака по каждой переменной, а во-вторых, проверить гипотезу о нормальности для правомерного использования уровня значимости при подсчете коэффициента корреляции.

Рис. 8. Одномерная гистограмма распределения свинца

Рис. 9. Одномерная гистограмма распределения цинка
Если распределение отлично от нормального, необходимо использовать непараметрические методы (расчет коэффициентов Спирмена и гамма доступен в меню задания параметров).
Далее пользователь может сохранить результат в rtf отчет. Для этого необходимо в верхнем меню выбрать Файл/Сохранить результаты.

Рис. 10. Сохранение результатов в системе GeoStat
Диаграмма размаха
Для анализа выбросов и сравнения выборок между собой в системе GeoStat доступны Диаграммы размаха.

Рис. 11. Диаграмма размаха по содержанию химических элементов
Этот график полезен для представления распределений переменных, которые он описывает с помощью следующих трех компонент:
-
Центральная точка или линия указывает на положение центральной области (т.е. на среднее или медиану);
-
Прямоугольник указывает на характер изменчивости вокруг центрального положения (т.е. квартили, стандартные ошибки или стандартные отклонения);
-
Отрезки вокруг прямоугольников указывают на диапазон значений переменной [например, размахи, стандартные отклонения, умноженные на 1.96 стандартные отклонения (95%-й доверительный интервал), умноженные на 1.96 стандартные ошибки среднего (95%-й доверительный интервал)].
Из графика вы видите, что медианы в группах существенно различаются. Медиана – это такое значение выборки, для которого 50% наблюдений меньше, а 50% наблюдений больше. По сути, обнаруженное различие в медианах говорит о неоднородности признаков.
Также данный график позволяет определять выбросы (точки отмечены «кружочками») – значения нетипичные для выборки. Возможно, что при извлечении или анализе проб произошла ошибка, которая привела к существенным отклонениям в показаниях.
3М графики поверхности
Для создания различных типов трехмерных (3М) графиков, где расположение точек данных определяется тремя координатами, используются 3М графики поверхности.
Обычно при построении подобных графиков требуется пространственные координаты проб. Поэтому в качестве исходных данных используем другие данные.

Рис. 12. Основное меню системы GeoStat с выгруженными исходными данными
Проводится анализ данных, полученных при бурении 100 (поле 10 на 10) скважин на глубину до 1000 метров.
Переменные X и Y условно кодируют координату скважины на поверхности, переменная Z – глубину скважины. Проба грунта снималась каждые 50 метров и анализировалась по следующим параметрам:
-
BK – боковой каротаж. Измерение удельного электрического сопротивления горных пород.
-
DT – акустический каротаж. Измерение интервального времени пробега продольной звуковой волны.
-
GR – гамма-метод. Регистрация интенсивности естественного гамма-излучения горных пород.
-
NGR – нейтронный гамма-метод. Измерение поглощения и рассеяния нейтронов горными породами.
После этого по комбинации данных показателей делалось заключение (переменная Класс) о структурном составе недр.

Рис. 13. 3М график поверхности акустического каротажа
Данный тип графиков позволяет наглядно демонстрировать распределение того или иного параметра в пространстве. На графике по горизонтальным осям отложены координаты пробы, а по вертикальной – DT – акустический каротаж, измерение интервального времени пробега продольной звуковой волны. Акустический каротаж используется при структурном анализе состава недр.

Рис. 14. 3М график поверхности акустического каротажа
Карты линий уровня
Также при анализе распределения параметра в плоскости используются карты линий уровня. На них откладываются поверхностные координаты проб, а затем строятся линии уровней согласно значениям параметра в имеющихся точках. Различными цветами на графике обозначены различные значения параметра в пробах (например, содержание меди).

Рис. 15. Карты линий уровня по содержанию меди
На приведенном выше графике по 15 пробам построена карта линий уровня. Для ее построения использовался метод наименьших квадратов (опция также задается в меню Задание параметров). Мы видим, что в зоне геологоразведки существует «овражная область» - в центре расположен участок с малым содержанием меди.
Зонные графики
Все типы графиков из этой группы используются для представления последовательностей значений. Наложенный вид этих графиков специально разработан для представления большой категории множеств данных, в которых последовательные переменные представляют части ("порции") целого. В нашем примере это содержание различных веществ в пробе.

Рис. 16. Зонные графики для анализа структурного состава проб
Список литературы
1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003.
2. О. Дюбрюль. Геостатистика в нефтяной геологии, Библиотека нефтяного инжиниринга.
3. Авдонин В.В. и др. Поиски и разведка месторождений полезных ископаемых, М. Фонд «Мир» 2007.
4. В.А. Ермолов. Геология. Часть II. Разведка и геологопромышленная оценка месторождений полезных ископаемых. М: МГГУ, 2005
5. Ю.А.Капутин. Горные компьютерные технологии
Учебники и справочники
1. Справочник по прикладной статистике (под ред. Э.Ллойда, У.Ледермана). – М.: Финансы и статистика, 1990.
2. Ю.А.Розанов. Теория вероятностей, случайные процессы и математическая статистика: Учебник для вузов. – М.: Наука, 1985. – 320 с.
3. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.
4. Электронный учебник на www.statsoft.ru
В начало
Комментарии: