Визуальный анализ данных опробования скважин в системе GeoStat

Опубликовал: pvi777 в категорию Геологоразведка - Дата добавления: 28.09.2023, 08:14


Содержание

Данный пример иллюстрирует применение системы GeoStat.

Шаг 1. Импорт исходных данных

Предположим, вы имеете файл опробования, в котором собраны данные по всем известным пробам. Файл ProbeMet.xls.

В строчках содержится информация по каждой скважине. Помимо номера приводится номер пробы, длина пробы (от и до), содержание некоторых веществ в результате проведения химического анализа.

Таблица с исходными данными в формате MS Excel

Рис. 1. Таблица с исходными данными в формате MS Excel

Исходные данные содержатся в таблице в формате .xls. Необходимо импортировать данные для дальнейшей работы в системе GeoStat.

Для корректной и удобной работы в системе, при импортировании в первой строчке таблицы .xls должны находиться названия факторов. См рисунок выше.

Стартовое окно системы GeoStat

Рис. 2. Стартовое окно системы GeoStat

Импорт файла происходит автоматически, пользователю необходимо лишь указать в меню выбора файла источник исходных данных. 

Основное меню системы GeoStat

Рис. 3. Основное меню системы GeoStat

После импортирования пользователь попадает в Основное меню системы GeoStat. Здесь помимо импортированной информации в верхнем меню находятся инструменты для геостатистического анализа. 

Шаг 2. Выбор метода визуального анализа

Следующий этап – статистическая обработка этого массива данных, для того чтобы получить первое представление об его основных свойствах. Рассмотрим инструменты для визуального анализа, доступные в системе GeoStat

Меню Визуального анализа

Рис. 4. Меню Визуального анализа

Смотрите на рисунке выше меню Визуальный анализ.

Шаг 3. Выбор переменных и задание параметров

Далее выбираем переменные для анализа и задаем параметры графика (кнопка «Задание параметров»). Содержимое меню задания параметров определяется в зависимости от конкретного типа анализа.

Меню задания параметров и выбора переменных

Рис. 5. Меню задания параметров и выбора переменных 

Можно указать целый список переменных, когда пользователя интересует сразу несколько графиков на выходе. Выбирая несколько переменных в обоих списках, вы можете получить всевозможные диаграммы рассеяния (между всеми выбранными парами переменных).

Шаг 4. Просмотр результатов и сохранение в отчет

После нажатия на кнопку «Построить график» пользователь перемещается в меню «Просмотр результатов». После просмотра и изучения графиков, можно сохранить график в отчет (меню Файл/Сохранить результат).

Одномерная гистограмма

Аналогичным образом можно построить одномерные и двумерные гистограммы. Гистограммы позволяют определить распределение вещества в пробе. С помощью выбора распределения для подгонки и значений статистических критериев пользователь сможет выбрать наиболее подходящее распределение, описывающее, скажем, содержание золота в руде. См. рисунок ниже. 

Одномерная гистограмма в окне результатов

Рис. 6. Одномерная гистограмма в окне результатов 

По гистограмме, например, становится ясно, что чаще всего содержание золота в пробе равно 5-6%.

Красная кривая есть результат подгонки нормального распределения по представленным данным. Выбор функции подгонки доступен в меню Задание параметров.

Диаграмма рассеяния

Диаграммы рассеяния используются при исследовании регрессионной зависимости между содержанием различных химических веществ. В данном примере мы рассмотрим диаграмму рассеяния между содержаниями свинца и цинка. 

Красная линия означает кривую подгонки, в данном случае была выбрана линейная регрессия. Однако в меню задания параметров доступны также полиномиальная, экспоненциальная, логарифмическая, подгонка сплайнами и др. 

По ней можно судить о зависимости между содержаниями веществ. Уравнение кривой подгонки выводится в заголовке. По нему можно получить количественные результаты зависимости. 

Диаграмма рассеяния свинца и цинка

Рис. 7. Диаграмма рассеяния свинца и цинка

Также на диаграмме рассеяния выводится коэффициент корреляции и детерминации (R-квадрат). См. значения слева внизу.

Полученный коэффициент корреляции (r=0.6041) говорит о силе связи между переменными, а соответствующий p-уровень (<0.01) о ее значимости.

При построении диаграмм рассеяния также уместно строить и гистограммы по каждой переменной. Во-первых, гистограмма дает возможность получить распределение признака по каждой переменной, а во-вторых, проверить гипотезу о нормальности для правомерного использования уровня значимости при подсчете коэффициента корреляции.

Одномерная гистограмма распределения свинца

Рис. 8. Одномерная гистограмма распределения свинца

Одномерная гистограмма распределения цинка

Рис. 9. Одномерная гистограмма распределения цинка 

Если распределение отлично от нормального, необходимо использовать непараметрические методы (расчет коэффициентов Спирмена и гамма доступен в меню задания параметров).

Далее пользователь может сохранить результат в rtf отчет. Для этого необходимо в верхнем меню выбрать Файл/Сохранить результаты.

Сохранение результатов в системе GeoStat

Рис. 10. Сохранение результатов в системе GeoStat

Диаграмма размаха

Для анализа выбросов и сравнения выборок между собой в системе GeoStat доступны Диаграммы размаха.

Диаграмма размаха по содержанию химических элементов

Рис. 11. Диаграмма размаха по содержанию химических элементов

Этот график полезен для представления распределений переменных, которые он описывает с помощью следующих трех компонент:

  1.  Центральная точка или линия указывает на положение центральной области (т.е. на среднее или медиану);

  2.  Прямоугольник указывает на характер изменчивости вокруг центрального положения (т.е. квартили, стандартные ошибки или стандартные отклонения);

  3.  Отрезки вокруг прямоугольников указывают на диапазон значений переменной [например, размахи, стандартные отклонения, умноженные на 1.96 стандартные отклонения (95%-й доверительный интервал), умноженные на 1.96 стандартные ошибки среднего (95%-й доверительный интервал)].

Из графика вы видите, что медианы в группах существенно различаются. Медиана – это такое значение выборки, для которого 50% наблюдений меньше, а 50% наблюдений больше. По сути, обнаруженное различие в медианах говорит о неоднородности признаков. 

Также данный график позволяет определять выбросы (точки отмечены «кружочками») – значения нетипичные для выборки. Возможно, что при извлечении или анализе проб произошла ошибка, которая привела к существенным отклонениям в показаниях.

3М графики поверхности

Для создания различных типов трехмерных (3М) графиков, где расположение точек данных определяется тремя координатами, используются 3М графики поверхности.

Обычно при построении подобных графиков требуется пространственные координаты проб. Поэтому в качестве исходных данных используем другие данные.

Основное меню системы GeoStat с выгруженными исходными данными

Рис. 12. Основное меню системы GeoStat с выгруженными исходными данными

Проводится анализ данных, полученных при бурении 100 (поле 10 на 10) скважин на глубину до 1000 метров. 

Переменные X и Y условно кодируют координату скважины на поверхности, переменная Z – глубину скважины. Проба грунта снималась каждые 50 метров и анализировалась по следующим параметрам: 

  1.  BK – боковой каротаж. Измерение удельного электрического сопротивления горных пород.

  2.  DT – акустический каротаж. Измерение интервального времени пробега продольной звуковой волны.

  3.  GR – гамма-метод. Регистрация интенсивности естественного гамма-излучения горных пород.

  4.  NGR – нейтронный гамма-метод. Измерение поглощения и рассеяния нейтронов горными породами.

После этого по комбинации данных показателей делалось заключение (переменная Класс) о структурном составе недр.

3М график поверхности акустического каротажа

Рис. 13. 3М график поверхности акустического каротажа 

Данный тип графиков позволяет наглядно демонстрировать распределение того или иного параметра в пространстве. На графике по горизонтальным осям отложены координаты пробы, а по вертикальной – DT – акустический каротаж, измерение интервального времени пробега продольной звуковой волны. Акустический каротаж используется при структурном анализе состава недр.

3М график поверхности акустического каротажа

Рис. 14. 3М график поверхности акустического каротажа

Карты линий уровня

Также при анализе распределения параметра в плоскости используются карты линий уровня. На них откладываются поверхностные координаты проб, а затем строятся линии уровней согласно значениям параметра в имеющихся точках. Различными цветами на графике обозначены различные значения параметра в пробах (например, содержание меди). 

Карты линий уровня по содержанию меди

Рис. 15. Карты линий уровня по содержанию меди

На приведенном выше графике по 15 пробам построена карта линий уровня. Для ее построения использовался метод наименьших квадратов (опция также задается в меню Задание параметров). Мы видим, что в зоне геологоразведки существует «овражная область» - в центре расположен участок с малым содержанием меди.

Зонные графики

Все типы графиков из этой группы используются для представления последовательностей значений. Наложенный вид этих графиков специально разработан для представления большой категории множеств данных, в которых последовательные переменные представляют части ("порции") целого. В нашем примере это содержание различных веществ в пробе.

Зонные графики для анализа структурного состава проб

Рис. 16. Зонные графики для анализа структурного состава проб

Список литературы

1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003.

2. О. Дюбрюль. Геостатистика в нефтяной геологии, Библиотека нефтяного инжиниринга.

3. Авдонин В.В. и др. Поиски и разведка месторождений полезных ископаемых, М. Фонд «Мир» 2007.

4. В.А. Ермолов. Геология. Часть II. Разведка и геологопромышленная оценка месторождений полезных ископаемых. М: МГГУ, 2005 

5. Ю.А.Капутин. Горные компьютерные технологии

Учебники и справочники

1. Справочник по прикладной статистике (под ред. Э.Ллойда, У.Ледермана). – М.: Финансы и статистика, 1990. 

2. Ю.А.Розанов. Теория вероятностей, случайные процессы и математическая статистика: Учебник для вузов. – М.: Наука, 1985. – 320 с.

3. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.

4. Электронный учебник на www.statsoft.ru

В начало



Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты