Руководство пользователя

Руководство пользователя

Прогноз тенденций и волатильность

В этом руководстве описывается, как пользоваться прогнозированием тенденций и анализом волатильности (также известным как пространственный Марков). Этот анализ рассматривает последовательность значений (например, цен на жилье), равномерно распределенных во времени, и прогнозирует, будет ли будущая стоимость в том же месте увеличиваться, уменьшаться или оставаться неизменной.

В отличие от типичных цепей Маркова, этот анализ использует историю соседних географических регионов, чтобы помочь спрогнозировать будущее любой географии, а также историю значения географии. Например, если в географии есть история отставания цен по сравнению с ее соседями, эта информация фиксируется и ограничивает прогнозы, чтобы дать более точную картину, чем без пространственной информации.

Пример

Используя исторический набор данных о доходе на душу населения в Соединенных Штатах, мы можем делать прогнозы относительно вероятности того, что в каком-либо штате будет более высокий, более низкий или статичный доход на душу населения.

  1. Чтобы визуализировать данные, загрузите файл шаблона и импортируйте его в свою учетную запись. Откроется конструктор с «Тенденциями доходов на душу населения» (Per Capita Income Trends) в качестве первого и единственного слоя карты. Подключенный набор данных содержит значения с 1929 по 2010 год для нижних 48 штатов США.

  2. Кликните по слою карты «Тенденции доходов на душу населения» и измените визуализацию на режим просмотра данных, чтобы перед применением анализа вы могли проверить значения в столбцах.

    data_view

  3. Вернитесь в режим просмотра карты и нажмите на вкладку «АНАЛИЗ».

  4. Добавьте Прогнозирование тенденций и анализ волатильности и примените следующие параметры:

    1. Что касается «ВХОДНЫХ СТОЛБЦОВ» установите флажок для столбцов с y1929 по y2009. Вы можете выбрать «ВСЕ», чтобы выбрать все столбцы, и отменить выбор столбцов, которые вам не нужны.
      select_years
    2. Нажмите «ПРИМЕНИТЬ». Анализ добавляет четыре новых столбца в ваш набор данных.
      analysis_results
  5. Нажмите «СТИЛЬ ЭТОГО АНАЛИЗА», чтобы оформить данные для лучшего понимания прогнозов.

    1. На вкладке «СТИЛЬ» слоя «Тенденции дохода на душу населения» нажмите на параметр «По значению» для «ЦВЕТА МНОГОУГОЛЬНИКА».
    2. Выберите trend.
      by_value

Применяется цветовая схема по умолчанию. Из результатов этого анализа становится ясно, что штаты на более розовом конце цветовой схемы имеют больше шансов увеличить доход на душу населения. Это, вероятно, связано с тем, что многие из этих штатов находятся в самом низком квартиле по доходу на душу населения, поэтому, скорее всего, они будут двигаться вверх.

Добавление виджетов и всплывающих информационных окон

Результатом этого анализа являются столбцы, которые дают вероятности тенденций (trend, trend_up, trend_down) и volatility, представляющая собой дисперсию всех возможных вариантов вероятности внутренней тенденции для географии.

Давайте добавим эти значения столбцов в виде виджетов и всплывающих информационных окон на нашу карту, чтобы дальше исследовать наши данные.

Значение столбца Описание
Тенденции (trends) Задайте статистику распределения вероятностей. Система изменяется случайным образом, поэтому обычно невозможно с уверенностью предсказать состояние цепи Маркова в данный момент в будущем. Однако статистические свойства будущего системы можно спрогнозировать. Во многих случаях важны именно эти статистические свойства.
Изменения состояния ряда событий называются переходами, а вероятности, связанные с различными изменениями состояний, называются переходными вероятностями. Набор всех состояний и переходных вероятностей полностью характеризует цепь Маркова. По соглашению мы предполагаем, что все возможные состояния и переходы включены в определение процессов, поэтому всегда есть следующее состояние. Этот переход суммы вероятностей, направленных вверх (относительно единичного индекса этой вероятности), задается trend_up, тенденция вниз задается trend_down и общая тенденция (с направлением, обозначенным предшествующими знаками) задается trend.
Волатильность (volatility) Степень вариации данных серии событий во времени, измеряемая стандартным отклонением вероятностей в тенденциях.
  1. В слое карты «Тенденции дохода на душу населения» нажмите на вкладку «ДАННЫЕ», чтобы получить доступ к параметрам ярлыка виджета.

  2. Установите флажок рядом с «Добавить как виджет» для столбцов trend, trend_up, trend_down и volatility.

    by_value

  3. Отредактируйте сведения о виджете, чтобы переименовать их на карте, как показано на следующем рисунке.

    add_widgets

Изменение цветовой схемы

Существует несколько картографических улучшений, которые можно применить в зависимости от того, как вы хотите отображать свои данные. Для выходных данных тенденции эти значения обычно центрируются вокруг нуля и становятся положительными или отрицательными. В этом случае оптимальным выбором будет расходящаяся цветовая схема.

ПАМЯТКА: ЦВЕТОВЫЕ СХЕМЫ

Выбор правильных цветов для ваших данных помогает рассказывать истории, вовлекает читателя карты и визуально помогает зрителю обнаружить интересные закономерности, которые в противном случае могут быть упущены. При стилизации по значению отображаются разные типы цветовых схем в зависимости от выбранного столбца данных из слоя карты. Конструктор предоставит вам схемы CARTOColor и ColorBrewer, а также позволяет настраивать собственные цветовые схемы.

  • Последовательная схема: Цветовые схемы, использующие вариации яркости, делают их идеальными для отображения упорядоченных или числовых данных. Вариации прогрессируют от низкого к высокому, используя цвета от светлого до темного (или наоборот).

  • Качественная схема: Цветовые схемы, демонстрирующие категориальные различия в качественных данных, в которых используются разные оттенки с последовательными шагами яркости и насыщенности.

  • Расходящаяся схема: Цветовые схемы, которые выделяют значения выше и ниже интересующей средней точки количественных данных. Средний цвет назначается критическому значению, а две последовательные палитры типов на каждом конце назначаются значениям выше или ниже.

color_scheme

В других случаях лучшим выбором может быть последовательная цветовая схема, где самый жирный цвет представляет более высокие значения. Это также полезно, если вы используете более светлую базовую карту. При использовании более темной базовой карты инвертируйте цветовую схему.

Ограничения

Этот анализ имеет ограничение на время, необходимое для выполнения анализа. Если анализ занимает более 5 минут, Epsilon Metrics выдаст ошибку тайм-аута.

Дополнительные ресурсы

Пространственный Марков в PySAL