Руководство пользователя
Процент строк подвыборки
Процент строк подвыборки позволяет просматривать случайное подмножество данных и обеспечивает более управляемый размер данных. Это будет полезно, если вам нужно выбрать размер большого набора данных. Вы также можете использовать этот анализ, чтобы уменьшить размер данных для подключенного слоя карты, когда вы определяете рабочий процесс анализа. Это делает ваши данные более управляемыми и повышает производительность.
В фоновом режиме процент строк случайным образом применяется к базовому слою. Результат отображает набор строк из выбранного слоя карты.
В этом руководстве давайте рассмотрим сообщения о преступной деятельности вокруг полицейских участков в Чикаго. Существует большое количество данных о преступности, поэтому давайте выберем и визуализируем только 10% данных о преступности.
Произвольное уменьшение размера набора данных
-
Чтобы визуализировать данные, загрузите файл шаблона и импортируйте его в свою учетную запись. Конструктор открывается с «Преступлений» (Crimes) в качестве первого слоя карты и «Полицейских участков» (Police Stations) в качестве второго слоя карты.
На карте есть несколько виджетов, позволяющих фильтровать данные о преступлениях. Подробные сведения о том, как создавать виджеты, см. в руководствах по виджетам.
-
В списке «СЛОИ» кликните по слою Crimes.
-
Чтобы добавить анализ к слою, нажмите на вкладку «АНАЛИЗ».
-
Примените анализ Процент строк подвыборки.
-
БАЗОВЫЙ СЛОЙ - это выбранный слой, источник A0.
-
Оставьте «% ДАННЫХ» по умолчанию равным
10
.
-
Нажмите ПРИМЕНИТЬ.
-
Результатом является выборка ваших исходных данных, которая была выбрана случайным образом для отображения примерно 10% строк из набора данных «Преступления».
Просмотр данных о преступлениях с помощью виджетов
Если вы нажмете на список «ВИДЖЕТЫ», обратите внимание, что виджеты по-прежнему фильтруют весь набор данных о преступлениях, A0 Crime
.
Если вы хотите отфильтровать только выборочные данные, вы можете добавить новый виджет для фильтрации по результатам анализа, A1 Subsample
.
Ограничения
Этот анализ имеет ограничение на время, необходимое для выполнения анализа. Если анализ занимает более 5 минут, Epsilon Metrics выдаст ошибку тайм-аута.
Внешние ресурсы
Если вы заинтересованы в использовании базовых функций в SQL конструкторе, ознакомьтесь с документацией PostgreSQL random()
о математических функциях.