OLAP - это просто! Общие сведения об аналитической обработке в режиме реального времени (OLAP) Программные компоненты, необходимые для доступа к источникам данных OLAP

Возможности 29.11.2021
Возможности

Проблемы аналитики, OLAP, хранилищ данных вызывают все больший интерес у российских ИТ-специалистов. К настоящему времени в нашей компьютерной печати и Интернете опубликовано немало хороших, академичных по способу изложения материалов по этой тематике, в том числе и вводного характера. Мы же предлагаем вашему вниманию статью, в которой сознательно пытаемся объяснить OLAP “на пальцах”, на конкретном примере. Практика показывает, что такое объяснение необходимо и некоторым ИТ-специалистам и особенно конечным пользователям.

Итак, OLAP *1 в первом приближении, “на пальцах”, можно определить как особый способ анализа данных и получения отчетов. Его суть состоит в предоставлении пользователю многомерной таблицы, автоматически суммирующей данные в различных разрезах и позволяющей интерактивно управлять вычислениями и формой отчета. В этой статье будет рассказано о технологии и основных операциях OLAP на примере анализа счетов-фактур предприятия, занятого оптовой торговлей продуктами питания.

*1. OLAP - On-Line Analytical Processing, оперативный анализ данных.

В качестве инструмента будет рассмотрена OLAP-система самого простого и недорогого класса - OLAP-клиент *1. Для примера выбран наиболее простой продукт из числа OLAP-клиентов - “Контур Стандарт” компании Intersoft Lab. (Для наглядности далее в статье общепринятые термины OLAP будут обозначаться жирным шрифтом и сопровождаться англоязычными аналогами.)

*1. Более подробно о классификации OLAP-систем рассказано в статье "OLAP, сделано в России" в PC Week/RE, №3/2001.

Итак, приступим к работе с системой. Для начала потребуется описать Источник данных (data source) - путь к таблице и ее поля. Это задача пользователя, знающего физическую реализацию базы данных. Для конечных пользователей он переводит название таблицы и ее полей в термины предметной области. За “источником данных” стоит локальная таблица, таблица или представление (view) SQL-сервера или хранимая процедура.

Скорее всего в конкретной базе данных счета-фактуры хранятся не в одной, а в нескольких таблицах. Кроме того, часть полей или записей может не использоваться для анализа. Поэтому далее создается Выборка (result set или query), - в которой настраиваются: алгоритм объединения таблиц по ключевым полям, условия фильтрации и набор возвращаемых полей. Назовем нашу выборку “Счета-фактуры” и поместим в нее все поля источника данных “Счета-фактуры”. Таким образом, ИТ-специалист, создавая семантический слой, скрывает физическую реализацию базы данных от конечного пользователя.

Затем настраивается OLAP-отчет. Этим может заняться специалист в предметной области. Сначала поля плоской выборки данных разбиваются на две группы - факты (facts или measures) и измерения (dimensions). Факты - это цифры, а измерения - “разрезы”, в которых будут суммироваться факты. В нашем примере измерениями станут: “Регион”, “Город”, “Покупатель”, “Товар”, “Дата”, а факт будет один - поле “Сумма” счета-фактуры. Для факта нужно выбрать один или несколько алгоритмов агрегации. OLAP способен не только суммировать итоги, но и выполнять более сложные вычисления, вплоть до статистического анализа. При выборе нескольких алгоритмов агрегации будут созданы виртуальные, вычисляемые факты (calculated facts). В примере выбран один алгоритм агрегации - “Сумма”.

Особое свойство OLAP-систем - генерация измерений и данных по старшим временным периодам из даты и автоматическое вычисление итогов по этим периодам. Выберем периоды “Год”, “Квартал” и “Месяц”, при этом данных за каждый день в отчете не будет, но появятся сгенерированные измерения “Год”, “Квартал” и “Месяц”. Назовем отчет “Анализ продаж” и сохраним его. Работа по созданию интерфейса аналитического приложения закончена.

Теперь, ежедневно или ежемесячно запуская этот интерфейс, пользователь будет видеть таблицу и график, в которых счета-фактуры просуммированы по товарам, покупателям и периодам.

Для того чтобы манипуляции с данными были интуитивно понятны, инструментами управления динамической таблицей являются элементы самой таблицы - ее колонки и строки. Пользователь может перемещать их, удалять, фильтровать и выполнять другие OLAP-операции. При этом таблица автоматически вычисляет новые промежуточные и окончательные итоги.


Например, перетащив (операция “move”) колонку “Товар” на первое место, мы получим отчет о сравнении - “Сравнение объемов продаж товаров за год”. Чтобы агрегировать данные за год, достаточно перетащить колонки “Квартал” и “Месяц” в верхнюю часть таблицы - “область неактивных измерений”. Измерения “Квартал” и “Месяц”, перенесенные в эту область, будут закрыты (операция “close dimension”), т. е. исключены из отчета; при этом факты просуммируются за год. Несмотря на то что измерения закрыты, по ним можно задавать конкретные годы, кварталы и месяцы для фильтрации данных (операция “filter”).

Для большей наглядности изменим тип графика, иллюстрирующего OLAP-таблицу, и его расположение на экране.

Углубление в данные (операция “drill down”) позволяет получить более детальные сведения о продажах интересующего нас товара. Щелкнув на знаке “+” напротив товара “Кофе”, мы увидим объемы его продаж в разрезе регионов. Раскрыв регион “Урал”, получим объемы продаж в разрезе городов Уральского региона, углубившись в данные по “Екатеринбургу”, сможем просмотреть данные по оптовым покупателям этого города.

Для установки фильтров можно использовать и открытые измерения. Чтобы сравнить динамику продаж конфет в Москве и Екатеринбурге, установим фильтры на измерения “Товар” и “Город”.

Закроем ненужные измерения и выберем тип графика “Линия”. На получившемся графике можно проследить динамику продаж, оценить сезонные колебания и связь падений и роста сбыта товара в разных городах.

Таким образом, мы убедились, что OLAP-технология позволяет пользователю из одного интерфейса выпустить десятки видов самых разных отчетов, управляя динамической OLAP-таблицей при помощи мыши. Задачей программиста, владеющего таким инструментом, становится не рутинное кодирование отчетных форм, а настройка OLAP-клиента на базы данных. При этом способы управления отчетом интуитивно понятны конечному пользователю.

Действительно, OLAP - это естественное продолжение и развитие идеи электронных таблиц. По сути, визуальный интерфейс OLAP - это тоже электронная таблица (spreadsheet), но оснащенная мощной машиной вычислений и особым стандартом представления данных и управления ими. Более того, некоторые OLAP-клиенты реализованы как add-in к MS Excel. Поэтому миллионная армия “белых воротничков”, уверенно владеющая электронными таблицами, очень быстро осваивает и OLAP-инструменты. Для них это “бархатная революция”, предоставляющая новые возможности, но не сопряженная с необходимостью переучиваться.

Если читатель, прочитав эту статью, не потерял интереса к OLAP, он может обратиться к упомянутым в начале материалам. Сборники таких материалов размещены на ряде сайтов в Интернете, включая сайт Intersoft lab - www.iso.ru. С него можно также скачать демонстрационную версию системы “Контур Стандарт” с описанным в статье примером.

Аналитическая аналитическая обработка (OLAP) - это технология, которая используется для упорядочения баз данных большого бизнеса и поддержки бизнес-аналитики. Базы данных OLAP делятся на один или несколько кубов, и каждый из них организуется администратором куба так, чтобы он соответствовал способу получения и анализа данных, чтобы облегчить создание и использование отчетов сводной таблицы и отчетов сводной диаграммы, которые вам понадобятся.

В этой статье

Что такое бизнес-аналитика?

Бизнес-аналитик часто хочет получить большую картину бизнеса, чтобы просматривать более широкие тенденции на основе агрегированных данных, а также просматривать тенденции с разбивкой на любое количество переменных. Бизнес-аналитика - это процесс извлечения данных из базы данных OLAP и анализа этих данных для получения сведений, которые можно использовать для принятия информированных бизнес-решений и выполнения действий. Например, с помощью OLAP и бизнес-аналитики вы можете ответить на следующие вопросы о бизнес-данных.

    Как общая сумма продаж всех продуктов в 2007 сравнивается с объемом продаж с 2006?

    Как это сравнивается с датой и временем по выгодным периодом за последние пять лет?

    Сколько денег клиенты потратили на 35 в прошлый год и каким образом изменилось это поведение с течением времени?

    Сколько продуктов было продано в двух определенных странах/регионах в этом месяце, в отличие от того же месяца прошлого года?

    Для каждой группы возрастов клиентов Каково разделение рентабельности (как процент маржи, так и итог) по категориям товаров?

    Поиск лучших и нижних продавцов, дистрибьюторов, поставщиков, клиентов, партнеров и клиентов.

Что такое аналитическая обработка в Интернете (OLAP)?

Базы данных OLAP (Online Analytical Processing) упрощают запросы бизнес-аналитики. OLAP - это технология баз данных, оптимизированная для запросов и отчетов, а не для обработки транзакций. Источник данных для OLAP - это оперативные базы данных обработки транзакций (OLTP), которые обычно хранятся в хранилищах данных. Данные OLAP извлекаются из этих исторических данных и объединяются в структуры, которые допускают сложный анализ. Данные OLAP также упорядочиваются иерархически и хранятся в кубах, а не в таблицах. Это сложная технология, использующая многомерные структуры для обеспечения быстрого доступа к данным для анализа. В этой Организации для отчета сводной таблицы или отчета сводной диаграммы можно легко отобразить сводные данные высокого уровня, такие как итоги продаж по всей стране или региону, а также отобразить сведения о сайтах, где продажи особенно велики или слабы.

Базы данных OLAP предназначены для ускорения загрузки данных. Поскольку OLAP-сервер, а не Microsoft Office Excel, вычисляет обобщенные значения, при создании или изменении отчета необходимо отправлять в Excel меньшие данные. Этот подход позволяет работать с большим объемом исходных данных, чем в случае, если данные были организованы в традиционной базе данных, где Excel извлекает все отдельные записи и вычисляет обобщенные значения.

Базы данных OLAP содержат два основных типа данных: меры, которые представляют собой числовые данные, количества и средние значения, которые используются для принятия информированных бизнес-решений, и измерения, которые являются категориями, используемыми для упорядочения этих мер. Базы данных OLAP помогают упорядочить данные с помощью множества уровней детализации, используя те же категории, которые вы знаете для анализа данных.

В следующих разделах каждый компонент подробно описан ниже.

Кубическ Структура данных, объединяющая меры по уровням и иерархиям каждого измерения, которое вы хотите проанализировать. Кубы объединяют несколько измерений, таких как время, география и строки продукта, с итоговыми данными, такими как продажи и запасы. Кубы - это не "Кубы" в строгом математическом смысле, так как они не обязательно имеют одинаковые стороны. Тем не менее, они представляют собой метафору Апт для сложного понятия.

Измерений Набор значений в Кубе, основанных на столбце в таблице фактов куба и который обычно является числовым значением. Меры - это центральные значения в Кубе, которые предварительно обрабатываются, обрабатываются и анализируются. Наиболее распространенными примерами являются продажи, доходы, доходы и затраты.

Member Элемент в иерархии, представляющий один или несколько вхождений данных. Элемент может быть как уникальным, так и неуникальным. Например, 2007 и 2008 представляют уникальные элементы на уровне года измерения времени, в то время как Январь представляет неуникальные элементы на уровне месяца, так как в измерении времени есть более одного января, так как в нем содержатся данные для более чем одного года.

Вычисляемый элемент Элемент измерения, значение которого вычисляется во время выполнения с помощью выражения. Значения вычисляемых элементов могут быть производными от значений других членов. Например, вычисляемый элемент "прибыль" может быть определен путем вычитания значения элемента, а также затрат из значения элемента, продажи.

измерение Набор из одной или нескольких упорядоченных иерархий уровней Куба, которые пользователь понимает и использует как основу для анализа данных. Например, географическое измерение может включать уровни для страны/региона, штат/район и город. Кроме того, измерение времени может включать иерархию с уровнем "год", "квартал", "месяц" и "день". В отчете сводной таблицы или отчете сводной диаграммы каждая иерархия становится набором полей, которые можно разворачивать и сворачивать, чтобы показать более низкие или более высокие уровни.

Иерархия Логическая структура дерева, которая упорядочивает элементы измерения, так что у каждого элемента есть один родительский элемент и ноль или более дочерних элементов. Дочерний элемент - это член более ранней группы в иерархии, непосредственно связанный с текущим членом. Например, в иерархии времени, содержащей уровни квартал, месяц и день, Январь является дочерним элементом Qtr1. Родительский элемент - это член более низкого уровня в иерархии, непосредственно связанный с текущим членом. Родительским значением обычно является консолидация значений всех дочерних элементов. Например, в иерархии времени, содержащей уровни "квартал", "месяц" и "день", Qtr1 является родительским для января.

Уровень В иерархии данные могут быть организованы в более низкие и более высокие уровни детализации, такие как годы, кварталы, месяцы и дневные уровни в иерархии времени.

Функции OLAP в Excel

Получение данных OLAP Вы можете подключаться к источникам данных OLAP точно так же, как и к другим внешним источникам данных. Вы можете работать с базами данных, созданными с помощью служб Microsoft SQL Server OLAP версии 7,0, служб Microsoft SQL Server Analysis Services версии 2000 и Microsoft SQL Server Analysis Services версии 2005, серверных продуктов Microsoft OLAP. Excel также может работать с продуктами OLAP третьих лиц, которые совместимы с OLE-DB для OLAP.

Данные OLAP можно отобразить только в виде отчета сводной таблицы или отчета сводной диаграммы или в функции листа, преобразованной из отчета сводной таблицы, но не в виде диапазон внешних данных. Вы можете сохранять отчеты сводных таблиц OLAP и сводных диаграмм в шаблонах отчетов, а также создавать файлы подключения к данным Office (ODC) для подключения к базам данных OLAP для запросов OLAP. При открытии ODC-файла в Excel отображается пустой отчет сводной таблицы, который готов для размещения.

Создание файлов куба для автономного использования Вы можете создать файл автономного куба (. cub) с подмножеством данных из базы данных сервера OLAP. Автономные файлы куба используются для работы с данными OLAP, если вы не подключены к сети. С помощью куба вы можете работать с большим объемом данных в отчете сводной таблицы или отчете сводной диаграммы, чем в противном случае, и ускорить получение данных. Вы можете создавать файлы Куба только в том случае, если вы используете поставщик OLAP, например Microsoft SQL Analysis Services версии 2005, которая поддерживает эту функцию.

Действия сервера Действие сервера - это необязательная функция, которую администратор куба OLAP может определять на сервере, который использует элемент куба или меру в качестве параметра в запросе для получения сведений в Кубе, или для запуска другого приложения, например браузера. В Excel поддерживается URL-адреса, отчеты, наборы строк, детализация и развертывание подробных серверных действий, но не поддерживает собственный собственный оператор и набор данных.

КПЭ Ключевой показатель эффективности - это особая вычисляемая мера, определенная на сервере, позволяющая отслеживать "ключевые показатели эффективности", в том числе состояние (текущее значение соответствует определенному номеру). и тенденция (значения с течением времени). Когда они отображаются, сервер может отсылать соответствующие значки, похожие на новый значок Excel, чтобы они выстроили выше или ниже уровней состояния (например, для значка остановки), а также раскрутка значения вверх или вниз (например, значок стрелки направления).

Форматирование на сервере Администраторы кубов могут создавать меры и вычисляемые элементы с помощью цветового форматирования, форматирования шрифта и правил условного форматирования, которые могут быть назначены как корпоративное стандартное бизнес-правило. Например, серверный формат для дохода может представлять собой числовой формат валюты, цвет ячейки зеленого цвета, если значение больше или равно 30 000, и красный, если значение меньше 30 000, и стиль шрифта полужирный, если значение меньше 30 000, и при положительном значении - обычный. больше или равно 30 000. Дополнительные сведения можно найти .

Язык интерфейса Office Администратор куба может определять переводы для данных и ошибок на сервере для пользователей, которые должны просматривать сведения сводной таблицы на другом языке. Эта функция определена как свойство соединения с файлом, а региональные параметры компьютера пользователя и страны должны соответствовать языку интерфейса.

Программные компоненты, необходимые для доступа к источникам данных OLAP

Поставщик OLAP Для настройки источников данных OLAP для Excel необходим один из указанных ниже провайдеров OLAP.

    Поставщик Microsoft OLAP В Excel входит драйвер источника данных и клиентское программное обеспечение для доступа к базам данных, созданным с помощью служб Microsoft SQL Server olap версии 7,0, Microsoft SQL Server olap версии 2000 (8,0) и Microsoft SQL Server Analysis services версии 2005 (9,0).

    Сторонние поставщики OLAP Для других продуктов OLAP необходимо установить дополнительные драйверы и клиентское программное обеспечение. Чтобы использовать возможности Excel для работы с данными OLAP, продукт стороннего поставщика должен соответствовать стандарту OLE-DB для OLAP и быть совместимым с Microsoft Office. Для получения сведений об установке и использовании стороннего поставщика OLAP обратитесь к системному администратору или поставщику продукта OLAP.

Базы данных сервера и файлы Куба Клиентское программное обеспечение Excel OLAP поддерживает соединения с двумя типами баз данных OLAP. Если база данных на сервере OLAP доступна в сети, вы можете получать из нее исходные данные прямо из нее. Если у вас есть автономный файл куба, который содержит данные OLAP или файл определение кубов, вы можете подключаться к этому файлу и получать из него исходные данные.

Источники данных Источник данных предоставляет доступ ко всем данным в базе данных OLAP или файле автономного куба. Создав источник данных OLAP, вы можете основывать на нем отчеты и возвращать данные OLAP в Excel в виде отчета сводной таблицы или отчета сводной диаграммы, а также в функции листа, преобразованной из отчета сводной таблицы.

Microsoft Query С помощью Query можно получать данные из внешней базы данных, например Microsoft SQL или Microsoft Access. Для получения данных из сводной таблицы OLAP, связанной с файлом куба, использовать запрос не требуется. Дополнительные сведения .

Различия в функциях OLAP и не-OLAP исходных данных

Если вы работаете с отчетами сводных таблиц и сводными диаграммами из OLAP исходные данные и других типов исходных данных, вы увидите некоторые отличия функций.

Извлечение данных Сервер OLAP возвращает новые данные в Excel при каждом изменении макета отчета. При использовании других типов внешних источников данных вы запрашиваете все исходные данные за один раз или можете задавать параметры для запроса только при отображении разных элементов полей фильтра отчета. Кроме того, у вас есть еще несколько вариантов обновления отчета.

В отчетах, основанных на исходных данных OLAP, параметры поля фильтра отчета недоступны, фоновый запрос недоступен, а параметр оптимизации памяти недоступен.

Примечание: Параметр оптимизации памяти также недоступен для источников данных OLEDB и отчетов сводных таблиц, основанных на диапазоне ячеек.

Типы полей Исходные данные OLAP. поля измерение могут использоваться только как строки (ряды), столбцы (категория) или поля страницы. Поля мер можно использовать только в качестве полей значений. Для других типов исходных данных все поля можно использовать в любой части отчета.

Доступ к подробным данным Для исходных данных OLAP сервер определяет доступные уровни детализации и вычисляет сводные значения, поэтому записи с подробными сведениями, которые составляют суммарные значения, могут быть недоступны. Тем не менее, сервер может предоставить поля свойств, который вы можете отобразить. Другие типы исходных данных не имеют полей свойств, но вы можете отобразить основные сведения для значений полей данных и элементов, а также отобразить элементы без данных.

У полей фильтра отчета OLAP может быть не все элементы, а команда Показать страницы фильтра отчета недоступна.

Первоначальный порядок сортировки Для исходных данных OLAP элементы сначала отображаются в том порядке, в котором они возвращаются OLAP сервером. Вы можете отсортировать или вручную изменить порядок элементов. Для других типов исходных данных элементы нового отчета сначала сортируются по имени элемента в возрастающем порядке.

Ними Серверы OLAP предоставляют обобщенные значения непосредственно для отчета, поэтому невозможно изменить итоговые функции для полей значений. Для других типов исходных данных вы можете изменить статистическую функцию для поля значения и использовать несколько итоговых функций для одного и того же поля значения. Нельзя создавать вычисляемые поля и вычисляемые элементы в отчетах с исходными данными OLAP.

Промежуточных итогов В отчетах с исходными данными OLAP нельзя изменить итоговую функцию для промежуточных итогов. С другими типами исходных данных вы можете изменить итоговые функции для промежуточных итогов и отобразить или скрыть промежуточные итоги для всех полей строк и столбцов.

Для исходных данных OLAP вы можете включить или исключить скрытые элементы при расчете промежуточных и общих итогов. Для других типов исходных данных вы можете включать скрытые элементы полей фильтра отчета в промежуточные итоги, но скрытые элементы в других полях будут исключены по умолчанию.

Работа с OLAP-кубом в MS Excel

1. Получаем разрешение на доступ к OLAP-кубу SQL Server Analysis Services (SSAS)
2. На вашем компьютере должен быть установлен MS Excel 2016 / 2013 / 2010 (можно и MS Excel 2007, но в нем работать не удобно, и совсем бедная функциональность MS Excel 2003)
3. Открываем MS Excel, запускаем мастер настройки соединения с аналитической службой:


3.1 Указываем имя или IP-адрес действующего сервера OLAP (иногда требуется указать номер открытого порта, например, 192.25.25.102:80); используется доменная аутентификация:


3.2 Выбираем многомерную базу данных и аналитический куб (в случае наличия прав доступа к кубу):


3.3 Настройки соединения с аналитической службой будут сохранены в odc-файле на Вашем компьютере:


3.4 Выбираем вид отчета (сводная таблица/график) и указываем место для его размещения:


Если в книге Excel уже создано подключение, то им можно воспользоваться повторно: главное меню «Данные» -> «Существующие подключения» -> выбираем подключение в этой книге -> вставляем сводную таблицу в указанную ячейку.

4. Успешно подключились к кубу, можно приступать к интерактивному анализу данных:


Приступая к интерактивному анализу данных необходимо определить, какие из полей будут участвовать в формировании строк, столбцов и фильтров (страниц) сводной таблицы. В общем случае сводная таблица является трехмерной, и можно считать, что третье измерение расположено перпендикулярно экрану, а мы наблюдаем сечения, параллельные плоскости экрана и определяемые тем, какая «страница» выбрана для отображения. Фильтрацию можно осуществить путем перетаскивания мышью соответствующих атрибутов измерений в область фильтров отчета. Фильтрация ограничивает пространство куба, уменьшая нагрузку на сервер OLAP, поэтому предпочтительнее в первую очередь установить необходимые фильтры . Затем следует размещать атрибуты измерений в областях строк, столбцов и показатели в область данных сводной таблицы.


Каждый раз, когда изменяется сводная таблица, на сервер OLAP автоматически отправляется MDX-инструкция, по исполнении которой возвращаются данные. Чем больше и сложнее объем обрабатываемых данных, рассчитываемых показателей, тем дольше время исполнения запроса. Отменить исполнение запроса можно нажатием клавиши Escape . Последние выполненные операции можно отменить (Ctrl+Z) или вернуть (Ctrl+Y).


Как правило, для наиболее часто используемых сочетаний атрибутов измерений в кубе хранятся заранее рассчитанные агрегированные данные, поэтому время отклика таких запросов несколько секунд. Однако все возможное комбинации агрегаций просчитать невозможно, так как для этого может потребоваться очень много времени и места для хранения. Для исполнения массивных запросов к данным на уровне детализации могут потребоваться значительные вычислительные ресурсы сервера, поэтому время их исполнения может быть продолжительным. После чтения данных с дисковых накопителей сервер помещает их в кэш оперативной памяти, что позволяет последующим таким запросам выполняться мгновенно, поскольку данные будут извлекаться уже из кэша.


Если Вы считаете, что ваш запрос будет часто использоваться и время его исполнения неудовлетворительно, Вы можете обратиться в службу сопровождения аналитических разработок для оптимизации выполнения запроса.


После размещения иерархии в области строк / столбцов возможно скрыть отдельные уровни:


У ключевых атрибутов (реже - для атрибутов выше по иерархии) измерений могут быть свойства - описательные характеристики, которые могут отображаться как во всплывающих подсказках, так и в виде полей:


Если требуется отобразить сразу несколько свойств полей, то можно воспользоваться соответствующим диалоговым списком:


Определяемые пользователем наборы

В Excel 2010 появилась возможность интерактивного создания собственных (определяемых пользователем) наборов из элементов измерения:


В отличие от наборов создаваемых и хранящихся централизованно на стороне куба, пользовательские наборы сохраняются локально в книге Excel и могут использоваться в дальнейшем:


Продвинутые пользователи могут создавать наборы, используя MDX конструкции:


Настройка свойств сводной таблицы

Посредством пункта "Параметры сводной таблицы..." контекстного меню (щелчок правой кнопкой мыши в рамках сводной таблицы) предоставляется возможность настройки сводной таблицы, например:
- вкладка "Вывод", параметр "Классический макет сводной таблицы" - сводная таблица становится интерактивной, можно перетаскивать поля (Drag&Drop);
- вкладка "Вывод", параметр "Показывать элементы без данных в строках" - в сводной таблице будут отображаться пустые строки, не содержащие ни одного значения показателя по соответствующим элементам измерений;
- вкладка "Разметка и формат", параметр "Сохранять форматирование ячеек при обновлении" - в сводной таблице можно переопределить и сохранить формат ячеек при обновлении данных;


Создание сводных диаграмм

Для имеющейся сводной OLAP-таблицы можно создать сводную диаграмму – круговую, линейчатую, гистограмму, график, точечную и другие виды диаграмм:


При этом сводная диаграмма будет синхронизирована со сводной таблицей – при изменении состава показателей, фильтров, измерений в сводной таблице также обновляется сводная таблица.

Создание информационных панелей

Выделим исходную сводную таблицу, скопируем ее в буфер обмена (Ctrl+C) и вставим её копию (Ctrl+V), в которой изменим состав показателей:


Для одновременного управления несколькими сводными таблицами вставим срез (новый функционал, доступный, начиная с версии MS Excel 2010). Подключим наш Slicer к сводным таблицам – щелчок правой кнопкой мыши в рамках среза, выбор в контекстном меню пункта "Подключения к сводной таблице...". Следует отметить, что может быть несколько панелей срезов, которые могут обслуживать одновременно сводные таблицы на разных листах, что позволяет создавать скоординированные информационные панели (Dashboard).


Панели срезов можно настраивать: необходимо выделить панель, затем см. пункты "Размер и свойства...", "Настройки среза", "Назначить макрос" в контекстном меню, активируемого по правому щелку мыши или пункт "Параметры" главного меню. Так, возможно установить кличество столбцов для элементов (кнопок) среза, размеры кнопок среза и панели, определить для среза цветовую гамму и стиль оформления из имеющегося набора (или создать свой стиль), определить собственный заголовок панели, назначить программный макрос, посредством которого можно расширить функционал панели.


Исполнение MDX запроса из Excel

  1. Прежде всего, необходимо выполнить операцию DRILLTHROUGH на каком-нибудь показателе, т.е. спуститься к детализированным данным (детализированные данные отображаются на отдельном листе), и открыть список подключений;
  2. Открыть свойства подключения, перейти на вкладку «Определение»;
  3. Выбрать тип команды по умолчанию, а в поле текста команды разместить заранее подготовленный MDX запрос;
  4. При нажатии кнопки после проверки правильности синтаксиса запроса и наличия соответствующих прав доступа запрос исполнится на сервере, а результат будет представлен в текущем листе в виде обычной плоской таблицы.
    Посмотреть текст MDX-запроса, генерируемого Excel, можно с помощью установки бесплатного дополнения , которое предоставляет также и другие дополнительные функциональные возможности.

Перевод на другие языки

Аналитический куб поддерживает локализацию на русский и английский языки (при необходимости возможна локализация на другие языки). Переводы распространяются на наименования измерений, иерархий, атрибутов, папок, мер, а также элементы отдельных иерархий в случае наличия для них переводов на стороне учетных систем/ хранилища данных. Чтобы сменить язык, необходимо открыть свойства подключения и в строке подключения добавить следующую опцию:
Extended Properties="Locale=1033"
где 1033 - локализация на английский язык
1049 - локализация на русский язык


Дополнительные расширения Excel для Microsoft OLAP

Возможности работы с OLAP-кубами Microsoft возрастут, если использовать дополнительные расширения, например, OLAP PivotTable Extensions, благодаря которому можно пользоваться быстрым поиском по измерению:


сайт 2011-01-11 16:57:00Z Последнее изменение: 2017-10-15 16:33:59Z Возрастная аудитория: 14-70

Первый интерфейс сводных таблиц, называемых также сводными отчеты, был включен в состав Excel еще в 1993м году (версии Excel 5.0). Несмотря на множество полезных функциональных возможностей, он практически не применяется в работе большинством пользователей Excel. Даже опытные пользователи зачастую подразумевают под термином «сводный отчет» нечто построенное с помощью сложных формул. Попробуем популяризировать использование сводных таблиц в повседневной работе экономистов. В статье обсуждаются теоретические основы создания сводных отчетов, даются практические рекомендации по их использованию, а также приводится пример доступа к данным на основе нескольких таблиц.

Термины многомерного анализа данных

Большинство экономистов слышали термины «многомерные данные», «виртуальный куб», «OLAP-технологии» и т.п. Но при детальном разговоре обычно выясняется, что почти все не очень представляют, о чем идет речь. То есть люди подразумевают нечто сложное и обычно не имеющее отношение к их повседневной деятельности. На самом деле это не так.

Многомерные данные, измерения

Можно с уверенностью утверждать, что экономисты практически постоянно сталкиваются с многомерными данными, но пытаются представить их в предопределенном виде с помощью электронных таблиц. Под многомерностью здесь подразумевается возможность ввода, просмотра или анализа одной и той же информации с изменением внешнего вида, применением различных группировок и сортировок данных. Например, план продаж можно проанализировать по следующим критериям:

  • виды или группы товаров;
  • бренды или категории товаров;
  • периоды (месяц, квартал, год);
  • покупатели или группы покупателей;
  • регионы продаж
  • и т.п.

Каждый из приведенных критериев в терминах многомерного анализа данных называется «измерением». Можно сказать, что измерение характеризует информацию по определенному набору значений. Специальным типом измерения многомерной информации являются «данные». В нашем примере данными плана продаж могут являться:

  • объем продаж;
  • цена продажи;
  • индивидуальная скидка
  • и т.п.

Теоретически данные могут также являться стандартным измерением многомерной информации (например, можно сгруппировать данные по цене продажи), но обычно все-таки данные являются специальным типом значений.

Таким образом, можно сказать, что в практической работе экономисты используются два типа информации: многомерные данные (фактические и плановые числа, имеющие множество признаков) и справочники (характеристики или измерения данных).

OLAP

Аббревиатура OLAP (online analytical processing) в дословном переводе звучит как «аналитическая обработка в реальном времени». Определение не очень конкретное, под него можно подвести практически любой отчет любого программного продукта. По смыслу OLAP подразумевает технологию работы со специальными отчетами, включая программное обеспечение, для получения и анализа как раз многомерных структурированных данных. Одним из популярных программных продуктов, реализующих OLAP-технологии, является SQL Server Analysis Server. Некоторые даже ошибочно считают его единственным представителем программной реализации данной концепции.

Виртуальный куб данных

«Виртуальный куб» (многомерный куб, OLAP-куб) - это специальный термин, предложенный некоторыми поставщиками специализированного программного обеспечения. OLAP-системы обычно готовят и хранят данные в собственных структурах, а специальные интерфейсы анализа (например, сводные отчеты Excel) обращаются к данным этих виртуальных кубов. При этом использование подобного выделенного хранилища совсем не обязательно для обработки многомерной информации. В общем случае, виртуальный куб – это и есть массив специально оптимизированных многомерных данных, который используется для создания сводных отчетов. Он может быть получен как через специализированные программные средства, так и через простой доступ к таблицам базы данных или любой другой источник, например к таблице Excel.

Сводная таблица

«Сводный отчет» (сводная таблица, Pivot Table) - это пользовательский интерфейс для отображения многомерных данных. С помощью данного интерфейса можно группировать, сортировать, фильтровать и менять расположение данных с целью получения различных аналитических выборок. Обновление отчета производится простыми средствами пользовательского интерфейса, данные автоматически агрегируются по заданным правилам, при этом не требуется дополнительный или повторный ввод какой-либо информации. Интерфейс сводных таблиц Excel является, пожалуй, самым популярным программным продуктом для работы с многомерными данными. Он поддерживает в качестве источника данных как внешние источники данных (OLAP-кубам и реляционным базам данных), так и внутренние диапазоны электронных таблиц. Начиная с версии 2000 (9.0), Excel поддерживает также графическую форму отображения многомерных данных – сводная диаграмма (Pivot Chart).

Реализованный в Excel интерфейс сводных таблиц позволяет расположить измерения многомерных данных в области рабочего листа. Для простоты можно представлять себе сводную таблицу, как отчет, лежащий сверху диапазона ячеек (на самом деле есть определенная привязка форматов ячеек к полям сводной таблицы). Сводная таблица Excel имеет четыре области отображения информации: фильтр, столбцы, строки и данные. Измерения данных именуются полями сводной таблицы . Эти поля имеют собственные свойства и формат отображения.

Еще раз хочется обратить внимание, что сводная таблица Excel предназначена исключительно для анализа данных без возможности редактирования информации. Ближе по смыслу было бы повсеместное употребление термина «сводный отчет» (Pivot Report), и именно так этот интерфейс и назывался до 2000го года. Но почему-то в последующих версиях разработчики от него отказались.

Редактирование сводных таблиц

По своему определению OLAP-технология, в принципе, не подразумевает возможность изменения исходных данных при работе с отчетами. Тем не менее, на рынке сформировался целый класс программных систем, реализующих возможности как анализа, так и непосредственного редактирования данных в многомерных таблицах. В основном такие системы ориентированы на решение задач бюджетирования.

Используя встроенные средства автоматизации Excel, можно решить множество нестандартных задач. Пример реализации редактирования для сводных таблиц Excel на основе данных рабочего листа можно найти на нашем сайте.

Подготовка многомерных данных

Подойдем к практическому применению сводных таблиц. Попробуем проанализировать данные о продажах в различных направлениях. Файл pivottableexample.xls состоит из нескольких листов. Лист Пример содержит основную информацию о продажах за определенный период. Для простоты примера будем анализировать единственный числовой показатель – объем продажи в кг. Имеются следующие ключевые измерения данных: продукция, покупатель и перевозчик (транспортная компания). Кроме того, имеются несколько дополнительных измерений данных, являющихся признаками продукта: тип, бренд, категория, поставщик, а также покупателя: тип. Эти данные собраны на листе Справочники. На практике подобных измерений может быть гораздо больше.

Лист Пример содержит стандартное средство анализа данных – автофильтр. Глядя на пример заполнения таблицы, очевидно, что нормальному анализу поддаются данные о продажах по датам (они расположены по столбцам). Кроме того, используя автофильтр можно попробовать просуммировать данные по сочетаниям одного или нескольких ключевых критериев. Совершенно отсутствует информация о брендах, категориях и типах. Нет возможности сгруппировать данные с автоматическим суммированием по определенному ключу (например, по покупателям). Кроме того, набор дат зафиксирован, и просмотреть итоговую информацию за определенный период, например, 3 дня, автоматическими средствами не удастся.

Вообще, наличие предопределенного расположения даты в данном примере – главный недостаток таблицы. Расположив даты по столбцам, мы как бы предопределили измерение этой таблицы, таким образом, лишив себя возможности использовать анализ с помощью сводных таблиц.

Во-первых, надо избавиться от этого недостатка – т.е. убрать предопределенное расположение одного из измерений исходных данных. Пример корректной таблицы – лист Продажи .

Таблица имеет форму журнала ввода информации. Здесь дата является равноправным измерением данных. Также следует заметить, что для последующего анализа в сводных таблицах совершенно безразлично относительное положение строк друг относительно друга (иначе говоря, сортировка). Этими свойствами обладают записи в реляционных базах данных. Именно на анализ больших объемов баз данных ориентирован в первую очередь интерфейс сводных таблиц. Поэтому необходимо придерживаться этих правил и при работе с источником данных в виде диапазонов ячеек. При этом никто не запрещает использовать в работе интерфейсные средства Excel – сводные таблицы анализируют только данные, а форматирование, фильтры, группировки и сортировки исходных ячеек могут быть произвольными.

От автофильтра к сводному отчету

Теоретически на данных листа Продажи уже можно проводить анализ в трех измерениях: товары, покупатели и перевозчики. Данные о свойствах продукции и покупателей на данном листе отсутствуют, что, соответственно, не позволит показать их и в сводной таблице. В нормальном режиме создания сводной таблицы для исходных данных Excel не позволяет связывать данные нескольких таблиц по определенным полям. Обойти это ограничение можно программными средствами – см. пример-дополнение к данной статье на нашем сайте. Чтобы не прибегать к программным методам обработки информации (тем более, что они и не универсальны), следует добавить дополнительные характеристики непосредственно в форму ввода журнала – см. лист ПродажиАнализ.

Применение функций VLOOKUP позволяет легко дополнить исходные данные недостающими характеристиками. Теперь, применяя автофильтр, можно анализировать данные в различных измерениях. Но остается нерешенной проблема группировок. Например, отследить сумму только по брендам на определенные даты достаточно проблематично. Если ограничиваться формулами Excel, то нужно строить дополнительные выборки, используя функцию SUMIF.

Теперь посмотрим какие возможности дает интерфейс сводных таблиц. На листе СводАнализ построено несколько отчетов на основе диапазона ячеек с данными листа ПродажиАнализ .

Первая таблица анализа построена через интерфейс Excel 2007 Лента \ Вставка \ Сводная таблица (в Excel 2000-2003 меню Данные \ Сводная таблица ).

Вторая и третья таблицы созданы через копирование и последующую настройку. Источник данных для всех таблиц один и тот же. Можете это проверить, изменив исходные данные, затем надо обновить данные сводных отчетов.

С нашей точки зрения, преимущества в наглядности информации очевидны. Вы можете менять местами фильтры, столбцы и строки и, скрывать определенные группы значений любых измерений, применять ручное перетаскивание и автоматическую сортировку.

Свойства и форматирование

Кроме непосредственного отображения данных, имеется большой набор возможностей по отображению внешнего вида сводных таблиц. Лишние данные можно скрывать, используя фильтры. Для единичного элемента или поля проще пользоваться пунктом контекстного меню Удалить (в версии 2000-2003 Скрыть ).

Задавать отображение других элементов сводной таблицы также желательно не через форматирование ячейки, а через настройку поля или элемента сводной таблицы. Для этого необходимо подвести указатель мыши к нужному элементу, дождаться появления специальной формы курсора (в виде стрелки), затем через одинарный клик выделить выбранный элемент. После выделения можно изменять вид через ленту, контекстное меню или вызывать стандартный диалог формата ячейки:

Кроме того, в Excel 2007 появилось множество предопределенных стилей отображения сводной таблицы:

Обратите внимание, что в диаграмме активны управляющие фильтры и области перетаскивания.

Доступ к внешним данным

Как уже отмечалось, пожалуй, наибольший эффект от применения сводных таблиц можно получить при доступе к данным внешних источников – OLAP-кубам и запросам к базам данных. Такие источники обычно хранят большие объемы информации, а также имеют предопределенную реляционную структуру, что позволяет легко определить измерения многомерных данных (поля сводной таблицы).

Excel поддерживает множество типов источников внешних данных:

Наибольшего эффекта от использования внешних источников информации можно добиться, применяя средства автоматизации (программы VBA) как для получения данных, так и для их предварительной обработки в сводных таблицах.



Рекомендуем почитать

Наверх