Регрессионный анализ в excel. подробная иллюстрированная инструкция
Содержание:
- Надстройка «Анализ данных» в Экселе
- Теоретическое отступление
- Загрузка пакета анализа в Excel
- Надстройка Пакет анализа MS EXCEL
- 3D-карты
- Как рассчитать коэффициент вариации в Эксель
- Определение и вычисление множественного коэффициента корреляции в MS Excel
- MINIFS / MAXIFS
- Лист прогнозов
- Как рассчитать коэффициент корреляции
Надстройка «Анализ данных» в Экселе
Microsoft Excel является одним из самых незаменимых программных продуктов. Эксель имеет столь широкие функциональные возможности, что без преувеличения находит применение абсолютно в любой сфере. Обладая навыками работы в этой программе, вы сможете легко решать очень широкий спектр задач. Microsoft Excel часто используется для проведения инженерного либо статистического анализа. В программе предусмотрена возможность установки специальной настройки, которая значительным образом поможет облегчить выполнение задачи и сэкономить время. В этой статье поговорим о том, как включить анализ данных в Excel, что он в себя включает и как им пользоваться. Давайте же начнём. Поехали!
Для начала работы нужно активировать дополнительный пакет анализа
Первое, с чего нужно начать — установить надстройку. Весь процесс рассмотрим на примере версии Microsoft Excel 2010. Делается это следующим образом. Перейдите на вкладку «Файл» и нажмите «Параметры», затем выберите раздел «Надстройки». Далее, отыщите «Надстройки Excel» и кликните по кнопке «Перейти». В открывшемся окне доступных надстроек отметьте пункт «Пакет анализа» и подтвердите выбор, нажав «ОК». В случае, если необходимого пункта нет в списке, вам придётся найти его вручную, воспользовавшись кнопкой «Обзор».
Так как вам ещё могут пригодиться функции Visual Basic, желательно также установить «Пакет анализа VBA». Делается это аналогичным образом, разница только в том, что вам придётся выбрать другую надстройку из списка. Если вы точно знаете, что Visual Basic вам не нужен, то можно ничего больше не загружать.
Процесс установки для версии Excel 2013 точно такой же. Для версии программы 2007, разница только в том, что вместо меню «Файл» необходимо нажать кнопку Microsoft Office, далее следуйте по пунктам, как описано для Эксель 2010. Также перед тем как начать загрузку, убедитесь, что на вашем компьютере установлена последняя версия NET Framework.
Теперь рассмотрим структуру установленного пакета. Он включает в себя несколько инструментов, которые вы можете применять в зависимости от стоящих перед вами задач. В списке, который представлен ниже, перечислены основные инструменты анализа, входящие в пакет:
- Дисперсионный. Вы можете выбрать из предложенных вариантов в списке (однофакторный, двухфакторный с повторениями, двухфакторный без повторений). Всё зависит от количества факторов и выборок.
- Корреляционный. Позволяет построить корреляционную матрицу. Такой подход даёт возможность определить, связаны ли большие значения одной группы данных с большими значениями другой группы. Или проделать то же самое для маленьких значений. Это называется отрицательной корреляцией.
- Ковариационный. Используется в случаях, когда необходимо посчитать функцию «КОВАРИАЦИЯ.Г». Также такой тип анализа позволяет определить, ассоциированы ли группы данных по величине.
- Фурье. Применяется, когда необходимо решить задачу в линейных системах либо проанализировать периодические данные.
- Гистограмма. Очень удобно использовать для решения задач типа: распределить значение успеваемости студентов в группе.
- Скользящее среднее. Применяется, когда нужно рассчитать значения, находящиеся в прогнозируемом периоде, основываясь на среднем значении переменной.
- Генерация случайных чисел. Заполняет указанный диапазон случайными числами.
- Ранг и перцентиль. Нужен, чтобы вывести таблицу с порядковым и центральным рангами.
- Регрессия. Позволяет подобрать график набора наблюдений, применяя метод наименьших квадратов.
- Выборка. Применяется в случаях, когда нужно создать выборку из генеральной совокупности, в качестве которой выступает входной диапазон.
- Т-тест. Даёт возможность проверить на равенство значения по каждой выборке. Существует несколько разновидностей этого инструмента. Выбирайте тот вариант, который больше подходит для решения текущей задачи.
- Z-тест. Этот инструмент нужен, чтобы проверять гипотезу о неразличии между средними одной и другой генеральных совокупностей относительно одно- и двусторонней гипотез.
Теоретическое отступление
Напомним, что корреляционной связью
называют статистическую связь, состоящую в том, что различным значениям одной переменной соответствуют различныесредние значения другой (с изменением значения Х среднее значение Y изменяется закономерным образом). Предполагается, чтообе переменные Х и Y являютсяслучайными величинами и имеют некий случайный разброс относительно ихсреднего значения .
Примечание
. Если случайную природу имеет только одна переменная, например, Y, а значения другой являются детерминированными (задаваемыми исследователем), то можно говорить только о регрессии.
Загрузка пакета анализа в Excel
Примечание: Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки
Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы
Для удобства также приводим ссылку на оригинал (на английском языке).
Если вам нужно разработать сложные статистические или инженерные анализы, вы можете сэкономить этапы и время с помощью пакета анализа. Вы предоставляете данные и параметры для каждого анализа, и в этом средстве используются соответствующие статистические или инженерные функции для вычисления и отображения результатов в выходной таблице. Некоторые инструменты создают диаграммы в дополнение к выходным таблицам.
Функции анализа данных можно применять только на одном листе. Если анализ данных проводится в группе, состоящей из нескольких листов, то результаты будут выведены на первом листе, на остальных листах будут выведены пустые диапазоны, содержащие только форматы. Чтобы провести анализ данных на всех листах, повторите процедуру для каждого листа в отдельности.
Откройте вкладку Файл, нажмите кнопку Параметры и выберите категорию Надстройки.
Если вы используете Excel 2007, нажмите кнопку Microsoft Office , а затем – кнопку Параметры Excel.
В раскрывающемся списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.
Если вы используете Excel для Mac, в строке меню откройте вкладку Средства и в раскрывающемся списке выберите пункт Надстройки для Excel.
В диалоговом окне Надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК.
Если Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор, чтобы выполнить поиск.
Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да, чтобы установить его.
Примечание: Чтобы включить функцию Visual Basic для приложений (VBA) для пакета анализа, вы можете загрузить надстройку ” Пакет анализа — VBA ” таким же образом, как и при загрузке пакета анализа. В диалоговом окне Доступные надстройки установите флажок Пакет анализа — VBA .
Примечание: Пакет анализа недоступен для Excel для Mac 2011. Дополнительные сведения о том, как найти пакет анализа в Excel для Mac 2011, я не вижу.
Чтобы загрузить пакет анализа в Excel для Mac, выполните указанные ниже действия.
В меню Сервис выберите пункт надстройки Excel.
В окне Доступные надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК.
Если надстройка Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор, чтобы найти ее.
Если появляется сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да , чтобы установить его.
Выйдите из приложения Excel и перезапустите его.
Теперь на вкладке Данные доступна команда Анализ данных.
Я не могу найти пакет анализа в Excel для Mac 2011
Существуют несколько сторонних надстроек, которые предоставляют функции пакета анализа для Excel 2011.
Вариант 1. Скачайте статистическое программное обеспечение надстройки КСЛСТАТ для Mac и используйте его в Excel 2011. КСЛСТАТ содержит более 200 основных и расширенных статистических средств, включающих все функции пакета анализа.
Выберите версию КСЛСТАТ, соответствующую операционной системе Mac OS, и загрузите ее.
Откройте файл Excel, содержащий данные, и щелкните значок КСЛСТАТ, чтобы открыть панель инструментов КСЛСТАТ.
В течение 30 дней вы получите доступ ко всем функциям КСЛСТАТ. По истечении 30 дней вы сможете использовать бесплатную версию, включающую функции пакета анализа, или заказать одно из более полных решений КСЛСТАТ.
Вариант 2. Скачайте Статплус: Mac LE бесплатно из Аналистсофт, а затем используйте Статплус: Mac LE с Excel 2011.
Вы можете использовать Статплус: Mac LE для выполнения многих функций, которые ранее были доступны в пакетах анализа, таких как регрессия, гистограммы, анализ вариации (Двухфакторный дисперсионный обработки) и t-тесты.
Перейдите на веб-сайт аналистсофти следуйте инструкциям на странице загрузки.
После загрузки и установки Статплус: Mac LE откройте книгу, содержащую данные, которые нужно проанализировать.
Откройте Статплус: Mac LE. Эти функции находятся в меню Статплус: Mac LE.
В Excel 2011 не входит Справка для Кслстат или Статплус: Mac LE. Справка по Кслстат предоставляется кслстат. Справка для Статплус: Mac LE предоставляется Аналистсофт.
Корпорация Майкрософт не предоставляет поддержку ни для каких продуктов.
Надстройка Пакет анализа MS EXCEL
«Анализ данных» окна – анализа VBA». ДляРегрессия (Regression);
то необходимо сначала для улучшения отчетов моделей данных. таблицу, а затем сводных таблицах, чтобы таблиц, воспользуйтесь списком
листе таблицы в Excel,Откройте вкладкуВы получите доступ коНадстройки Excel списке выберите пункт
- данных с помощью, которая размещена в«Параметры» этого необходимо выполнить
- Выборка (Sampling); включить надстройку (ниже Power View.Использование модели данных в
- с ее помощью упростить поиск объектов полей, который позволяетПринимайте более обоснованные бизнес-решения
даже если выДиаграммы всем функциям XLSTAT.Надстройки для Excel этого пакета следует нём.. те же действия,Парный двухвыборочный t-тест для дано пояснение дляPower View: исследование, визуализация
Excel 2013 осуществлять фильтрацию по анализа. Данные можно добавлять, упорядочивать и
на основе данных не используете Power. на 30 дней. ЧерезВ окне.
- указать входные данныеПосле этого запускается окошко
- В открывшемся окне параметров что и для средних (t-Test: Paired
- EXCEL 2010/2007): и представление данныхВ этом учебнике рассказано,
- времени и переходить
- отсортировать в алфавитном
- удалять поля в
- в отчетах сводных
- Pivot. Excel встроеннымНаводите указатель мыши на 30 дней можно будет
- Доступные надстройки
- В диалоговом окне
- и выбрать параметры;
- с большим перечнем Эксель переходим в
- загрузки пакета анализа. Two Sample for
- на вкладке Файл выберите
- Надстройка Power View, которая
- как импортировать сразу к различным периодам. порядке, по убыванию отчете сводной таблицы.
- таблиц, на которые функциональные возможности модели типы диаграмм для
- использовать бесплатную версию,установите флажокНадстройки
- расчет будет выполнен различных инструментов, которые подраздел
excel2.ru>
3D-карты
Этот способ визуализации данных с географической привязкой позволяет анализировать данные, находить закономерности, имеющие региональное происхождение.
Полезное дополнение. Координаты нигде прописывать не нужно — достаточно лишь корректно указать географическое название в таблице.
Как работать
- Откройте файл с таблицей, данные которой нужно визуализировать. Например, с информацией по разным городам и странам.
- Подготовьте данные для отображения на карте: «Главная» → «Форматировать как таблицу».
- Выделите диапазон данных для анализа.
- На вкладке «Вставка» есть кнопка 3D-карта.
Точки на карте — это наши города. Но просто города нам не очень интересны — интересно увидеть информацию, привязанную к этим городам. Например, суммы, которые можно отобразить через высоту столбика. При наведении курсора на столбик показывается сумма.
Также достаточно информативной является круговая диаграмма по годам. Размер круга задаётся суммой.
Как рассчитать коэффициент вариации в Эксель
Microsoft Excel позволяет максимально упростить пользователю ряд задач. С помощью данной утилиты можно в одно мгновение производить сложнейшие расчеты, применяя исходные данные. Сегодня мы поговорим о том, как использовать коэффициент вариации в Excel.
Коэффициент вариации показывает отношение стандартного отклонения к среднему арифметическому, а результат отображается в процентах.
Шаг 1. Расчет стандартного отклонения
Данный инструмент также называют среднеквадратичным отклонением, которое представляет собой квадратный корень из дисперсии. Чтобы рассчитать стандартное отклонение, применяется функция СТАНДОТКЛОН. В последних версиях Excel она разделена на две части, в зависимости от того, как происходит вычисление: СТАНДОТКЛОН.Г(по генеральной совокупности), СТАНДОТКЛОН.В(по выборке). Записываются функции следующим образом:
= СТАНДОТКЛОН(Число1;Число2;…) — Для старой версии
= СТАНДОТКЛОН.В(Число1;Число2;…) — Для новой версии соответственно.
1. Чтобы начать расчет стандартного отклонения, выделите подходящую ячейку и нажмите кнопку «Вставить функцию», расположенную в верхней панели инструментов.
2. Откроется окно мастера функций. Перейдите в категорию «Статистические», затем выберите строку с названием «СТАНДОТКЛОН»(СТАНДОТКЛОН .В или .Г соответственно). Нажмите «ОК».
3. В открывшемся окне аргументов необходимо указать диапазон ячеек, с которыми будет производиться расчет. Также можно ввести конкретные числа. После указания параметров нажмите кнопку «ОК».
4. В ранее выделенной ячейке отобразится итоговый расчет стандартного отклонения.
Шаг 2. Расчет среднего арифметического
Среднее арифметическое отражает общую сумму значений числового ряда, поделенных на их количество. Для этого используем функцию СРЗНАЧ.
1. Выделите нужную ячейку для отображения конечного результата, затем воспользуйтесь кнопкой «Вставить функцию».
2. Перейдите в категорию «Статистические» и выберите поле с наименованием «СРЗНАЧ», после этого нажмите «ОК».
4. В раннее выбранной ячейке выведется результат вычислений среднего арифметического.
Шаг 3. Нахождение коэффициента вариации
Мы получили все предварительные данных для конечных вычислений, поэтому приступаем к последнему шагу, а именно к расчету коэффициента вариации.
1. Выделите ячейку для конечного результата, затем поменяйте формат ячейки на процентный. Сделать это можно во вкладке «Главная», кликнув по полю формата и выбрав соответствующий.
2. Снова вернитесь к ранее выбранной ячейке и выделите ее двойным щелчком левой кнопки мыши. Поставьте в ней знак «=», затем выделите ячейку с результатом вычислений стандартного отклонения. Теперь нажмите кнопку «/»(разделить) на клавиатуре и выберите ячейку со средним арифметическим. После ввода данных нажмите клавишу Enter.
3. Результат будет автоматически выведен на экран.
Также существует способ рассчитать коэффициент вариации без предварительных шагов, который мы рассмотрим ниже:
1. Аналогично выделите ячейку, затем придайте ей процентный формат. Впишите в нее следующую формулу:
«Диапазон значений» указывает с исходными данными. Можете указать его вручную, либо просто выделив нужный диапазон ячеек. Вместо оператора СТАНДОТКЛОН также можно ввести СТАНДОТКЛОН .В или СТАНДОТКЛОН .Г соответственно(для новых версий Excel).
2. После занесения всех параметров нажмите клавишу Enter, чтобы получить конечный результат.
С помощью Excel мы смогли максимально упростить выполнение сложных расчетов. Для этого нам понадобилось лишь грамотное использование встроенных инструментов приложения. Как видите, пока не существует способа рассчитать коэффициент вариации в одно действие, поэтому мы воспользовались обходными путями. Надеемся, вам помогла наша статья.
Определение и вычисление множественного коэффициента корреляции в MS Excel
Для выявления уровня зависимости нескольких величин применяются множественные коэффициенты. В дальнейшем итоги сводятся в отдельную табличку, именуемую корреляционной матрицей.
Подробное руководство:
- В разделе «Данные» находим уже известный блок «Анализ» и жмем «Анализ данных».
9
- В отобразившемся окошке жмем на элемент «Корреляция» и кликаем на «ОК».
- В строку «Входной интервал» вбиваем интервал по трём или более столбцам исходной таблицы. Диапазон можно ввести вручную или же просто выделить его ЛКМ, и он автоматически отобразится в нужной строчке. В «Группирование» выбираем подходящий способ группировки. В «Параметр вывода» указывает место, в которое будут выведены результаты корреляции. Кликаем «ОК».
10
- Готово! Построилась матрица корреляции.
11
MINIFS / MAXIFS
= MINIFS и = MAXIFS очень похожи на функции = MIN и = MAX, за исключением того факта, что они позволяют вам брать минимальный / максимальный набор значений и также сопоставлять их по определенным критериям. По сути, функция ищет минимальные / максимальные значения и сопоставляет их с входными критериями.
В приведенном выше примере я хотел найти минимальные баллы в зависимости от пола учащегося. Для этого я использовал формулу = MINIFS (C2: C10, B2: B10, «M») и получил результат 27. Здесь C2: C10 — это столбец, в котором формула будет искать оценки, B2: B10 — столбец, в котором формула будет искать критерии (пол), а «M» — критерии.
Точно так же для получения максимальных баллов я использовал формулу = MAXIFS (C2: C10, B2: B10, «M») и получил результат 100.
Формула для MINIFS: = МИНИМНЕС (минимальный_диапазон, диапазон_критерия1, критерий1, …)
Лист прогнозов
Зачастую в бизнес-процессах наблюдаются сезонные закономерности, которые необходимо учитывать при планировании. Лист прогноза — наиболее точный инструмент для прогнозирования в Excel, чем все функции, которые были до этого и есть сейчас. Его можно использовать для планирования деятельности коммерческих, финансовых, маркетинговых и других служб.
Полезное дополнение. Для расчёта прогноза потребуются данные за более ранние периоды. Точность прогнозирования зависит от количества данных по периодам — лучше не меньше, чем за год. Вам требуются одинаковые интервалы между точками данных (например, месяц или равное количество дней).
Как работать
- Откройте таблицу с данными за период и соответствующими ему показателями, например, от года.
- Выделите два ряда данных.
- На вкладке «Данные» в группе нажмите кнопку «Лист прогноза».
- В окне «Создание листа прогноза» выберите график или гистограмму для визуального представления прогноза.
- Выберите дату окончания прогноза.
В примере ниже у нас есть данные за 2011, 2012 и 2013 годы
Важно указывать не числа, а именно временные периоды (то есть не 5 марта 2013 года, а март 2013-го)
Для прогноза на 2014 год вам потребуются два ряда данных: даты и соответствующие им значения показателей. Выделяем оба ряда данных.
На вкладке «Данные» в группе «Прогноз» нажимаем на «Лист прогноза». В появившемся окне «Создание листа прогноза» выбираем формат представления прогноза — график или гистограмму. В поле «Завершение прогноза» выбираем дату окончания, а затем нажимаем кнопку «Создать». Оранжевая линия — это и есть прогноз.
Как рассчитать коэффициент корреляции
Давайте продемонстрируем механизм получения коэффициента корреляции на реальном кейсе. Допустим, у нас есть таблица с информацией о суммах продаж и рекламу. Нам нужно понять, в какой степени количество продаж и количество денег, которые были использованы на продвижение, взаимосвязаны.
Способ 1. Определение корреляции с помощью Мастера Функций
Функция КОРРЕЛ – один из самых простых методов, как можно реализовать поставленную задачу. В своем общем виде этот оператор имеет следующий вид: КОРРЕЛ(массив1;массив2). Как же ее ввести? Для этого нужно осуществлять следующие действия:
- С помощью левой кнопки мыши выделяем ту ячейку, в которой будет находиться получившийся коэффициент корреляции. После этого находим слева от строки формул кнопку fx, которая откроет инструмент ввода функций.
- Далее выбираем категорию «Полный алфавитный перечень», в котором ищем функцию КОРРЕЛ. Как видно из названия категории, все названия функций располагаются в алфавитном порядке.
- Далее открывается окно ввода параметров функции. У нас два основных аргумента, каждый из которых являет собой массив данных, которые сравниваются между собой. В поле «Массив 1» указываем координаты первого диапазона, а в поле «Массив 2» – адрес второго диапазона. Для ввода данных массива, используемого для расчета, достаточно выделить нажать левой кнопкой мыши по соответствующему полю и выделить правильный диапазон.
- После того, как мы введем данные в аргументы, нажимаем кнопку «ОК», чем подтверждаем совершенные действия.
После выполнения описанных выше шагов мы видим в ячейке, выбранной нами на первом этапе, коэффициент корреляции. В нашем примере он составляет 0,97, что указывает на очень сильно выраженную взаимосвязь между данными двух диапазонов.
Способ 2. Вычисление корреляции с помощью пакета анализа
Также довольно неплохой инструмент для определения корреляции между двумя диапазонами – пакет анализа. Но перед тем, как его использовать, нам надо его включить. Для этого выполняем следующие действия:
- Нажимаем на кнопку «Файл», которая находится в левом верхнем углу сразу возле вкладки «Главная».
- После этого открываем раздел с настройками.
- В меню слева переходим в предпоследний пункт, озаглавленный, как «Надстройки». Делаем левый клик по соответствующей надписи.
- Открывается окно управления надстройками. Нам нужно переключить поле ввода, находящееся внизу, на пункт «Надстройки Excel» и нажать на «Перейти». Если это поле уже находится в таком положении, то не выполняем никаких изменений.
- Затем включаем пакет анализа в настройках. Для этого ставим соответствующую галочку и нажимаем на кнопку «ОК».
Все, теперь наша надстройка включена. Теперь мы во вкладке «Данные» можем увидеть кнопку «Анализ данных». Если она появилась, то мы все сделали правильно. Нажимаем на нее.
Появляется перечень с выбором разных способов анализа информации. Нам следует выбрать пункт «Корреляция» и нажать на «ОК».
Затем нам нужно ввести настройки. Основное отличие этого метода от предыдущего заключается в том, что нам нужно вводить полностью диапазон, а не разрывать его на две части. В нашем случае, это информация, указанная в двух столбцах «Затраты на рекламу» и «Величина продаж».
Не вносим никаких изменений в параметр «Группирование». По умолчанию выставлен пункт «По столбцам», и он правильный. Эта настройка определяет, каким образом программа будет разбивать данные. Если же наши данные были бы представлены в двух рядах, то надо было бы изменить этот пункт на «По строкам».
В настройках вывода уже стоит пункт «Новый рабочий лист». То есть, информация о корреляции будет располагаться на отдельном листе. Пользователь может настроить место самостоятельно с помощью соответствующего переключателя – на текущий лист или в отдельный файл. Проверяем, все ли настройки были введены правильно. Если да, подтверждаем свои действия нажатием на клавишу «ОК».
Поскольку мы оставили поле с данными о том, куда будут выводиться результаты, таким, каким оно было, мы переходим на новый лист. На нем можно найти коэффициент корреляции. Конечно, он такой же самый, как был в предыдущем методе – 0,97. Причина этого в том, что вычисления производятся одинаковые, исходные данные мы также не меняли. Просто разными методами, но не более.
Таким образом, Эксель дает сразу два метода осуществления корреляционного анализа. Как вы уже понимаете, в результате вычислений итог получится таким же. Но каждый пользователь может выбрать тот метод расчета, который ему больше всего подходит.