ЭЛЕКТРОННАЯ БИБЛИОТЕКА КОАПП |
Сборники Художественной, Технической, Справочной, Английской, Нормативной, Исторической, и др. литературы. |
Часть 2 Г Л А В А 11 Генератор отчетов и воспроизведение графических данных. 1. ВВЕДЕНИЕ В этой главе описываются процедуры STATGRAPHICS, предназначенные для создания, редактирования и печати отчетов, для воспроизведения текстовых файлов и файлов графических данных; а также для создания, редактирования и печати файлов связи для представлений. Краткие сведения об этих процедурах приводятся ниже. Подробно они приводятся в разделах 2-4 главы 11. ПРОЦЕДУРА ОПИСАНИЕ ------------------------------------------------------------ Редактирование и Позвояет вам создавать, редактировать, печать файла выводить на экран, печатать и удалять отчетов отчеты. Воспроизведение Позволяет повторно выполнять модифи- текстовых файлов кации файла, сохраненные с помощью данных средства save-screen или средства записи. Генератор файлов Позволяет создавать, редактировать связей выводить на экран, печатать и удалять 11.2. ИСПОЛЬЗОВАНИЕ ГЕНЕРАТОРА ОТЧЕТОВ STATGRAPHICS предоставляет пользователю основной генератор отчетов, который позволяет создавать меморандумы и короткие отчеты. Форматом отчетов можно управлять с помощью команд, вводимых в начале строки. Этим командам предшествует точка (.), так что их легко можно отличить от текста отчетов. В том случае, если вы выберите процедуру "Редактирование и печать файла", STATGRAPHICS выведет на экран список файлов отчетов, которые находятся в настоящее время на диске на вашем дисководе. Для каждого файла отчетов выводится следующая информация: * имя файла отчетов. У всех файлов отчетов есть имя следующей формы: STATRn, где n-номер, который вы указали при сохранении отчета. * буква, идентифицирующая накопитель на диске, на котором находится отчет. * тип файла (ОТЧЕТ) * дата и время сохранения файла. * комментарий, идентифицирующий файл, который вы ввели при создании файла. В этой точке вы можете вывести на экран, отредактировать, напечатать и удалить любой из имеющихся отчетов или создать новый. Если на диске вашего накопителя отчеты не хранятся, STATGRAPHICS предполагает, что вы хотите создать новый отчет и выведет на экран следующее сообщение: ENTER REPORT NUMBER (1): введите номер отчета чтобы выйти из генератора отчетов, нажмите F10. 11.3. СОЗДАНИЕ НОВОГО ОТЧЕТА Когда на экране появится список имеющихся отчетов, вы можете создать новый отчет, нажав N. STATGRAPHICS попросит вас указать номер отчета и идентифицирующий комментарий, который должен быть сохранен вместе с отчетом. Номер отчета принимаемый по умолчанию (выводится на экран вместе с подсказкой и заключается в круглые скобки), всегда один и тот же -1. Если вы укажите номер отчета, который уже используется, STATGRAPHICS выведет на экран следующее сообщение: ***** WARNING***** предупреждение REPORT FILE ALREADY EXISTS QN LISK файл отчета находится на диске DO YOUWISC TO REPLACE IN? вы хотите заменить его? (NO): Если вы ответите нет (N), система попросит вас указать другой номер отчета и комментарий. Если вы ответите да (Y), STATGRAPHICS создаст новый файл, заменив всю информацию, ранее хранящуюся в этом файле. После того, как файл будет создан, STATGRAPHICS возвращается к списку имеющихся отчетов. Кроме имен всех других отчетов, хранимых на вашем диске, на экран будет выведено имя вновь созданного отчета Операция создания нового отчета подготавливает "оболочку", в которую впоследствии вы сможете ввести текст вашего отчета, используя опцию редактирования. 4. РЕДАКТИРОВАНИЕ НОВОГО ОТЧЕТА Когда на экране появится список имеющихся отчетов, вы сможете ввести текст для нового отчета или отредактировать текст ранее существующего отчета, выделяя на экране имя нужного файла и нажимая Е. STATGRAPHICS выведет на экран текст вашего файла отчетов в неформатированном виде. Это значит, что команды, управляющие полями, подчеркиванием, смещением вправо и т.д. будут появляться на экране по мере того, как вы будете их вводить. Благодаря этому вы можете проверить ваш текст и команды и внести изменения. В том случае, если вы редактируете новый файл, на экране появится следующий текст, который играет роль метки-заполнителя вашего файла: .ce STATGRAPHICS .sp .ce образец отчета .sp это образец файла, который вы должны отредактировать, чтобы задать свои собственные параметры. Когда вы введете действительный текст вашего отчета, этот текст необходимо будет удалить. Команды форматирования, обеспечиваемые генератором отчетов STATGRAPHICS, подразделяются на дву категории: *Общие команды форматирования, которые управляют общим видом отчета (например, шириной страниц и полями). *Команды форматирования текста, которые управляют отдельными его элементами (например, параграфами и центрированием). Целесообразно поместить все общие команды форматирования в начало вашего файла, хотя их можно испоьзовать в любое время для выборочного изменения формата. Команды форматирования описаны ниже. Все команды должны вводиться с начала строки. общая команда форматирования описание ------------------------------------------------------------ .ss Один пробел. Принимается по умолчанию, если не указана команда интервалов. .ds Двойной пробел. .pl n Длина страницы, т.е. количество строк на физической странице. По умолчанию принимаетс .pl 66. При каждом появлении команды .pl редактор сразу же попытается повторно задать длину страницы. Усли команда появляется в середине страницы, текст на этой странице может исказиться. Команду .pl необходимо использовать только в начале файла или сразу же после команды новой страницы (.pa). .tm n Верхнее поле. По умолчанию принимается .tm 5. .bm n Нижнее поле Под нижним полем оставляют три запасные строк для номера страницы, который выводится на эк- ран в следующем формате: ( пустая строка ) - n - ( пустая строка остается титульной и не нуме- руется. .lm n Левое поле. По умолчанию принимается .lm 6 .pn n Ширина страницы. По умолчанию принимается .pw 96. Максимальная ширина печати на бумаге размером 8,5 на 14 дюймов (1 дюйм равен 2,54 см)включая левое поле составляет 132 символа.Максимальнамальная ширина печати на бумаге размером 8,5 на 11 дюймов состав- ляет 112 символов. Если сумма заданных значений .lm и pw превы- шает 80 символов, при выводе на экран форма- тированный текст будет переноситься. .pf text Префикс. По умолчанию префикс не задается. Текст, указанный вами с помощью команды .pf, будет предшествовать номерам всех страниц, разделов и рисунков. Например, .pf 1 будет создавать номера страниц, разделов и рисунков в следующем формате: 1-1, 1-2, 1-3 и тд. Команда форматиро- вания текста Описание ------------------------------------------------------------ ----- Заголовок главы. Выводит на экран заголовок .cha text главы, занимающий две строки и расположенный вверху новой страницы в центре. В 1 строке содер- жится слово "глава" и порядковый номер. Во второй строке находится указанный вами текст. Например: .cha Sample Report будет выведена на экран, как: Глава 1 Образец отчета На основании этого можно предположить, что эта команда была первой командой в файле. .sec text Заголовок раздела. Пропускает три строки и выво- дит на экран ваш префикс (если таковой имеется), номер раздела (1,2,3 и т.д.) и указанный вам текст. Текст подчеркивается и выравнивается по левому полю. Например, .sec Introduction будет выведена на экран, как 1-2 Introduction, что позволяет предположить, что эта команда была второй командой .sec в файле, а префикс был уста новлен на .pf 1-. .pp Новый параграф. Пропускает строку и отступает на пять пробелов. .figk text Рисунок. Пропускает строку и вычеркивает прямоугольник, ширина которого задается .pw, а глубина которого равна к+2 строкам (с учето верхней и нижней линий прямоугоьника). Выводит на экран заголовок рисунка, занимающий две строки и распологающийся в центре по прямоугольником. В 1 строке содержится слово "Рисунок", префикс (если таковой имеется) и номе рисунка. Во второй строке содержится указанный вами текст. .ce text Центрирует указанный вами текст. .us text Подчеркивает указанный вами текст. Может испоьзо ваться только по отношению к тексту, который появляется на отдельной строке. .sk n Пропускает n строк, даже если вверху страницы есть пустые строки. .sp n Пропускает n строк, за исключением тех случаев когда в верхней части страницы есть пустые стро- ки (условный пропуск). .in n Отступает вправо на n пробелов. .point begin Создает список точек, распределенных по группам Точки снабжены порядковыми номерами. При выводе на экран от левого и правого полей делается отс- туп на 5 пробелов. .point Между точками делается двойной пробел. .point end Вводит point begin на отдельной строке перед первым элементом списка, .point на отдельной строке перед другим элементом и вводит .point end на отдельной строке после послед- него элемента. .br Прерывает строку в этой точке независимо от ши- рины страницы. .pa n Новая страница с номером n. Когда n не указан предполагется номер следующей страницы. Предпо- лагается, что первая страница титульная, и она не нумеруется не зависимо от значения, заданного .pa. .im n Вкладывается текстовый файл n в ваш отчет в том месте, где встречается команда. Если текстовый файл шире ширины страницы, ширина страницы подгоняется под ширину файла. Тектовый файл должен находиться на вашем накопителе, и в должны хранить ваш отчет на этом же накопителе. .li on Включить\ Выключить. .li off Средство ввода текста. Используя .li on, вы можете вводить текст строчку за строчкой, соблю дая требования, предъявляемые вами к внешне му виду текста в окончательном отчете. Особенно эт удобно для табличного материала. Введите .li on на отдельной строке, затем построчно вводите ва текст в соответствии с вашими требованиями. Когда вы захотите возобновить форматирован ие страниц, введите на отдельной строке.li off. Проще всего ознакомиться с использованием команд форматирования на примере образца файла, при этом следует обращать внимание на то, как он представляется при вводе и при печати. Для этой цели можно использовать образец отчета STATR1, имеющийся на вашем диске, выборочных наборов данных. Чтобы распечатать форматированный отчет, используйте клавиши управления курсором для выделения на экране STATR1 и нажмите клавишу р. Чтобы напечатать неформатированный отчет, сначала введите его в редактор, выделяя на экране STATR1 и нажимая e. Неформатированный файл отчета будет выведен на экран и просмотрен до начала. Затем нажмите F9, чтобы распечатать весь файл. Затем нажмите F10, чтобы вернуться к списку отчетов. Форматированный текст занимает 6 страниц, неформатированный текст -две страницы. Сравните две распечатки, чтгобы посмотреть, как вводятся и интерпритируются команды форматирования. При первоначаьном вводе отчета рекомендуется вводить короткие строки. Благодаря этому впоследствии вы сможете вводить в строку слова и фразы. Максимальная длина каждой строки равняется 79 символам. Если вы попытаетесь удлинить строки, текст переноситься не будет. После того, как вы введете текст и команды для вашего отчета, вам необходимо сохранить этот файл, иначе после вашего выхода из редактора отчет будет потерян. Чтобы сохранить ваш отчет, нажмите F3. Файл отчетов будет прокручен до конца и вы вернетесь к списку имеющихся отчетов. 11.5 РЕДАКТИРОВАНИЕ СУЩЕСТВУЮЩЕГО ОТЧЕТА Чтобы отредактировать существующий отчет, выделете на экране имя соответствующего файла отчетов и нажмите E. Неформатируемый файл отчетов будет выведен на ваш экран и просмотрен доверхней части вашего файла. На строке состояния будут показаны функционаьные клавиши процедуры редактора. В рамках редактора специальные клавиши, клавиши управления курсором и функциональные клавиши процедур определяются следующим образом: Клавиша Описание ------------------------------------------------------------ F1(HELP) Выводит в режиме он-лайн экран, help для редактора F3(DONE) Сохраняет отредактированный файл со всеми внесен- ными изменениями и выходит из редакиора. F9(PRINT) Распечатывает весь файл в неформатированном виде. F10(QUIT) Осуществляет выход из редактора, не сохраняя внесенных изменений. Клавиши Передвигают курсор, не удаляя ни текст, управления ни команду. Когда курсор передвигается курсором на новую строку вверх или вниз он уста- навивается в конце строки. SPACE/ Передвигает курсор, удаляя текст и команды BACKSPACE Pg Up/ Прокручивает экран вверх или вниз, по одно Pg Down строке за раз. Ctrl Pg Up/ Прокручивает экран вверх или вниз, по экра ну Ctrl Pg Down за раз. Home/End Устанавливает курсор в начале или кон це текущей строки Ins/Del Вставляет или удаляет пробел. Ctrl Ins/ Вводит над текущей строкой пустую строку и ли Ctrl Del удаляет текущую строку. Tab/BACKTAB Табулирует курсор с иньервалами в 8 пробел ов. При выводе на экран вашего неформатированного текста вы можете передвигаться по всему файлу и вносить изменения в команды и тексты. Если вы "забьете" текст или команды, они будут заменены новой информацией. После того, как все изменения будут внесены, нажмите F3, чтобы сохранить изменения, внесенные в файл. 11.6. ВЫВОД ОТЧЕТОВ НА ЭКРАН Чтобы вывести на экран существующий отчет, выделете на экране соответствующего файла и нажмите D. SNANGRAPHICS введет режим вывода на экран, включив звуковой сигнал колокольчика, чтобы дать вам знать о том, что готов начать работу. Нажмите ENTER, чтобы начать вывод отчета на экран. В конце каждой страницы STATGRAPHICS автоматически делает паузу и дает звуковой сигнал, нажмите ENTER. Чтобы приостановить вывод на экран в рамках страницы, нажмите Ctrl s. Чтобы возобновить вывод, нажмите Ctrl Q. Когда на экран будет будет выведен весь файл, нажмите ENTER, чтобы вернуться к списку имеющихся отчетов. 11.7. РАСПЕЧАТКА ОТЧЕТОВ Чтобы распечатать существующий отчет на вашем печатающем устройстве выделите на экране имя соответствующего файла и нажмите Р. STATGRAPHICS попросит вас нажать клавишу прогона страницы для печатающего устройства и установить бумагу наверху новой страницы. Нажав на клавишу прогона странцы, вручную прокрутите бумажную ленту до верхней части следующей страницы (в том случае если ее там нет). Благодаря этому будет обеспечена правиьная позиция печати. Когда вы будете готовы к печати отчета, нажмите ETNTER. STATGRAPHICS распечатает отчет и автоматически вернется к списку отчетов. 11.8. УДАЛЕНИЕ ОТЧЕТОВ Чтобы удалить существующий отчет, выделете на экране имя соответствующего файла и нажмите Х. STATGRAPHICS удалит файл и автоматически вернется к списку имеющихся отчетов. 11.9. ВОСПРОИЗВЕДЕНИЕ ТЕКСТОВЫХ И ГРАФИЧЕСКИХ ФАЙЛОВ Если вы выбраи процедуру "воспроизведение текстовых и графических файлов", то STATGRAPHICS выводит на дисплей список текстовых и графических файлов, которые в настоящий момент находятся на диске на вашем накопителе. Для каждого файла указывается следующая информация: * Имя файла (STATT n для файлов текстовых данных, STATP n для файлов графических данных и STATX n для файлов для графического воспроизведения. * Буква, идентифицирующая накопитель на магнитном диске, на котором храниться файл. * Для файлов графических данных, сохраненных с помощью средства запоминания экрана, указываются спецификации графических средств (тип* адаптера, количество цветов, разрешающая способность и адрес базового сегмента), в условиях которых сохранялся график. Обратите внимание на то, что графические данные, сохраненные с помощью средства запоминания экрана, можно вывести на экран только в том случае если в настоящий момент вы используете тот же графический режим, который использовался в момент сохранения файла. Графические экраны нельзя генерировать на перьевом графопостроителе. Их нельзя вложить и в файлы отчетов. * Коментарий, идентифицирующий файл, который вы ввели при создании файла. В этой точке вы можете вывести на экран любой существующий файл, выделев на экране имя файла и нажав D. Если вы выводите на экран текстовый файл (STATT n) вы автоматически переходите в редактор отчетов. Используя процедуры, описанные в разделе 11.2, вы можете отредактировать текстовый файл так же, как если бы это был файл отчетов. Нажмите F3, чтобы сохранить изменения и выйти из редактора. Если вы выводите на экран файлы графических данных или воспроизводите файлы, нажмите ENTER, чтобы вернуться к списку имеющихся файлов. Чтобы удалить файл, выделите на экране имя файла и нажмите Е. Если на вашем накопителе нет ни файлов графических дканных, ни файлов текстовых данных, то на экран будет выведено следующее сообщение: ФАЙЛЫ ОТСУТСТВУЮТ Чтобы выйте из процедуры, нажмите F10. 6. СОЗДАНИЕ ФАЙЛОВ СВЯЗИ STATGRAPHICS предоставляет пользователю генератор связей, предназначенный для того, чтобы предаставить пользователю возможность создавать "крупносимвольные" дисплейные схемы, пригодные для представлений по типу блокнота или для получения верхних диапозитивов. Вы также можете сфотографировать связи с вашего экрана, чтобы подгото- вить цветные диапозитивы. Размер, местонахождение и цвет символов контроируются трехзначным кодом, вводимым в начале каждой строки. Когда вы наберете процедуру "генератор связей", STATGRAPHICS выведет на экран список связей, уже имеющийся на вашем диске. Для каждого файла указывается следующая информация: * Имя файла. У всех файлов связей есть имя следующей формы: STATF n, где n-номер, который вы указали при сохранении файла связей. * Буква, идентифицирующая накопитель на магнитном диске, на котором хранится файл связей. * Тип файла (FOIL). * Дата и время сохранения файла. * Комментарий, идентифицирующий файл связей, который вы ввели при создании файла. В этой точке вы можете вывести на экран, отредактировать, распечатать или удалить любой из существующих файлов связей или создать новый файл,. Чтобы выйти из генератора файлов связей, нажмите F10. СОЗДАНИЕ НОВОГО ФАЙЛА СВЯЗЕЙ При выводе на экран имеющихся файлов связей вы можете создать файл связей, нажав N. STATGRAPHICS попросит вас указать номер файла связи и идентифицирующий коментарий, который должен сохраняться вместе с файлом. 1-номер, который всегда принимается по умолчанию (выводится на экран в скобках вместе с подсказкой). Если вы укажите номер файла связей, который уже используется, STATGRAPHICS выведет сообщение:* ***** WARNING ***** FOIL FILE ALREADY EXISTS ON DISK DO JOU WISH TO REPLACE IT ? (NO): Если вы ответите N (нет), STATGRAPHICS попросит вас указать номер и комментарий другого файла связей. Если вы ответитет Y (да), STATGRAPHICS создаст новый файл, заменив всю информацию, ранее хранившуюся в файле. После того, как файл связей будет создан, STATGRAPHICS возвратится к списку имеющихся файлов. Кроме имен всех других файлов связей, хранимых на вашем диске, на экран будет выведено имя нового файла. Операция создания нового файла связей подготавливает "оболочку" в которую впоследствии можно будет ввести текст вашего файла связей, используя опцию редактирования. РЕДАКТИРОВАНИЕ НОВОГО ФАЙЛА СВЯЗЕЙ Когда на экран выводится список имеющихся файлов связей, вы можете ввести текст для нового файла или отредактировать текст в ранее существующем файле, выделев имя нужного файла и нажав E. STATGRAPHICS выведет на экран текст вашего файла связей в неформатированном виде. Это значит, что коды, управляющие цветом, размерами символов и расположением, будут выводиться на экран по мере того,как выц вводите их. Благодаря этому вы можете проверить текст и коды и ввести в них изменения. В этом случае, если вы редактируете новфый файл, на экране появится следующий текст в качестве метки-заполнителя вашего файла: ПРИМЕР ------ Когда вы введете действительный текст вашего файла связей, этот текст нужно удалить. Трехзначный управляющий код, используемый в генераторе связей, описывается ниже: Позиция Описание ------------------------------------------------------------ 1 Определяет цвет символов на всех строках. Действи- тельные коды-это коды от 1 до n, где n-максималь- ное количество цветов, обеспечиваемое вашим графи- ческим адаптером. 2 Определяет размер символов на всех строках. Дейс- твительные коды-коды от 1-9 (1определяет наимень- ший размер символов, 9-наибольший размер). Действительный размер текста при выводе на ваш экран определяется этим управляющим кодом и разре- шающей способностью используемого вами графическо- го адаптера. Большие коды (5 или больше) мог ут привести к тому, что ваш текст "убежит" с экрана. Действительно размер текста при распечатке на ваше печатающем устройстве определяется этим кодо м, разрешающей способностью используемого вами графического адаптера и значениями, заданным опцией построения графиков 3 Размещает текст на строках. Введите 0, чтобы выравнить текст по левому полю , 1, что бы разместить текст по центру, или введите 2, что бы выравнить текст по правому полю. Чтобы разместить текст вручную, вы можете использовать пробелы. Проще всего ознакомиться с использованием управляющих кодов на примере образца файла связей, изучая его представление при вводе при печате или при выводе на экран. Для этой цели можно использовать образец файла связей STATF1,который хранится на вашем диске выборочных данных. Чтобы распечатать неформатированный файл, сначала введите его в редактор, выделив STATF1 и нажав E. Неформатированный файл будет выведен на ваш экран. Затем нажмите F9, чтобы распечатать файл. Чтобы возвратиться к списку файлов связей, нажмите F10. Чтобы вывести на экран форматированный файл связей, используйте клавиши управления курсором для выделения на экране STATF1 и нажмите D. Чтобы посмотреть, как действуют расположения, цветов и размеров, сравните распечатку с тем, что было выведено на экран чтобы вернуться к списку файлов связей, нажмите ENTER. Чтобы файл связей уместился на вашем экране, его необходимо отредактировать, так как текст, неотображаемый на экране, распечатываться не будет. После того, как вы выедете текст и управляющие коды для вашего файла связей, этот файл необходимо сохранить, или в противном случае он будет утерян при вашем выходе из редактора. Чтобы сохранить ваш файл, нажмите F3. Затем нажмите F10, чтобы выйти из редактора. РЕДАКТИРОВАНИЕ СУЩЕСТВУЮЩЕГО ФАЙЛА СВЯЗЕЙ Чтобы отредактировать существующий файл связей, выделите на экран имя соответствующего файла и нажмите Е. На экране будет выведен неформатированный файл, и на строке состояния будут представлены функциональные клавиши процедуры редактора. Файлы связей редактируются с помощью тех же самых процедур, которые были описаны для редактирования отчетов (см. раздел 11.2) УДАЛЕНИЕ ФАЙЛОВ СВЯЗЕЙ Чтобы удалить файл связей, выделите на экране имя связей и нажмите Х. .3460 Г Л А В А 12 ИСПОЛЬЗОВАНИЕ ПЕРОВЫХ ГРАФОПОСТРОИТЕЛЕЙ 12.1. ВВЕДЕНИЕ STATGRAPHICS обеспечивает средства, которые позволяют создавать графы на различных перьевых графопостроителях. Список поддерживаемых тех средств в руководстве "Open Me First" описывает перьевые графопостроители, обеспечиваемые системой STATGRAPHICS. В этой главе описыается, как хранить графы, так чтобы их можно было позже получить на перьевом графопостроителе. Также описывается последовательность этапов получения графов на графопостроителе. Средства и процедуры, используемые для выполнения этих задач, суммируются ниже и описываются в разделах с 12.2 по 12.5. Средство/процедура (F4) Описание ------------------------------------------------------------ Средство записи (F4) Сохраняет графы в файле в форме, которая позволяет позже воспроиз- водить их на перьевом графопост- роителе Установка скорости Устанавливает канал связи между ваш им передачи данных и персональным компьютером и вашим четности перьевом графопостроителем Установка интерфейса Специфицирует используемый тип с графопостроителем графопостроителя, число графиков на страницу, скорость движения пера, паузы пера и другие параметры графопостроителя Посылка записанных Специфицырует файлы, которые должны файлов на графо- быть вычерчены,управляющие появлени ем построителя каждого графа. 12.2. ЗАПИСЬ ГРАФОВ ДЛЯ ГРАФОПОСТРОИТЕЛЯ До получения графа на перьевом графопостроителе неоходимо сначала записать граф, используя устройство записи. Это можно сделать в любое время, и можно записать несколько графов до получения их на графопостроителе. Средство записи управляется посредством использования обычной функциональной клавиши F4. F4-это переключатель, который включает и выключает средство записи. При запуске системы STATGRAPHICS по умолчанию устанавливается значение-выключить. Состояние средства записи сообщается в нижнем правом углу строки состояния. Например,REC:OFF, сообщается когда средство записи выключено. Нажмите F4 и сообщение измениться на REC:ON. Вновь нажмите на F4, чтобы отключить средство записи. Чтобы записать граф, который должен быть вычерчен, нажмите F4, чтобы включить средство записи. Это можно сделать в любое время до того как граф воспроизведен на вашем экране. Например, вы можете включить средство записи до выбора процедуры, до ответа не последнюю подсказку в процедуре или до ответа на подсказку для модификации графика. Вы не можете включить средство записи, когда граф воспроизведен на вашем экране, или когда воспроизведено любое из экранных табло (выбор временного варианта графика, спецификация гистограммы, спецификация круговой диаграммы и т.д.). Это потому, что средство записи записывает команды, необходимые для воспроизведения графа. Хорошо включить средство записи, когда вы начинаете процедуру. Графы не записываются в файл до тех пор пока вы не подтвердите, что вы хотите их записать, поэтому неплохо, чтобы средство было включено пока вы работаете со своими данными и модифицируете свои графы. Когда средство записи включено, все процедуры системы STATGRAPHICS работают обычным образом. Однако, если вы нажмете ENTER после воспроизведения графа на вашем экране, STATGRAPHICS воспроизведет следующую подсказку: DO YOU WISH TO SAVE THE GRAPH? (N/Y): (хотите ли вы записать граф?) Если вы ответите нет N, процедура будет следовать по обычному пути (возвратиться к меню или предожит вам опцию для изменения графа через экранное табло). Если вы ответите Y, то система STATGRAPHICS подскажет вам номер под которым вы хотите сохранить файл, и идентифицирующий коментарий, который должен быть связан с файлом. Номером файла по умолчанию (воспроизведенным в скобках с подсказкой) всегда является 1. Вы можете использовать номер по умолчанию или выбрать другой номер файла. Если вы используете систему сдвоенных дисков, вы можете использовать дублирующие номера файлов, при условии что оба они не находятся на одном и том же диске. Если вы используете систему жестких дисков, каждый номер файла должен быть уникальным. Вы можете записать столько таких файлов, сколько позволяет имеющееся дисковое пространство. Если вы попытаетесь повторно использовать уже существующий номер файла, STATGRAPHICS воспроизведет предупреждение: ***** WARNING ***** GRAPH FILE ALREADY EXISTS ON DISK DO YOU WISH TO REPLACE IT? (NO): (графический файл уже существует на диске) (вы хотите его заменить?) Если вы ответите N, STATGRAPHICS подскажит вам другой номер файла и комментарий. Если вы ответите Y, то STATGRAPHICS сохранит граф в специфицированный файл, заменяя граф, который был там раньше. Графические файлы хранятся на диске с данными. Графические файлы идентифицируются как графические файлы воспроизведения системы STATGRAPHICS c именем STATX n.ASF, где n-число, которое вы специфицировали когда записывали файл. Вы можете воспроизвести графические файлы воспроизведения используя процедуру воспроизведения текста и графики, описанную в разделе 11.3. Это целесообразно если вы хотите быстро просмотреть граф до получения его на первом графопостроителе. Вы можете получить графы, храняшиеся в графических файлах воспроизведения используя процедуры, описанные в разделах с 12.3 по 12.5. ПРИМЕЧАНИЕ Если вы используете плату графического адаптера которая дает разрешающую способность более одного иона (например, цветной графический адаптер IBM), мы рекомендуем записывать графы, используя большую разрешающую способность. Коды цвета в ваших постоянных параметрах графиков (см. раздел 10.4.) будут храниться с графическим файлом воспроизведения, даже если они не будут воспроизводиться на вашем экране. 8. УСТАНОВЛЕНИЕ СВЯЗЕЙ ГРАФОПОСТРОИТЕЛЕЙ Первый шаг, который необходим для получения гра фа на графопостроителе - это установка канала связи между вашим графопостроителем и вашим персональным компьютером. Перед тем как это сделать, вы должны проверить, верная ли у вас имеется информация и оборудование: * Имеется ли ваш графопостроитель в списке поддерживаемых техсредств в руководстве "Open Me First"? * Имеете ли вы документацию и воспомогательные материалы (кабель,перья, бумагу и т.д,) для своего графопостроителя? Графопостроителям требуется специальный кабель, поэтому в том, что вы имеете кабель. * Имеет ли ваш персональный компьютер коммуникационный порт? Коммуникационные порты находятся сзади на вашем системном устройстве и называются (а иногда помечаются) как COM1 и COM2. Вы должны иметь по крайней мере один последовательный коммуникационный порт, чтобы использовать графопостроитель с вашим персональным компьютером. * Знаете ли вы где на вашем графопостроителе находятся гнезда связи и какие значения по умолчанию? Если нет, то перед тем как приступать к работе просмотрите документацию к вашему графопостроителю. * Скопировали ли вы файлы DOS.COMMAND.COM и MODE.COM и программный диск 1 или в ваш подсправочник STATGRAPHICS? Если нет, то сделайте это, следуя процедурам в разделе 5-5 (система двойных дисков) или разделе 5-7 (система жестких дисков)перед тем, как приступить к работе STATG RAPHICS требуется доступ к этим файлам, чтобы установить связь с вашим графопостроителем. * Использует ли ваш графопостроитель коммуника ционный протокол XON/XOFF? Этот протокол используется системой STATGRAPHICS. Вы должны использовать этот протокол, чтобы посылать графы системы STATGRAPHICS на ваш графопостроитель. * Ваш графопостроитель выключен? Если нет, то выключите его перед тем как приступить к работе. Чтобы установить канал связи между вашим персональным компьютером и графопостроителем, выбирайте процедуру SET COMMUNICATIONS SPEED AND PARITY (установка скорости передачи данных и четности). из меню интерфеса графопостроителя. Когда вы выберите эту процедуру, то будет воспроизведено табло инициализации связей. Допустимые элементы для каждого поля показанны справа от поля и обозначены a,b,c, и т.д.Значение по умолчанию для каждого поля показано в поле кода табло первон ачально воспроизводится.Например COM1 (выбор 2) - значение по умолчанию коммуникационного порта. Вы можете использовать любые допустимые варианты, но варианты, которые вы выбираете, должны соответствовать вариантам, установленным на вашем графопостроителе. Поля воспроизведенные на табло инициализацией связей, описываются ниже. Поле Описание ------------------------------------------------------------ PORT Специфицирует коммуникационный порт. Порт, который (порт) вы выбираете (COM1 или COM2) должен быть последова тельным портом. Представляется порт тестирования,т ак что вы можете направить графы на ваш экран, чтобы просмотреть их перед тем как посылать на графопостроитель. BAUD Специфицирует скорость в бодах, с которой данные (бод) передаются между вашим компьютером и графо- построителем. Значение по умолчанию равно1200 бодам (выбор е). PARITU Специфицирует четность, используемую для проверки (четность)связей внутренне. Значение по умолчанию-четный. DATA DITS Специфицирует число бит используемых для хранения (разряды символов внутрение значение по умолчанию-7. данных) STOP BITS Специфицирует число разрядов, используемых в качестве контрольных разрядов с каждым символом. Значение по умолчанию. Чтобы внести изменение в любое из выделенных полей, введите в поле символов табуляции и напечатайте по текущему элементу. Так как каждому полю требуется только один элемент то печать в любом поле автоматически переместит курсор к следующему полю. Вы можете перемещаться от поля к полю, делая любые желаемые изменения. Когда закончили все изменения, нажмите ENTER. Система STATGRAPHICS считает информацию и попытается установить канал связи. Если какой-нибудь элемент на вашем табло является недопустимым,то когда вы нажмете ENTRY, система STATGRAPHICS изменит этот элемент на последний допустимый выбор, используемый вами, и повторно воспроизведет табло, чтобы вы подтвердили, что вы имели в виду этот выбор. При установлении канала связи STATGRAPHICS выполняет команду DOS MODE и воспроизводит сл едующее сообщение, чтобы подтвердить успешную инициализацию связи: EXECUTENG DOS COMMAND: MODE COMn: speed, parity, word, stop COMn:speed, parity, word, stop (связь устанавливается, если нет указанных выше ошибок) COMMUNICATIONS ESTABLISHED UNLESS ERROR NOTED ABOVE Чтобы продолжить нажмите ENTER. Содержание сообщений, которые вы видите, будет меняться в зависимости от выбранного вами варианта связи. Если будет иметь место ошибка, это будет отмечено в вашем сообщении. Наиболее распространненая ошибка встречается когда в системном накопителе на дисках не имеется соответствующих DOS файлов. Если не воспроизведено сообщение об ошибках, то канал связи установлен. Нажмите ENTER, чтобы вернуться к тобло инициализации связей, и нажмите F10, чтобы выйти из процедуры. Когда вы выбираете "test" порт в табло инициализации связей, система STATGRAPHIS не выполняет команду DOS MODE. Она просто принимает ваши элементы и возвращает вас к табло инициализации связей Тогда вы можете использовать процедуры, описанные в разделе 12.5, чтобы проверить графы на вашем экране до того как их послать графопостроителю. Когда вы готовы послать графы на графопостроитель, выполните повторную процедуру установки скорости передачи данных и четности и выберите соответствующий порт (COM1 или COM2). ПРИМЕЧАНИЕ ---------- Вы должны использовать процедуру инициализации связей, описанную выше, даже если вы до этого выполнили команду DOSMODE вне STATGRAPHICS. Вы можете выбрать любой допустимый вариант связи, какой вы пожелаете, но вариант, который вы выбираете в STATGRAPHICS, должен соответствовать варианту, установленному на вашем графопостроителе. Вы должны инициализировать связь, когда ваш графопостроитель выключен. 12.4 УСТАНОВКА ИНТЕРФЕЙСА С ГРАФОПОСТРОИТЕЛЕМ После установки связи между своим персональным компьютером и графопостроителем, как описанно в разделе 12.3, вы готовы инициализировать ваш графопостроитель. Включите графопостроитель и выберите процедуру ESTABLISH PLOTTER INTERFACE (установка интерфейса графопостроителя) из меню интерфейса графопостроителя. Будет воспроизведено табло инициализации графопостроителя. Когда первоначально воспроизведено табло инициализации графопостроителя, то где следует в полях появляется значение по умолчанию. В последующих воспроизведениях появляется последние допустимые элементы, которые вы использовали. Ниже описаны поля, воспроизведенные в табло инициализации графопостроителя. Поле Описание ------------------------------------------------------------ TUPE OF Специфицирует тип графопостроителя, который вы PLOTTER используете. Допустимые элементы для того поля (тип гра- воспроизведены справа от поля и помечены a,b,c, фопостро- и т.д. ителя) Введите букву, соответствующую вашему графопо- строителю (например "а", если вы используете графопостроитель HEWLETT-PACKARD 7470) NUMBER OF Элементы специфицируют число графиков, которые .2601/01 PLOTS должны быть воспроизведены страницы (число Эти элементы разделяют окно бумаги (описанное графиков) ниже) на ряды и колонки, так чтобы несколько графиков может быть получено на одной странице каждый на отдельном ряду и колонке. Примеры параметров описаны ниже. Число графиков ------------------------------------------------------------ По ширине По высоте Результат 1 1 Один график 1 2 Два графика, один справа и один слева 2 1 Два графика, один внизу и один наверху 2 2 Четыре графика 3 3 Девять графиков Размером каждого графика управлют эти параметры: более крупные параметры дадут более мелкие графики, т.к. больше графиков должно поместиться на странице. Для графопостроителей, в которых используется бумага размером 8,5:11 дюймов, мы рекомендуем максимальный параметр 2,2 (четыре графика). Для графопостроителей, в которых используется бумага больших размеров, мы рекомендуем максимальный параметр 3,3 (девять графиков). Когда вы посылаете на графопостроитель свой графический файл воспроизведения (см. раздел 12.50), вас спросят указать местоположения (ряд, колонка) для графика. PAPER Элементы указывают какая часть физической страницы WINDOW должна использоваться графопостроителем. Элементы (окно должны быть выражены десятичными дробями между 0 и 1. бумаги) Исходные параметры (горизонтальные и вертикальные) определяют исходную точку окна бумаги от нижнего левого угла физической страницы. Значен ия параметров по умолчанию (0,0) делают начальную точ ку равной нижнему левому углу физической страницы Параметры 1,1 делают начальной точкой точку, котор ая отстоит на 10% вправо и на 10% вверх от нижненго л е- вого угла физической страницы. Параметры ширины (горизонтальный и вертикальны й) определяют ширину окна бумаги от начальной точки. Параметры по умолчанию 1,1 (когда использу ются с исходными параметрами 0,0) делают ширину бумажного окна равной всей физической странице. Параметры 8, (когда используются с исходными параметрами 1,1) делают ширину бумажного окна на 80% вправо и на 80 вверх от начальной точки. Параметры ширины 1,1 дол ж- ны использоваться только с исходными параметра ми 0,0. Окно графика (описанное в разделе 12.5) устанавливается относительно окна бумаги. ADVANCE Специфицирует должна ли бумага продвигаться PAPER графопостроителем автоматически. Параметром по умо л- (перед- чанию является N (No). Если вы используете вижение непрерывную подачу бумаги с графопостроителем, кот о- бумаги) рый предлагает такой выбор (например, IBM XY/750), вы можете ввести Y(YES). FRAME Специфицирует должен ли графопостроитель вычерчива ть PLOTS рамку вокруг каждого графика. Параметром по (рамки умолчанию является N. Если вы хотите, чтобы вокр уг графиков) каждого графика вычерчивалась рамка и вы н сохраняете рамку, как часть графика, в файле, вы можете ввести Y. PAUSE Специфицирует должен ли графопостроитель делать па узу PEN SELECT перед выбором каждого пера. Параметром по умолчан ию (пауза является N. Если вы хотите дать время на при выбо- переключение перьев, вы должны ввести Y. ре пера) Если вы используете паузы для пера,то графопостроитель будет делать паузу перед выбором каждого пера, и следующее сообщение будет воспроиз ведено на вашем экране: GET PET n Вы можете, если необходимо, переключить перья в эт от момент. Чтобы продолжать вычерчивание, нажми те ENTER. Паузы для пера замедляют процесс вычерчивания, но дают возможность использовать несколько цветов даж на графопостроителях (таких как HP7470А), которые имеют только два пера. PEN Специфицирует скорость, с которой чертят перья SPEED Допустимые значения 1 или 2. Параметр 1 (по умолча (скорость нию) специфицирует "нормальную" скорость, котор ая пера) определена для вашего графопостроителя. Параметр 2 специфицирует "переменную" скорость, которая опред е- лена для вашего графопостроителя. На некоторых графопостроителях нормальная скорос ть быстрее переменной. На других наоборот. Следу ет посмотреть документацию на ваш графопостроитель, ч тобы определить параметры0 нормальной и переменно cкоростей для вашего графопостроителя BUFFERING Специфицирует задержку (в сек.) между посылкой DELAY каждой строки данных с вашего компьтера на графо- (задержка построитель. Параметром по умолчанию является 0 буфериза- (нет задержки).Ваш компьютер может посылать данные ции) на графопостроитель быстрее, чем графопостроитель может вычерчивать. Задержка буферизации дает ваше- му графопостроителю время "догнать" передачу данны и избежать потери данных в процессе связи. В STATGRAPHICS коммуникационные порты буферизуются посредством использования протокола XON/XOFF. По этой причине задержка буфферизации обычно не требуется. ARC Специфицирует гладкость дуг, используемых для вы- SMOOTHNESS черчивания кругов. Параметры между 4 и 10 обычно (сглажи- дают желаемые результаты. Более мелкие параметры вание дуг) дают более гладкие дуги. PEN Специфицирует расстояние (в мм) между последова- THICKNESS тельными штрихами,используемыми для вычерчивания сплошного закрашивания. Этот параметр используетс только графопостроителями (такими как HP7475A), которые используют сплошное закрашивание.Параме- тром по умолчанию является 0,3. Параметры 0,3 и 0 ,7 обычно дают желаемые результаты. Чтобы изменить любое из выделенных полей в табло инициализации графопостроителя, введите символ табуляции в соответствующее поле и печатайте по текущему элементу. Когда закончите все изменения, нажмите ENTER. STATGRAPHICS считает элементы на вашем табло и установит интерфейс с вашим графопостроителем. Если какой-нибудь из элементов на ва- шем табло недопустимый, система STATGRAPHIS изменит этот элемент на ваш последний выбор. После установки интерфейса с графопостроителем, будет звуковой сигнал и флажок INPUT появится на строке состояния. Если вы хотите еще сделать изменения, вы можете их делать в это время. Нажмите ENTER после каждой серии изменений, чтобы использовать текущие параметры в интерфейсе графопостроителя. Если вы удовлетворены всеми параметрами нажмите F10, чтобы выйти из процедуры. 12.5 ПОСЫЛКА ЗАПИСАННЫХ ФАЙЛОВ НА ГРАФОПОСТРОИТЕЛЬ В этом разделе описывается как послать графические файлы воспроизведения системы STATGRAPHICS на ваш перьевой графопостроитель. Перед тем как послать файл на графопостроитель вы должны: * Установить связь между вашим персональным компьютером и вашим графопостроителем, как описано в разделе 12.3. * Инициализировать ваш графопостроитель, как описано выше в разделе 12.4. После завершения установки связи и инициализации графопостроителя вы готовы послать графический файл на ваш графопостроитель. Выберите SEND RECORDED FILES TO PLOTER из меню интерфейса графопостроителя. Система STATGRAPHICS воспроизведет список файлов текста и графического воспроизведения, находящиеся в настоящее время на диске данных. Если вы не видите файл который ищите, то вероятно он хранится на другом диске. Следующая информация воспроизводится для каждого файла: * Имя файла: все графические файлы воспроизведения имеют имя STATXn где n-номер, который вы присвоили вашему графу, когда записывали его, используя средство записи (см. раздел 12.2). Только графические файлы воспроизведения могут быть посланы на графопостроитель. * Диск:-буква обычного В или С обозначающая ваш дисковый накопитель данных Поля, воспроизведенные на табло выбора графиков, описываются ниже: Поле Описание ------------------------------------------------------------ POSITION Элементы специфицируют позицию для текущего графика Ряд 1 и колонка 1 -являются параметрами по умолчани для первого графика. Общее число рядов и колонок вы специфицировали когда устанавливали интерфейс с гра фопостроителем (см.раздел 12.4). Например, если вы специфицировали 2 графика по горизонтале и ширине и 3 графика по вертикале и по высоте,тогда вы будет иметь 2 ряда и 3 колонки. Ряды и колонки на бумаге графопостроителя пронумерованы так как показано ниж Например, ряд 1 и колонка 1 определяют график в ниж нем левом углу бумаги. Ряд 3 и колонка 3 определяю график в правом верхнем углу бумаги. Графики нумеруются от левого нижнего угла бумаги, если страница рассматривается горизонтально. PLOT Элементы специфицируют какая часть окна бумаги буде WINDOW использоваться графиком. яэлементы должны выражатьс (окно десятичными дробями между 0 и 1. графика) Окно графика определяется относительно окна бумаги числа графиков, которое вы специфицировали, когда устанавливали интерфейс с вашим графопостроителем (см. радел 12.4). Например, если вы специфицировали 2 графика по горизонтали и по ширине страницы и два графика по высоте (всего 4 графика), каждое окно графика займет одну четверть окна бумаги, которое вы определили. Исходные параметры (горизонтальный и вертикальный) определяют начальную точку для начала вашего графика от левого нижнего угла текущего окна графика. Параметры ширины определяют (горизонтальны и вертикальный) ширину окна графика от начальной точки. Параметры ширины 1,1 должны использоваться только с исходными параметрами 0,0. LABELING Элементы специфицируют число точек, которые должны NO.OF использоваться в метках, воспроизводимых по ширине CHARACTERS страниц и внизу страницы. Эти элементы управляют (марки- размером символов. Более крупные числа дают более рование мелкие символы. Параметрами по умолчанию являются номера 80 по ширине и 25 по длине. символов) Если в ваших графиках происходит перекрывание текста, используйте символы поменьше. Если текст в ваших графиках нечеткий, используйте символ покрупнее. POINT Элементы специфицируют стандартные символы кода SYMBOLS ASCII, которые должны использоваться как точечные (точечные символы. Восемь точечных символов в STATGRAPHICS символы) (см раздел 8-3) могут быть определены, чтобы соответствовать символам на стандартной клавиатур (числа, заглавгые буквы, строчные буквы, точка,за- пятая, знак доллара и т.д. STATGRAPHICS даст звуко- вой сигнал, если вы попытаетесь ввести недопустимый сигнал. SYMBOL Элементы специфицируют ширину и глубину точечных SIZE как процент от общего размера графика. Параметрами (размер по умолчанию являются 0.01,0.01. Параметры между символа) 0.01 и 0.04 обычно дают желаемые результаты. PEN Элементы специфицируют номера перьев, которые NUMBER должны быть связаны с кодами цветов системы (номер STATGRAPHICS. Значения по умолчанию для номеров пера) перьев будут различными, в зависимости от числа перьев, имеющихся на вашем графопостроителе. Коды цветов системы STATGRAPHICS воспроизводятся слева от поля номера. Чтобы опредилить коды цве- тов, используемых для линий, точек, текстов, осей рамок и т.д., посмотрите параметры в табло выбора параметров графика (см. раздел 10-4) Вы можете изменять используемые цвета путем замены перьев (поместив другое цветное перо) или путем изменения номера пера в этом поле. Если вы захотите использовать паузы для пера, когда вы установите интерфейс с вашим графопостроителем (см. раздел 12.4), вы сможете использовать несколько цветов даже на графопостроителях, которые имеют только два пера. SHADE Элементы специфицируют образцы оттенков графопост- PATTERN роителя, которые должны быть связаны с образцами (образцы закрашивания системы STATGRAPHICS. Образцы оттенков оттенков) графопостроителя определены ниже: 1-сплошное закрашивание 2-горизонтальное закрашивание 3-вертикальные линии 4-перекрестные штрихи 5-правые диагональные линии 6-левые диагональные линии 7-диагональные перекрестные штрихи Образцы закрашивания системы STATGRAPHICS воспроиз- ведены слева от поля образцов оттенков и описаны в разделе 14.11. На графопостроителях,которые исполь- зуют сплошное закрашивание (такие как HP7475A) сплошные линии и горизонтальные линии дадут различные результаты. На графопостроителях,которые не используют сплошные закрашивания, сплошные закрашивания и горизонтальные линии дадут одинаковы результаты. SHADE Элементы специфицируют промежуток между линиями SPACING как процент окна графиков. Параметром по умочанию (пропуск является 0.01. оттенков) Чтобы внести изменения в любое из выделенных полей на табло выбора графиков, введите символ табуляции в соответствующее поле и напечатайте по текущему элементу. Когда все изменения закончены, нажмите ENTER. Если какой-либо из элементов на вашем табло является ошибочным то система STATGRAPHICS изменит этот элемент на последний допустимый выбор. Система STATGRAPHICS тогда будет чертить граф в выбранном вами графическом файле воспроизведения, используя спецификацииданные в табло выбора графиков. Пока ваш граф вычерчивается, ваш экран будет пустым, за исключением строки состояния. Флаг PROCESS будет мигать до тех пор пока не будет закончен граф. Если вы выбрали использование пауз для пера, когда установили интерфейс со своим графопостроителем (см. раздел 12.4), то сообщения, подсказывающие вам сменить перья, появятся на вашем экране. Перед тем как нажать ENTER, чтобы начать вычерчивание графика проверьте следующее: * Просмотрите элементы в вашем табло выбора графиков, чтобы убедиться что они правильные. * Проверьте ваш графопостроитель, чтобы убедиться, что бумага загружена правильно и вставлены правильные перья. График был записан в графическом файл воспроизведения посредством использования цветного графического адаптера IBM в режиме высокой разрешающей способности. Затем файл был воспроизведен на графопостроителе НР 7470А. График представляет приблизительно 70% от своего первоначального размера. Чтобы воспроизвести график предпримите следующие шаги: 1. Если необходимо, инициализируйте повторно вашу систему (см.раздел 10.6) или выберите новые экранные варианты (см.раздел 10.3) так, что вы будете использовать режим графики с высокой разрешающей способностью. 2. Если необходимо, считайте следующие переменные из файла GARDATA на вашем диске наборов данных выборки: MPG, WEIGHT, HORSEPOWER, ORIGIN. 3. Выберите процедуру трехмерного графика разброса (дорожка Е8) 4. Нажмите F4, чтобы включить средство записи. 5. Введите следующие выражения в ответ на подсказки для переменных осей Х-,Y-,Z-: mpg SELECT origin EQ 2 horsepower SELECT origin EQ 2 weight SELECT origin EQ 2 Это выберет оценки пробега (автомобиля) в милях, лошадинные силы и веса для автомобилей, созданных в Европе (origin EQ 2) 6. Когда график воспроизведен, нажмите F2, чтобы использовать интерактивное средство маркирования. Модифицируйте верхние заголовки и оси -Х, -Y, -Z посредством вызова каждого заголовка, удаления каждого заголовка и печати более описательного заголовка. (Инструкции по использованию интерактивного средства маркирования даны в разделе 8.2) 7. Нажмите ENTER. Система STATGRAPHICS спросит, хотите ли вы сохранить граф. Ответьте Y, тогда STATGRAPHICS подскажет вам номер графического файла воспроизведения, который вы хотите использовать, чтобы сохра нить граф, и комментарий. Ответьте на эти подсказки и файл будет сохранен. Затем вы будете возвращены в меню функций построения графиков. 8. Нажмите F4, чтобы отключить средство считывания. 9. Используйте процедуры, описанные в разделах 12.3,12.4,12 5, чтобы установить связи между вашим компьютером и графопостроителем, чтобы установить интерфейс с графопостроителем, и, чтобы послать записанный файл на ваш графопостроитель. Параметры, которые вы специфицируете, должны быть совместимы с вашим графопостроителем. .3460 Г Л А В А 13 ФУНКЦИИ ВЫЧЕРЧИВАНИЯ ГРАФИКОВ 13.1. ВВЕДЕНИЕ Функции вычерчивания графиков предоставляют 13 процедур вычерчивания графиков, которые вы можете использовать для создания различных графиков из числовых векторов и матриц. Эти процедуры построения графиков суммируются ниже и описываются подробно в разделах с 13.2 по 13.4. процедура число тип описание переменных данных ------------------------------------------------------------ X-Y 2 и более N вычерчивает SCATTERPLOT точечные (график символы разброса) CODED X-Y 3 или 4 N использует закоди- SCATTERPLOT рованные точечные (закодированный символы или цифры график чтобы указать уровни разброса) фактора классификации CONNECTED X-Y 2 и более N Создает двумерный SCATTERPLOT линейный график с (связанный одной переменной на график оси X одной и одной разброса) или более перемен- ными на оси Y. X-Y ZINEPLOT 2 или более N Вычерчивает линии связи (линейный не используя точечные график) символы ZOG PLOT 2 N Создает граф, в котором (график в одна или обе оси имеют логарифмическом масштабирование с основ а- масштабе) нием логарифма 10. STANDARD 4 N Создает X-Y график разб ро- ERROR BARS са со штрихами стандарт ных (график со ошибок для оси Х или ос и Y штрихами или для обеих осей. стандартных ошибок) X-Y-Z PLOT 3 N Создает трехмерный граф ик разброса для трех перем ен- ных. THREE-DIMENSIONAL 3 N Вычерчивает трехмерный SCATTERPLOT график разброса для тре (трехмерный переменных. Включает график разброса) вертикальные линии из к аждой точки вниз на X-Y. BASIC 3 N Создает трехмерный граф ик SURFACE с сетчатой поверхностью PLOT для функции z=f(x,y); (график основной невидимые линии не поверхности) удаляются QUICK HIDDEN- 3 N То же, что и BASIC SURFA CE ZINE SURFACE PLOT PLOT, но невидимые линии (график поверхности удаляются путем использо быстрым удалением вания быстрого алгоритма невидимых линий) удаления. BEST HIDDEN- 3 N То же что и BASIC SURFAC ZINE SURFACE PLOT (график основной поверхно (график поверхностей сти), но невидимые линии с качественным удаляются посредством ис- удалением невидимых пользования лучшего алго- линий ритма удаления, чем алго- ритм представляемый с про цедурой QUICK HIDDEN-ZINE CONNECTERD 3 N Создает контурный график CONTEUR из данных, записанных по PLOT прямоугольной сетке X-Y. (график соединенных точек контуров) POINT 3 N То же, что и CONNECTED CONTOUR CONTOUR PLOT(связанный PLOT контурный график),но нет (график точек контура) соеденительных линий. Чтобы прогнать примеры в этой главе, считайте следующие переменные из диска наборов данных выборки системы STATGRAPHICS: FINAME YARIABLES TSDATA ggb GARDATA mpg, horsepower, cylinders, weight, origin RSCDATA binormx, binormy, binormmat, secondx, secondy secondmat Инструкции по считыванию переменных в вашу рабочую область см. раздел 9.6. Когда вы создадите графики, описанные в этой главе, система STATGRAPHIC выберет значение по умолчанию для заголовков, осей, масштабирования, типов линий, и типов точек. Часто вы можете модифицировать эти значения для графика, с которым вы работаете, нажав ENTER после воспроизведения графика, и затем ответив Y на следующую подсказку: DO YOU WANT TO MODIFY THE PLOT? (N/Y): (вы хотите модифицировать график?) Если вы ответите Y, будет воспроизведено табло выбора временного варианта графика. Вы можете модифицировать любое из полей, которые появляются на экране (см. раздел 8.3) Значением по умолчанию для этой подсказки является N. Если вы введете N,или нажмете ENTER в ответ на подсказку, вы будете возвращены к меню функций построения графиков. Не все процедуры в этом разделе дают табло модификации графиков. Если этого табло не имеется для процедуры, которую вы используете, то нажмите ENTER после воспроизведения графа, возвратит вас к меню функций построения графиков. Интерактивное средство маркирования, доступ к которому осуществляется посредством использования F2, может быть использовано на любом активном графическом экране; (см. раздел 8.2). Система STATGRAPHICS также предоставляет процедуру выбора новых вариан тов графика, которая позволяет делать постоянные изменения параметров графика,таких как цвет, размер точки и точка набюдения, и добавлять или удалять элементы, такие как рамки, границы и сетки. Изменения, сделанные посредством использования этой процедуры, сохраняются и таким образом влияют на последующие графики. Информацию по использованию этой процедуры см. в разделе 10.4 13.2. X-Y ГРАФИК РАЗБРОСА ОПРЕДЕЛЕНИЕ ----------- X-Y график разброса является уместной процедурой для использования, когда вы хотите построить только точечные символы (без соединительных линий) для двух и более переменных. ВВОД ДАННЫХ: ------------ Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WICTH данные,которые вы хотите вычертить по оси Х OBSERVATIONS FOR X-AXIS (введите имя переменной наблюдениями для оси Х) ENTER NAME OF Введите имя цифрового вектора, содержащего VARITABLE WITH данные,которые вы хотите вычертить по оси OBSERVATIONS FOR X. Этот вектор должен быть такой же длины что и первый. ENTER NAME OF Введите имя любого дополнительного цифровог ADDITINAL вектора, который вы хотите вычертить по оси VARIABLE WITH Y. Эта подсказка будет повторяться до тех OBSERVATIONS FOR пор, пока вы не нажмете ENTER ,не дав имени Y-AXIS переменной, чтобы показать что вы закончили ввод данных. Все векторы должны быть такой же длины, что и первый. ПРИМЕР ------- В этом примере мы рассмотрим связь между весами и оценками пробега автомобиля в милях для нашего примера из 155 автомобилей. Когда появляется подсказка оси Х, введите: weight (вес) Когда появится подсказка оси Y, введите: mpg. Нажмите ENTER, когда появится третья подсказка, т.к. мы хотим работать только с переменной оси Y. Будет воспроизведен график разброса. График разброса наглядно иллюстрирует обратную связь между весом машины и милями на галлон. Заметьте, что горизонтальная ось для веса находится в пределах от 1700 до 4700. Обозначение (Х100) в конце оси Х означает что метки (17-47) должны быть умножены на 100, чтобы получилась их действительная величина. Дважды нажмите ENTER, чтобы вернуться к меню функций создания графиков. 13.3 ЗАКОДИРОВАННЫЙ ГРАФИК РАЗБРОСА Х-Y (В ОСЯХ Х-Y) ОПРЕДЕЛЕНИЕ ----------- Закодированный график разброса Х-Y делает основной график разброса более информативным помредством использования закодированных точечных символов для указания уровней фактора классификации. Могут быть специфицированны как типы точечных символов, так и цвета (информацию о цветах которые вы можете использовать, проверьте в вашем графическом адаптере). ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите ычертить по оси Х. OBSERVATIONS FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите вычертить по оси Х. OBSERVATIONS FOR Этот вектор должен быть такой же длины как и Y-AXIS первый. ENTER NAME OF Введите имя вектора, содержащего точечные VARIABLE WITH символы, которые должны использоваться для POINT CODES графика. Эта переменная может быть цифрово или символьной, и такой же длины, как первые два вектора. Цифровая переменная должна содержать только целые числа. Если вы выбираете символьную переменную, будут использоваться действительные символ ы. ENTER NAME OF Если вы используете цветной графический VARIABLE WITH монитор или предполагаете послать граф на POIN COLORS перьевой графопостроитель, вы можете воспроизвести каждый точечный код в раз- ном цвете, чтобы улучшить удобочитаемость и понимание. Чтобы воспроизвести коды в разных цветах, введите имя переменной, содержащей коды цветов для точечных сим- волов. Вы должны дать значение для каждо- го из элементов в переменной точечного код а. Нажмите ENTER в ответ на эту подсказку, если вы не хотите кодирования цветов. ПРИМЕР ------ В этом примере мы еще раз рассмотрим взаимосвязь между весом автомобиля и оценкой пробега в милях, добавив информацию к графику, указывающую число цилиндров и страну производителя для каждого автомобиля. Когда появится подсказка оси Х, введите:weight. Когда появится подсказка оси Y,введите:mpg. В ответ на подсказку для кодов точек, введите cylinders. Система заменит каждый точечный символ соответствующим значением для цилиндров (4,5,6 или 8). Когда вам подсказывают (ввести) переменную содержащую цвета ваших точек, введите origin. Если у вас цветной монитор, значение каждого цилиндра будет окрашено в соответствии со страной-производителем (1,2,3). Заметьте, что граф явно дополняет информацию представенную на основном графике разброса X-Y. Каждый точечный символ дает число цилиндров, связанных с данным автомобилем и закодирован в соответствии со страной-производителем (окрашен). Когда вы закончили осматривать граф, нажмите ENTER, чтобы вернуться в меню функцией построения графиков. 13.4. СВЯЗАННЫЙ ГРАФИК РАЗБРОСА X-Y Вы можете использовать процедуру связанный график разброса X-Y, чтобы создать двумерный линейный график с одной переменной на оси Х и с одной или более переменными на оси Y. Эта процедура создает связанный линейный график с точечными символами. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WICCTH данные, которые вы хотите вычертить по оси OBSERVATIONS FOR X. X-AXIS: ENTER NAME OF Введите имя цифрового вектора, содержащего VARITABLE WITH данные, которые вы хотите вычертить по оси OBSERVATIONS FOR Y. Этот вектор должен быть такой же длины Y-AXIS как и первый. ENTER NAME OF Введите имя любого дополнительного цифрово го ADDITIONAL вектора, который вы хотите вычертить по ос VARIABLE WITH Y. Эта подсказка будет повторяться до тех OBSERVATIONS FOR пор, пока вы не нажмете ENTER,не предостав ив Y-AXIS: имя переменной, чтобы показать, что вы закончили ввод данных.Все векторы должны быть такой же длины как и первый. ПРИМЕР ------ В этом примере мы будем использовать данные по месячному объему перевозок по мосту Золотые Ворота за период в 168 месяцев. Когда появится подсказка оси Y, введите: COUNT SIZE ggb. Будьте внимательны, чтобы ввести это выражение точно как показано: вводите операторы COUNT u SIZE используя только заглавные буквы, а имя переменной ggb,используя только строчные буквы. Это выражение создает вектор, содержащий все целые числа от одного до числа наблюдений в переменной ggb (в данном случае 168) и гарантирует, что вектор Х-оси точно отражает число временных периодов, предствленных в вашей переменной данных. Когда появится подсказка оси Y,введите ggb. Нажмите ENTER, когда появится третья подсказка, т.к. мы хотим работать только с одной переменной оси Y. Будет воспроизведен граф. 13.5 X-Y ЛИНЕЙНЫЙ ГРАФИК ОПРЕДЕЛЕНИЕ ----------- X-Y линейный график целесообразен для воспроизведения функциональной связи, которой не торебуется точечных символов. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите вычертить на оси Х. OBSERVATIONS FOR X-AXIS: ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите вычертить по оси Y. OBSERVATIONS FOR Этот вектор должен быть такой же длины как и Y-AXIS первый. ENTER NAME OF Введите имя любого дополнительного цифрово го ADDITIONAL вектора, который вы хотите вычертить на ос и Y. VARITABLE Эта подсказка будет повторяться до тех пор WITH OBSERVATIONS пока не нажмете ENTER, не предоставив имен FOR Y-AXIS переменной, показав тем самым, что вы закончили ввод данных. Все векторы должны быть такой же длины как и первый ПРИМЕР ------ Для этого примера мы вычертим график логарифмов целых чисел от 1 до 25. Когда появится подсказка оси Х,введите COUNT 25, чтобы получить вектор содержащий целые числа от 1 до 25. Когда появится подсказка оси Y, введите LOG COUNT 25, чтобы найти логарифмы целых чисел от 1 до 25. Нажмите ENTER, когда появится третья подсказка, т.к. мы хотим работать только с одной переменной оси Y. График натуральных логарифмов целых чисел от 1 до 25 будет изображен. Нажмите ENTER дважды, чтобы вернуться к меню функций построения графиков. 13.6. ГРАФИК В ЛОГАРИФМИЧЕСКОМ МАСШТАБЕ ОПРЕДЕЛЕНИЕ ----------- Процедура ZOG PLOT (построение графика в логарифмическом масштабея) позволяет преобразовать одну или обе оси в логарифмическое масштабирование с основанием логарифма 10, чтобы дать вам другой вид ваших данных. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- ENTER NAME OF Введите имя цифрового вектора, который вы VARIABLE WITH хотите вычертить по оси Х. OBSERVANINS FOR X-AXIS: ENTER NAME OF Ведите имя цифрового вектора, который вы VARIABLE WITH хотите вычертить на оси Y. Этот вектор OBSERVATIONS FOR должен быть такой же длины как и первый. Y-AXIS DO YOU WANT LOG Введите Y или нажмите ENTER, если хотите SCALING FOR логарифмическое масштабирование на оси Х THE X-AXIS? Введите N, если вы не хотите логарифмиче с- (Y/N): кого масштабирования. Эта подсказка не появится, если данные для оси содержат нули или отрицательные числа, т.к. в эти случаях нельзя искать логарифмы. DO YOU WANT LOG Введите Y или нажмите ENTER, усли вы хот ите SCALING FOR логарифмическое масштабирование на оси Y THE Y-AXIS? Введите N, если вы не хоти те логарифмического масштабирования. Эта (Y/N): подсказка, не появиться, если данные для оси содержат нули или отрицательные числ а, т.к.в этих случаях нельзя получить логар ифмы. ПРИМЕР ------ В этом примере мы опять рассмотрим связь между весом автомобилей и оценкой пробега автомобиля в милях. Когда появится подсказка оси Х, введите WTIGHT. Когда появится подсказка оси Y,введите mpg. Затем система спросит хотите ли вы логарифмическое масштабирование на оси Х и на оси Y. Введите Y, чтобы специфицировать логарифмическое масштабирование для оси Х и N, чтобы специфицировать нормальное масштабирование для оси Y. Будет воспроизведен график логарифма. Когда вы закончили рассматривать график, нажмите ENTER дважды, чтобы вернуться к меню функций построения графиков. 13.7 ГРАФИК СО ШТРИХАМИ СТАНДАРТНЫХ ОШИБОК ОПРЕДЕЛЕНИЕ ----------- Если местоположения точек в графике разброса представляют средние а не отдельные значения, вы можете посчитать целесообразным проилюстрировать погрешность, окружающую местонахождение точек. Штрихи стандартных ошибок-это линии, выходящие из среднего значения, плюс-минус одно стандартное отклонение в каждом направлении. Процедура штрихов стандартных ошибок позволяет вычертить штрихи стандартных ошибок для переменной Х, переменной Y, или для обеих переменных. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите вычертить по оси OBSERVATIONS FOR X. X-AXIS ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH данные, которые вы хотите вычертить по оси Y. OBSERVATIONS FOR Этот вектор должен быть такой же длины ка Y-AXIS: первый ENTER NAME OF Введите имя переменной, которая содержит VARIABLE WITH стандартные ошибки для переменной оси Х. STANDARD ERRORS Этот вектор должен быть такой же длины как FOR Y-AXIS первый. VARIABLE ENTER NAME OF Введите имя переменной, которая содержит VARIABLE WITH стандартные ошибки для переменной оси Y. STANDARD ERRORS Этот вектор должен быть такой же длины как FOR Y-AXIS первый VARIABLE ПРИМЕР ------ В этом примере мы построим график со штрихами стандартных ошибок для средних значений оценок пробега автомобилей в милях и их весов классифицированных по их происхождению (страна-изготовитель), для нашего примера из 155 автомобилей. Процедура кодовый словарь (см. раздел 14.9) использовалась для вычисления следующих статистических данных по нашим автомобилям: страна среднее средняя среднее стандартная значение погрешность значени ошибка ------------------------------------------------------------ США (85 автом.) 25.26 0.66 2947 63 Европа(25 автом.) 32.55 1.64 2533 110 Япония(44 автом.) 33.48 0.39 2226 47 Когда появится подсказка для переменной оси Х, введите среднее значение для оценок пробега автомобилей в милях: 25.26 32.55 33.48 Когда появится подсказка для переменной оси Y, введите среднее значение для весов: 2947 2533 2226 Когда появится подсказка для стандартных ошибок оси Х, введите: 0.66 1.64 0.38 Когда появится подсказка для стандартных ошибок оси Y, введите: 63 110 47 Будет воспроизведен график стандартных ошибок. Заметьте, что т.к. мы ввели исходные данные, а не имена переменных, то заголовки в нашем графике не очень информативны. Используйте табло выбора временных ва риантов графика (см. раздел 8.3), чтобы изменить заголовки. Затем используйте интерактивное средство маркирования (см. раздел 8.2), чтобы маркировать эти три строки с соответс твующим происхождением. Заметьте большую погрешность, окружающую точки данных для европейских автомобилей, обозначенную большими штрихами стандартных ошибок. Нажмите ENTER дважды, чтобы возвратиться к меню функций постро графиков 13.8 ГРАФИК Х-Y-Z ОПРЕДЕЛЕНИЕ ----------- Процедура Графика X-Y-Z позволяет вычертить три переменные или изучить связи между переменными, гляд я на распределение точек. Процедура создает трехмерный граф с осью Х, вычерченной горизонтально по низу экрана, осью Y, уходящей назад в экран, и осью Z расположенной вертикально. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, который вы VARIABLE WITH хотите вычертить по оси Х. OBSERVATIONS FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора, который вы VARITABLE WITH хотите вычертить по оси Y. Этот вектор дол жен OBSERVATIONS FOR быть такой же длины, как и первый. Y-AXIS ENTER NAME OF Введите имя цифрового вектора, который вы VARITABLE WITH хотите вычертить по оси Z. Этот вектор OBSERVATIONS должен такой же длины как и первый. FOR Z-AXIS ПРИМЕР ------ В этом примере мы рассматриваем связи между лошад иными силами, пробегом в милях и весом для нашего примера из 155 автомобилей. Когда появится подсказки для осей Х, Y, Z, введите horsepower для переменной оси Х, weight для переменной оси Y, mpg для переменной Z. Будет воспроизведен трехмерный график. На этом графике используется стандартная точка наблюдения, равная (600, -1600, 800) (Чтобы изменить эту точку наблюдения, см.раздел 10.4). Нажмите ENTER дважды, чтобы вернуться к меню функций построения графиков. 13.9. ТРЕХМЕРНЫЙ ГРАФИК РАЗБРОСА ОПРЕДЕЛЕНИЕ ----------- Процедура трехмерного графика разброса идентична графику X-Y-Z (см. раздел 13.8), за исключением того, что из каждой точки вниз на плоскость Х-Y проводятся вертикальные линии. Этот график представляет подсказки глубины которые используются, для интерпритации позиций точек. Процедура трехмерного графика разброса следует выбирать, когда вы хотите проанализировать только небольшое количество значений данных т.к. большое количество значений данных, т.к. большое количество линий протянувшихся на плоскость X-Y, могут сливаться, затрудняя чтение графа. Большое количество точек может быть более четко вычерчено, если вы используете режим высокой разрешающей способности на вашем графическом адаптере. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, который вы VARIABLE WITH хотите вычертить по оси Х. OBSERVATIONS FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора, который вы YARIABLE WITH хотите вычертить по оси Y. Этот вектор OBSERVATIONS должен быть такой же длины как и первый. FOR Y-AXIS ENTER NAME OF Введите имя цифрового вектора, который вы VARIABLE WITH хотите вычертить по оси Z. Это вектор OBSERVATIONS должен быть такой же длины как и первый. FOR Z-AXIS. ПРИМЕР ------ В этом примере мы вновь рассмотрим связи между мощностью и пробегом в милях. Когда на экране появятся подсказки для осей X,Y,Z введите horsepower для переменной Х, weight для переменной оси Y, mpg для переменной оси Z. Будет воспроизведен граф. Заметьте как вертикальные линии, соединяющие точки с плоскостью Х-Y,облегчают опре- деление значений точек. Нажмите ENTER, чтобы вернуться к меню функций построения графиков. 13.10 ГРАФИК ОСНОВНОЙ ПОВЕРХНОСТИ ОПРЕДЕЛЕНИЕ ----------- Процедура графика основной поверхности создает трехмерный график с сетчатой поверхностью для функции z=f (x,y). Построенный график рассматривается с точки вне области графика под острым углом к осям Х и Y. Данные для графика должны быть в форме матрицы значений Z. В матрице зна чений Z ряды представляют собой постоянные значения Х с возрастающими значениями, а колонки представляю т собой постоянные значения Y с возрастающими значениями Х. Невидимые инии в этой процедуре не удаляются. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARITABLE WITH значения для оси Х. VALUES FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора,содержащего VARITABLE WITH значения для оси Y. Он может не быть такой VALUES FOR же длины как первый цифровой вектор:значе- Y-AXIS ния которые вы вводите для оси Х, соответ- ствуют рядам графика, тогда как значения, вводимые для оси Y, соответствуют колонкам графика. ENTER NAME OF Введите имя матрицы,которая содержит высот MATRIS WITH поверхности при каждой комбинации Х u Y. VALUES OVER THE Число рядов и колонок в матрице должно со- X-Y GRID ответствовать длинам цифровых векторов данных которые вы ввели для осей Х и Y. LINES PARALLELTO Введите Х, чтобы вычертить линии поверхнос ти X-AXIS,Y-AXIS параллельно оси Х. Введите Y,чтобы вычерти ть OR BOTH? линии поверхности параллельно оси Y. Введи те (BOTH/X/Y): B(BOTH), или нажмите ENTER, чтобы вычерти ть линии поверхности параллельно обеим осям Х и Y. ПРИМЕР ------ В этом примере мы используем данные по объему перевозок за месяц Золотые Ворота в течение 168 месяцев. Мы вычертим значения для каждого года по оси Х, и для каждого месяца по оси Y, получив отображения колебаний за месяц и в течение года. Когда появится подсказка дляоси Х, введите COUNT 14, чтобы получить вектор, содержащий целые числа от 1 до 14, представляющие каждый из 14 лет в течение которых велись наблюдения. Когда появится подсказка для оси Y, введите COUNT 12, чтобы получить вектор, содержащий целые числа от1 до 12, представляющие месяцы в году. Чтобы указать высоту поверхности при каждой комбинации Х (рядов) и Y (колонок), используйте оператор RESHAPE, чтобы переформировать вектор ggb в матрицу размером 14 на 12. 14 12 RESHAPE ggb В ответ на четвертую подсказку нажмите ENTER. чтобы сказать, что вы хотите линии параллельные обеим осям X u Y. Будет воспроизведен график поверхности. Заметьте, что невидимые линии в этой процедуре не удаляются: результатирующий граф появляется, чтобы изобразить прозрачную трехмерную поверхность. Этот график выделяет несколько характеристик данных ggb: * общая тенденция к повышению с течением лет; * картина по сезонас с пиком на восьмом месяце; * большой острый выступ вниз, соответствующий нехватке бензина в 1973 году и ее влияние на этот год. Когда вы закончите рассматривать граф нажмите ENTER, чтобы возвратиться к меню функций построения графиков. 13.11 ГРАФИК ПОВЕРХНОСТИ С БЫСТРЫМ УДАЛЕНИЕМ НЕВИДИМЫХ ЛИНИЙ. ОПРЕДЕЛЕНИЕ ------------ Процедура графика поверхности с быстрым удалением невидимых линий создает трехмерный график с сетчатой поверхностью для функции z=f (x,y). График рассматривается из точки вне области графика под острым углом к осям X u Y. Данные для графика должны быть в форме матрицы значений z. В матрице значений z ряды представляют постоянные значения Х с возрас тающими значениями Y, а колонки представляют собой постоянные значения с возрастающими значениями Х. Невидимые линии в этой процедуре удаляются путем использования быстрого, но не полного алгоритма. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Х. VALUES FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для Y. Он может не быть такой же VALUES FOR длины как первый цифровой вектор: значения, Y-AXIS которые вы вводите для оси Х,соответствуют рядам графика, тогда как значения, которые вы вводите для оси Y,соответствуют колонкам графика. ENTER NAME OF Введите имя матрицы, содержащей высоту MATRIX WITH поверхности в каждой комбинации Х и Y. Число VALUES OVER рядов и колонок в матрице должно THE X-Y GRID: соответствовать длинам цифровых векто ров, вводимых для осей X,Y. LINES PARALLEL Введите Х, чтобы вычертить линии поверхности ТО X-AXIS,Y- параллельно оси Х. Введите Y,чтобы вычертить AXIS OR BOTH? линии поверхности параллельно оси Y.Введите (BOTH/X/Y): или нажмите ENTER, чтобы вычертить линии поверхности параллельно обеим осям X u Y. ПРИМЕР ------ В этом примере мы вычертим функцию z=x*x+y*y-2xy, в интервале х из (-10;10), y из (-5;5). Данные для этого примера были созданы посредством процедуры генерации поверхности ответов, описанной в разделе 28.4, используя выбор для полинома второго порядка в X и Y. Когда появится подсказка для переменной оси Х, введите secondx. Когда появится подсказка для матрицы, введите socondmat. Когда появится подсказка для переменной оси Y,введите secondy Затем введите Х, чтобы вычертить линии только параллельные оси Х. Будет воспроизведен граф. Заметьте что невидимые линии были частично удалены. Когда вы закончили рассматривать граф, нажмите ENTER,чтобы возвратиться к меню функций построения графиков. 13.12 ГРАФИК ПОВЕРХНОСТИ С БОЛЕЕ КАЧЕСТВЕННЫМ УДАЛЕНИЕМ НЕВИДИМЫХ ЛИНИЙ. ОПРЕДЕЛЕНИЕ ----------- Процедура графика поверхности с более качественным удалением невидимых линий создает трехмерный график с сетчатой поверхностью для функции z=f (x,y). График рассматривается из точки вне области графика под острым углом к осям X u Y. Данные для графика должны быть в форме матрицы значений z. В матрице значений Z ряды представляют собой постоянные значения Х с возрастающими значениями Y, а колонки представляют постоянные значения Y с возрастающими значениями Х. Невидимые линии удаляются из графа, посредством использования лучшего алгоритма удаления, чем алгоритм представляемый с процедурой быстрой невидимой линии. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Х. VALUES FOR X-AXIS: ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Y. Он может быть не такой VALUES FOR как первый цифровой вектор: значения,которы Y-AXIS вы вводите для оси Х, соответствуют рядам графика, тогда как значения, которые вы вводите для оси Y соответствуют колонкам графика. ENTER NAME OF Введите имя матрицы, содержащей высоту пове р- MATRIX WITH хности при каждой комбинации Х и Y. Число VALUES OVER рядов и колонок в матрице должно соответст- THE X-Y вовать длинам цифровых векторов,которые вы GRID ввели для осей X u Y. LINES PARALLEL- Введите Х, чтобы вычертить линии поверхност ТО X-AXIS,Y-AXIS параллельно оси Х. Введите Y, чтобы вычерт ить OR BOTH? линии поверхности параллельно оси Y. Введит (BOTH/X/Y): В или нажмите ENTER, чтобы вычертить лини поверхности параллельно обеим осям Х и Y. ПРИМЕР ------ В этом примере мы вычертим функцию общей плотности для двух переменных, каждая из которых имеет нормальное распределение. Данные для этого примера были созданы с помощью процедуры генерации поверхности ответов, описанной в разделе 28.4, используя вариант для двумерной функции нормальной плотности с корреляцией 0.5 между х и y. Когда появится подсказка для переменной оси Х, введите binormx. Когда появится подсказка для переменной оси Y, введите binormy. Когда появится подсказка для матрицы, введите binormmat. Затем нажмите ENTER, чтобы вычертить линии параллельные обеим осям. Будет воспроизведен граф. Заметьте что невидимые линии далены. Нажмите ENTER,чтобы вернуться к меню функций построения графиков. 13.13. ГРАФИК СОЕДИНЕННЫХ КОНТУРОВ ОПРЕДЕЛЕНИЕ ----------- Процедура графика соединенных контуров создает график контуров из данных, записанных по прямоугольной сетке X-Y. Проводятся линии чтобы соединить точки контурного уровня данные для контурного графика должны быть в форме матрицы значений Z, с рядами, представляющими постоянные значения Х, с возрастающими значениями Y. Колонки представляют собой постоянные значения Y с возрастающими значениями Х. ВВОД ДАННЫХ ------------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Х VALUES FOR X-AXIS: ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Y. Этот вектор может не бы ть VALUES FOR одинаковой длины с первым цифровым вектором Y-AXIS: значения,которые вы вводите для оси Х,соотв ет- ствуют рядам графика, тогда как значения которые вы вводите для оси Y,соответствуют колонкам графика. ENTER NAME OF Введите имя матрици, которая содержит высот MATRIX WITH поверхности при каждой комбинации Х и Y.Чи- VALUES OVER сло рядов и колонок в матрице должно соот- THE X-Y GRID ветствовать длинам цифровых векторов, введенных для осей X u Y. ENTER VECTOR OF Введите цифровой вектор, содержащий значени LEVEL VALUES z при которых должны быть проведены контурн ые FORTHE CONTOUR линии. LINES: ПРИМЕР ------ В этом примере мы изобразим графически функцию z=x*x+y*y-2xy в пределах х от-10 до 10, y от -5 до 5. Данные для этого примера были созданы с помощью процедуры генерации поверхности ответов, описанной в разделе 28.4, используя выбор для полинома второго порядка в Х и Y. Когда появится подсказка для переменной оси Х, введите secondx. Когда появится подсказка для переменной оси Y, введите secondy. Когда появится подсказка для матрицы, введите secondmat. Затем вы получите подсказку для значений уровня. Введите 0 20 40 60 80 100 120 140 160 180 200 220 240. Будет воспроизведен граф. Нажмите ENTER, чтобы возвратиться к меню функций построения графиков. 13.14. ГРАФИК ТОЧЕК КОНТУРА ОПРЕДЕЛЕНИЕ ----------- Эта прцедура создает график контуров из данных записанных по прямоугольной сетке X-Y. Соединительные линии отсутствуют, поэтому вы можете добавить свои собственные контурные линии к отпечатанному графу. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего VARIABLE WITH значения для оси Х. VALUES FOR X-AXIS ENTER NAME OF Введите имя цифрового вектора,содержащего VARIABLE WITH значения для оси Y. Этот вектор может не име ть VALUES FOR одинаковую длину с первым цифровым вектором Y-AXIS значения, которые вы вводите для оси Х, соответсвуют рядам графика, тогда как значения, которые вы вводите для оси Y, соответствуют колонкам графика. ENTER NAME OF Введите имя матрицы, которая содержит высоту MATRIX WITH поверхности при каждом из X u Y . Число рядо VALUES OVER и колонок в матрице должно соответствовать THE X-Y GRID длинам цифровых векторов, которые вы ввели для осей Х и Y. ENTER VECTOR OF Введите цифровой вектор, содержащий значения LEVEL VALUES для Z, которые соответствуют уровням, на FOR THE COUNTOUR которых будут построены точки. LINES (0): ПРИМЕР ------ В этом примере мы вычертим функцию общей плотнос ти для двух переменных, каждая из которых имеет нормальное распределение. Данные для этого примера были созданы с помошью процедуры генерации поверхности ответов и с использованием варианта для двумерной функции нормальной плотности с корреляцией между Х и Y равной 0.5. Когда появится подсказка для переменной оси Х, введите binormx. Когда появится подсказка для переменной оси Y, введите binormy. Когда появится подсказка для матрицы, введите binormmat. Затем вам будет подсказано указать значения уровней. Введите 0.01, 0.05, 0.15. Будет воспроизведен график. Нажмите ENTER, чтобы вернуться к меню функций построения графиков. .3460 Г Л А В А 14 ОПИСАТЕЛЬНЫЕ МЕТОДЫ 14.1. ВВЕДЕНИЕ Система STATGRAPHIS представляет ряд описательных статистических процедур, которые позволяют вычислять средние значения, средние отклонения, стандартные отклонения и другие статистические данные, а также изображать ваши данные в форме гистограмм, линейных графов, столбиковых диаграмм и круговых диаграмм. Процедура кодовый словарь представляет краткое изложение данных, которые вы классифицировали на несколько подгрупп. Вы найдете описательные процедуры, содержащиеся в в этом разделе особенно полезными на ранних этапах анализа данных. Раздел "Описательные методы" содержит 12 процедур, которые вкратце приводятся ниже, а подробно описываются в разделах с 14.2 по 14.3 Процедура Число тип Описание переменных данных ------------------------------------------------------------ SUMMARY вычисляется среднее значение STATISTICS 1 N дисперсия, стандартное откла- нение и другие сводные статистические данные. BOX-AND-WHISKER Создает графическое воспроиз- PLOT 1 N ведение нескольких сводных статистик FREGUENCY Воспроизводит распределение FABULATION 1 N данных цифрового вектора в форме таблицы. FREGUENCY Вычерчивает гистограмму для HISTOGRAM 1 N одного цифрового вектора. GEOMETRIC Вычерчивает среднее геомет- MEAN 1 N рическое для цифрового вектор WEIGHTED Вычисляет взвешанное среднее, AVERAGES 1 N используя набор весов, которы вы предоставляете. PERCENTILES 1 N Вычисляет прцентили для цифро вого вектора. CODEBBOK Вычисляет отдельную сводную PROCEDURE 1 N статистику для каждого уровня специфицированного фактора классификации. THREE-DIMENSIONAL Вычерчивает трехмерную гисто- HISTOGRAM 2 N грамму для двух цифровых век- торов. BAR CHART 1 или 2 С/N Вычерчивает столбиковую диаграмму для цифровых или символьных данных. PIE CHART 1 C/N Воспроизводит процентное раз- биение для цифровых или симво льных данных. COMPONENT ZINE CHART 1 N Воспроизводит одну или более переменных временных рядов в линейном графе. Чтобы выпонить примеры в этой главе, считайте следующие переменные из вашего диска набора данных. Выборки: имя файла переменные ------------------------- CARDATA mpg year weight origin Инструкции по считыванию переменных в вашу рабочую область см. разд.9.6. 14.2. СВОДНАЯ СТАТИСТИКА ОПРЕДЕЛЕНИЕ ----------- При анализе количественных переменных сводные статистики обычно являются первым выполненным набором вычислений. Эти вычисления включают: *среднее; *среднее отклонение (дисперсия); *стандартное отклонение; *минимум, максимум, размах; *верхняя и нижняя квартили, межквартильный размах и медиана; *коэффициенты перекоса и эксцесса со стандартизированными значениями каждого. Каждый из этих критериев дает важную информацию о распределении ваших данных. ВВОД ДАННЫХ ------------ Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, OF THE VARIABLE содержащего ваши данные. CONTAINING YOUR DATA: ПРИМЕР ------ В этом примере мы будем использовать данные по пробегу автомобиля в милях выборки из 155 автомобилей. Когда появится подсказка, введите mpg. Будут воспроизведены результаты. ------------------------------------------------------------ Введите имя переменной, содержащей ваши данные: mpg Число наблюдений 154(недостающие пропущ.значения исключены) Среднее значение выборки 28.7935 Среднее отклонение дисперсии выборки 7.37721 Минимальное =15.5 Максимальное =46.6 Размах=31.1 значение значение Нижняя и верхняя квартили 22.4, 34.3 Межквартильный размах 11.9 Медиана 28.9 Коэффициент перекоса 0.111557 стандартизированное значение 0.565172 Коэффициент эксцесса 2.15509 стандартизированное значение 2.14024 ------------------------------------------------------------ Среднее и медиана определяют основную тенденцию данных, тогда как среднее отклонение, размах и межквартильный размах определяют разброс или дисперсию (среднее отклонение и .2601/01 стандартное отклнение используют делитель n-1). Коэффициент перекоса определяет насколько ассиметрично распределение данных. Положительные значения перекоса говорят о том что верхний "хвост" кривой длиннее, чем нижний, тогда как отрицательные значения говорят о том, что нижний "хвост" длиннее. Коэффициент эксцесса показывает однородным или неоднородным является распределение данных по отношению к гауссову или нормальному распределению. Для нормального распределения коэффициент эксцесса=3.0. Если коэффициент меньше чем 3.0, то кривая будет плоской с короткими "хвостами". Если коэффициент больше 3.0, тогда кривая либо очень крутая в центре, либо имеет довольно длинные "хвосты". Стандартный коэффициент проверяет значительные отклонения от нормального распределения. Когда вы используете большие выборки, стандартизированный коэффициент почти нормальный. Если значения стандартизированного коэффициента выходят за пределы -2.0 - +2.0, то ваши данные могут значительно отклоняться от нормального распределения. В выходных данных для переменной mpg заметьте, что 154 автомобиля, для которых были оценки пробега в милях, достигли в среднем 28.79 миль на галлон со стандартным отклонением 7.38 миль на галлон. Значение стандартного эксцесса (-2.1402) показывает, что данные более ровны е, чем предполагалось для данных из нормального распределения имеют более короткие "хвосты". Заметьте, что общее число наблюдений, воспроизведенных на вашем экране (154) на одно меньше, чем длина вектора данных mpg (155). Несоответствие происходит из-за одного "пропущенного значения" записанного в векторе данных. Это пропущенное значение связано с автомобилем, представленном в выборке, для которого не было оценки пробега в милях Пропущенные значения рассматриваются в разд.9.5. Нажмите ENTER, чтобы вернуться к меню описательных методов. 14.3. ПРЯМОУГОЬНЫЙ ГРАФИК С ОТВЕТВЛЕНИЯМИ. ОПРЕДЕЛЕНИЕ. Прямоугольный график с ответвлениями является эффективным способом воспроизведения сводной статистики графически. Прямоугольный график с ответвлениями позволяет: *обнаружить резко отканяющиеся значения; *заметить асиметричное поведения, т.к. график разделяет данные на четыре области равной частоты; *визуально сравнить несколько выборок (когда вы используете процедуру многих прямоугольных графиков с от ветветвлениями описанную в разд.17.3) ВВОД ДАННЫХ ------------ Подсказка Ответ ----------------------------------------------------------- ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIABLE данные, которые вы хотите вычертить. CONTAINING YOUR DATA: ПРИМЕР ------ В этом примере мы используем данные по определению пробега автомобиля в милях для выборки в 155 автомобилей. Когда появится подсказка, введите mpg. Будет воспроизведен прямоугольный график с ответвлениями. Глядя на этот график, можно быстро определить размах данных, медиану и небольшой перекос к верхнему концу. Центральный прямоугольник охватывает средние 50% значений данных между верхней и нижней квартилями. Ответвления тянутся к крайним значениям, тогда как центральная линия находится на медиане. Для данных mpg не существует резко откланяющихся значений. Однако когда необычные значения встречаются далеко от основной части данных, прямоугольный график с ответвлениями идентифицирует их, вычерчивая резко откланяющиеся значения как отдельные точки. Отве твления протягиваются только к тем точкам, которые находятся вне центрального прямоугольника в пределах в 1.5 раза превышающих межквартильный размах (варьирования) Все значения за пределами этого расстояния выше и ниже прямоугольника наносятся как отдельные точки. Нажмите ENTER, чтобы вернуться к меню описательных методов. 14.4 ТАБУЛИРОВАНИЕ ЧАСТОТ ОПРЕДЕЛЕНИЕ Когда вы работаете с одной количественной переменной, вы можете суммировать распределение данных в таблице, используя процедуру табулирования частот. Эта процедура создает таблицу частот совокупных частот после группирования данных в выбранное число интервалов группирования. Вы должны специфицировать верхнии и нижнии пределы для ваших классов данных и указать число классов, которые вы будете использовать для группирования данных (или вы можете использовать значения по умолчанию, предоставляемые системой). После воспроизведения таблицы процедура предос- тавляет вам несколько выборов, которые позволяют вычертить графически частоты различными способами. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- ENTER NHE NAME OF Введите имя цифрового вектора, содержа- THE VARIABLE щего ваши данные. CONTAINING YOUR DATA: ENTER THE LOWER Введите нижний предел для первого класса LIMIT (n) Система воспроизводит предполагаемое значение, чтобы помочь вам выбрать нижни предел; вы можете использовать это значение по умолчанию. ENTER THE UPPER Введите верхний предел для последнего LIMIT (n) класса Система воспроизведет предполага- емое значение, чтобы помочь вам вы- брать верхний предел; вы можете исполь- зовать это значение по умолчанию. ENTER THE NUMBER Введите число классов, в которые груп- OF CLASSES (n) пировать данные. Система воспроизведет предполагаемое значение, чтобы помочь вам выбрать число классов; вы може- те использовать это значение как значе- ние по умолчанию. ПРИМЕР ------ В этом примере мы используем данные по определению пробега атомобиля в милях выборки из 155 автомобилей. Когда появится первая подсказка, введите mpg. Минимальное значение и максимальное, общее число наблюдений воспроизводятся после того как вы введете имя переменной. Нажмите ENTER в ответ на следующие две подсказки, чтобы использовать значения по умолчанию для нижнего и верхнего пределов. В ответ на подсказку для числа классов, введите 10, чтобы разделить данные на десять классов. Будет воспроизведена таблица табулирования частот. ------------------------------------------------------------ класс нижний верхний midpoint частота относит.cовокуп.совок. предел предел частота частота относ. частот ------------------------------------------------------------ 1 14.00 18.00 16.00 10 .06494 10 .649 2 18.00 22.00 20.00 27 .17532 37 .2403 3 22.00 26.00 24.00 20 .12987 57 .3701 4 26.00 30.00 28.00 27 .17532 84 .5455 5 30.00 34.00 32.00 28 .18182 11 .7273 6 34.00 38.00 36.00 29 .18831 14 .9105 7 38.00 42.00 40.00 7 .04545 148 .9610 8 42.00 46.00 44.00 5 .03247 153 .9985 9 46.00 50.00 48.00 1 .00649 154 1.0000 10 50.00 54.00 52.00 0 .00000 154 1.0000 above 54.00 0 .00000 154 1.0000 ------------------------------------------------------------ среднее=28.794 стандартное откланение=7.3772 медиана=28.9 ------------------------------------------------------------ Вы можете просмотреть эту таблицу, используя клавиши управления курсором или воспроизвести определенный экран данных путем ввода номера соответ ствующей страницы в правом нижнем углу экрана. Таблица представляет число наблюдений, которые попадают в каждый класс (т.е. число, которое больше нижнего предела и меньше или равно верхнему). Заметьте, что вы имеете открытые интервалы ниже первого класса и выше последнего. Когда вы закончили просмотр таблицы, нажмите F10 и будет воспроизведен список графов которые могут быть созданы с помощью этой процедуры: Вы можете вычертить графически любое из следующих: 1. многоугольник частот 2. многоугольник относительных частот; 3. многоугольник совокупных частот; 4. совокупные относительные частоты. Введите ваш запрос (0, чтобы выйти): Выберите вариант 3, и будет воспроизведен график. Когда вы закончите рассматривать этот граф, нажмите ENTER, чтобы вернуться к экрану выбора графика, и введите 0, чтобы вернуться к меню описательных методов. 14.5. ГИСТОГРАММА ЧАСТОТ. ОПРЕДЕЛЕНИЕ ----------- Гистограмма частот- это графическое воспроизведение распределения набора количественных наблюдений. Процедура гистограммы сначала делит значения данных на ряд непересекающихся интервалов равной ширины. Затем она вычерчивает столбики для каждого интервала. Высота каждого столбика пропорциональна числу значений данных попадающих в этот интервал. ВВОД ДАННЫХ ---------- Подсказка Ответ ----------------------------------------------------------- ENTER THE NAME Введите имя цифрового вектора, содержащег OF THE VARIABLE ваши данные. CONTAINING YOUR DATA: ENTER THE LOWER Введите нижний предел для первого класса. LIMIT (n) Система воспроизводит предполагаемое зна- чение, чтобы помочь вам выбрать нижний предел; вы можете использовать это зна- чение по умолчанию. ENTER THE UPPER Введите верхний предел для последнего кла с- LIMIT (n) са.Систематема воспроизводит предполагаем ое значение,чтобы помочь вам выбрать верхни предел; вы можете исполь зовать это значе ние как значение по умолчанию. ENTER THE Введите число классов,в которые сгруппиро NUMBER OF вались данные. Система воспроизводит CLASSEN n предполагаемое значение, чтобы помочь ва выбрать число классов вы можете использов ать это значение по умолчанию. ПРИМЕР ------ В этом примере мы рассмотрим вновь определения пробега автомобилей в милях. Когда появится первая подсказка, введите mpg. Затем нажмите ENTER в ответ на следующие три подсказки, чтобы принять значения по умолчанию для нижнего и верхнего пределов и числа классов. Будет воспроизведена гистограмма частот показывает, что данные по милям на галлон несколько смещены к верхнему концу. Нажмите ENTER, чтобы вернуться к меню описательных методов. 14.6. СРЕДНЕЕ ГЕОМЕТРИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ----------- Среднее геометрическое - это n-ый корень произведения n колличественных значений данных. Оно часто используется для выведения средней величины индексных номеров или других данных, выраженных как отношения или в процентах. Геометрическое среднее может быть определено только, если все значения данных больше нуля. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора,содержащег OF THE VARIABLE ваши данные. CONTAINING YOUR DATA: ПРИМЕР ------ В этом примере мы вновь рассмотрим определения пробега автомобилей в милях. Когда появится подсказка, введите mpg. Геометрическое среднее будет вычислено и воспроизведено. В этом примере среднее геометрическое (27.822) несколько меньше, чем значение среднего выборки (28.7935). Нажмите ENTER, чтобы вернуться к меню описательных методов. 14.7. ВЗВЕШЕННЫЕ СРЕДНИЕ ОПРЕДЕЛЕНИЕ ----------- Взвешенные средние целесообразны когда значения данных, которые вы рассматриваете, неодинаково важны. Вы можете модифицировать степень важности посредством присваивания весовых множителей каждому значению. Взвешенное среднее вычисляется путем умножения каждого значения данных на соответствующий весовой множитель, и деления суммы на сумму весовых множителей. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIALE ваши данные. CONTAINING YOUR DATA: ENTER A VECTOR Введите имя цифрового вектора, содержащего OF WEIGHTS: весовые множители. Этот вектор должен быть такой же длины как и вектор ваших данных. Необязательно суммировать весовые множители в один. Когда вычисляется взвешенное сред- нее каждый весовой множитель будет умножен на соответствующую постоянную,чтобы полу- чить сумму весовых множетелей. ПРИМЕР ------ Давайте предположим, что вы обучаете курсу введения в статистику Вы дали вашим студентам четыре контрольных вопроса и один основной тест. Вы хотите вычислить среднюю оценку для каждого студента, но вы хотите взвесить оценки, так чтобы один тест был равным по важности четырем вопросам. Вы осуществите это посредством использования весового множителя для подсчета теста, который в четыре раза больше, чем весовой множитель используемый для подсчета очков четырех вопросов. Давайте в качестве примера вычислим одну среднюю оценку. Четырьмя подсчетами очков вопросов являются 78, 82, 65, 74. Подсчет очков теста=89. Когда появится первая подсказка, введите числа 78, 82, 65, 74, 89. Когда появится подсказка для вектора весов, введите числа: 1 1 1 1 4. Будет вычислено и воспроизведено взвешанное среднее. В этом примере взвешанное среднее (81,875) несколько больше, чем обычное среднее (77,6) Поэтому схема оценок, используемая в этом примере, отдает предпочтение студентам которые лучше справились с тестом, а не с четырьмя вопросами. Нажмите ENTER, чтобы вернуться к меню описательных методо в. 14.8. ПРОЦЕНТИЛИ. Процентиль - это величина,ниже которой попадает определенный процент наблюдений. Например, 18-ый процентиль - это величина ниже которой попадают 18% наблюдений. Процентили целесообразны при рассматривании распределения частот больших наборов данных. Часто данные суммируются посредством использования 25-ой (нижней квартили), 50-ой (медианы) и 75-ой (верхней квартили) процентилей. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME OF Введите имя цифрового вектора, содержащег THE VARIABLE ваши данные. CONTAINING YOUR DATA: ENTER THE Введите одно или более значений процентил DISIRED от 0 до 100, которые вы хотите,чтобы сист ема PERCENTILES (90) воспроизвела, или нажмите ENTER, чтобы выбрать по умолчанию значение 90%. ПРИМЕР ------ В этом примере мы вновь рассмотрим определение пробега автомобиля в милях. Когда появится первая подсказка введите mpg. Затем введите следующие процентили в ответ на вторую подсказку: 25,50,75,90,99. Следующие значение будут вычислены и воспроизведены: 22.4,28.9,34.3,38.9,44.6 Заметьте, что 25% автомобилей имеют показатели пробега в милях ниже 22.4 миль на галлон, 50% имеют показатели ниже 28.9 миль на галлон и 99% 44,6 миль на галлон. Нажмите ENTER, чтобы вернуться к меню описательных методов. 14.9. ПРОЦЕДУРА КОДОВОГО СЛОВАРЯ Процедура кодового славоря аналогична процедуре сводной статистики, описанной в разделе 14.2. Однако процедура кодового словаря подсчитывает отдельную свободную статистику по наборам, специфицированным через фактор классификации. Например, вы можите пожелать подсчитать статистику по милям на галлон для каждой из трех стран-изготовителей. С помощью процедуры кодового славоря вы можите подсчитать сводную статистику по стране - производителю, а также для всей переменной данных. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIABLE ваши данные. CONTAINING YOUR DATA ENTER NAME Введите имя фактора классификации, который OF VARIABLE должен использоваться для определения под- CONTAINING THE групп.Эта переменная может быть цифровой LEVEL CODES: или символьной и должна содержать такое же количество элементов как и переменная ваших данных. ENTER A MATRIX Введите имя символьной матрицы, содержащей WITH THE CLASS метки для каждого уровня фактора класси- LABELS фикпции нажмите ENTER, использовать метки (DEFAULTS): по умолчанию (CL1,CL2 и т.д.) ENTER THE Система STATGRAPHICS воспроизведет список NUMBERS OF статистик которые вы можете подсчитать THE DESIRED (1=среднее,2=среднее отклонение, STATISTICS 3=стандартное откланение и т.д.) и подска- (ALL): жет вам указать статистику,которую вы хоти те подсчитать. Введите соответствующие но- мера из списка, или нажмите ENTER, чтобы подсчитать все 14 статистик. DO YOU WANTA После того как воспроизведена таблица ста- PLOT OF MEANS тистик нажмите ENTER и система STATGRAPHIS WITH STANDARD спросит хотите ли вычертить среднее ERRKR BARS? (значения). Введите Y или нажмите ENTER, (Y/N): чтобы вычертить среднее. Введите N, если вы не хотите видить графика. Если вы ответите N на эту подсказку, вы будете возвращеты к списку статистик,так что вы сможете подсчитать дополнительную статис- тику. Если вы ответите Y, то после того как граф воспроизведен, нажмите ENTER, чтобы возвратиться к списку. Нажмите ENTER, чтобы покинуть процедуру. ПРИМЕР ------ В этом примере мы рассмотрим связь между показателями пробега автомобиля в милях и страной-производителем. Когда появится первая подсказка, введите mpg. Когда вам будет подсказка для переменной, содержащей коды уровней, введите origin. Когда вам будет подсказка для меток класса, введите 3 6 RESHAPE "U.S.A. EUROPE JAPAN" Не забудьте напечатать оператор RESHAPE системы STATGRAPHICS, исполь- зуя только заглавные буквы, и включить пробел перед закрывающейся ковычкой Выражение создает матрицу меток, представляющих каждую из трех стран-произ водителей, из трех рядов и шести колонок. (заметьте, что т.к. слово "JAPAN" имеет только пять букв, за ним должен следовать конечный пробел, в приведенном выше выражении, так чтобы каждый ряд матриц был одинаковой длины). Затем система воспроизведет список из 14 статистических критериев, из которых вы можете выбрать. Чтобы вычислить среднее, стандартное откланение и верхнюю квартиль, введите 1 3 9 Будет подсчитана и воспроизведена сводная статистика, показанная ниже. Когда таблица занимает больше одного экрана, вы можете перемещать страницы, используя клавиши управления курсором. Или вы можете воспроизвести определенную страницу посредством ввода номера соответствующей страницы в правом нижнем углу экрана. Заметьте, что метки, которые вы ввели используя оператор RESHAPE, (U.S.A., EUROPE, JAPAN) появятся в левой колонке samile standart level size avetage deviation ------------------------------------------------------------ U.S.A. 85 25.2823294 6.119737321 29.00000000 EUROPE 25 32.5520000 8.18062448 37.00000000 JAPAN 44 33.4 54545 5.27277251 37.00000000 TOTAL 154 28.79350649 7.37729675 94.00000000 ------------------------------------------------------------ чтобы идентифицировать каждую из ваших классификаций. Если бы вы нажали ENTER в ответ на вторую подсказку и приняли значения меток по умолчанию то метки CL1, CL2, CL3 были бы предоставлены системой. Когда вы закончили рассматривать таблицу, нажмите ENTER и введите Y в ответ на подсказку, спрашивающую хотите ли вы график средних (значений). Будет воспроизведен граф. Точки используются для графического показа пробега автомобилей в милях для каждого региона-производителя, а вертикальные линии протягиваются на одну стандартную ошибку вверх и вниз от средних (значений). Когда вы покините процедуру кодового словаря, статистика, посчитанная с помощью этой процедуры, сохранится в переменной оперативной памяти, которая называется STATMAT. Нажмите F10, чтобы вернуться к меню описательных методов. 14.10. ТРЕХМЕРНАЯ ГИСТОГРАММА. ОПРЕДЕЛЕНИЕ ----------- Трехмерная гистограмма создает трехмерный граф с первой перемнной вычер ченной горизонтально по низу экрана, второй переменной, протянувшейся назад, в экран, и с частотой, расположенной по вертикальной линии. Трехмерная гистограмма частот целесообразна для рассмотрения связи между двумя переменными и получения впечатления о распределении данных. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIABLE ваш первый набор данных. CONTAINANG YOUR FIRST SET OF DATA: ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIABLE ваш второй набор данных. Этот вектор долже CONTAINING YOUR быть такой же длины как и первый. SECOND SET OF DATA: ENTER THE LOWER Введите нижний предел первого класса для LIMIT FOR THE первой переменной, или нажмите ENTER, FIRST SET (n): чтобы использовать значение по умолчанию, показанное в скобках с подсказкой. ENTER THE UPPER Введите верхний предел последнего класса LIMIT FOR THE для первой переменной, или нажмите ENTER, FIRST SET (n): чтобы использовать значение по умолчанию, показанное в скобках с подсказкой. ENTER THE NUMBER Введите число классов, в которые группиро- OF CLASSES (n): вать первую переменную, или использовать значение по умолчанию, показанное в скобк ах с подсказкой. ENTER THE LOWER Введите нижний предел первого класса для LIMIT FOR THE второй переменной, или нажмите ENTER, SECOND SET (n): чтобы использовать значение по умолчанию, показанное в скобках с подсказкой. .2601/01 ENTER UPPER Введите верхний предел последнего класса LIMIT FOR THE для второй переменной, или нажмите ENTER, SECOND SET(n): чтобы использовать значение по умолчанию, показанное в скобках с подсказкой. ENTER THE NUMBER Введите число классов,в которые сгруппиров ать OF CLASSES (n): вторую переменную, или нажмите ENTER, чтоб использовать значение по умолчанию, показа нное в скобках с подсказкой. ПРИМЕР ----- В этом примере мы рассмотрим связь между показателями пробега автомобиля в милях и весами для выборки из 155 автомобилей. Когда появится первая подсказка, введите mpg. Когда появится вторая подсказка, введите weight. Нажмите ENTER в ответах на следующие шесть подсказок, чтобы принять значения по умолчанию для верхнего и нижнего пределов числа классов. Будет воспроизведена трехмерная гистограмма. Высота каждого столбика пропорциональна числу наблюдений в каждом соединенном классе. Этот граф иллюстрирует стандартную трехмерную перспективу.Чтобы модифицировать эту перспективу используйте процедуру, описанную в разделе 10.4. ПРИМЕЧАНИЕ Для получения наилучших результатов трехмерные гистограммы следует создавать используя графический адаптер большой разрешающей способности с четырьмя или более цветами. В графических режимах, использующих менее четырех цветов, "фоновые" столбики будут видимыми на экране, на распечатках точечных матриц и на графах, созданных на перьевом графопостроителе. 14.11. СТОЛБИКОВАЯ ДИАГРАММА Столбиковая диаграмма - это распространенный и привычный способ отображения данных, которые могут быть разделены на классы. Вы можете отобразить переменные в соответствии с факторами, такими как регионы страны или календарный год. Возможны различные отображения: кластеризованные, укомплектованные, процентные. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE Введите имя вашей переменной основной класси- VARIABLE фикации.Если вы введете цифровую переменную, CONTAINING следующая подсказка появится, которая спросит YOUR FIRST SET желаете ли вы табулировать данные. Если вы OF DATA: введете симвульную переменную, система предположит,что вы хотите табулировать данные Ваша переменная основной классификации может содержать до 15 уровней. DOES THIS Введите Y или нажмите ENTER, если вы хотите, VARIABLE NEEN чтобы система табулировала ваши данные. TABULATION? Введите (N) ,если ваша перемнная основной (Y/N): классификации содержит числа для каждого уров ня. ENTER THE Введите имя вашей переменной второй классифи- VARIABLE кации. Это приведет к созданию многочисленных CONTAINING YOUR столбиковых диаграмм со столбиками кластери- SECOND SET OF зованными в стеки. Нажмите ENTER, если вы DATA, IF ANY: имеете только переменную основной классификаци и. Ваша переменная второстепенной классификации может содержать до 11 уровней. ENTER Это подсказка появится, если ваши первые две VARIABLE переменные данных являются цифровыми, и вы KONTAINING ответили N на подсказку о табулировании. Это YOUR дает вам выбор построить столбики, используя NEXT SET OF переменные, где длина каждой переменной DATA, IF ANY: (максимум 15) управляет числом основных классов, а число переменных (максимум 11) управляет числом второстепенных классов. Предполагается, что ваши переменные содержат числа.Эта подсказка будет продолжать появляться до тех пор пока вы не нажмете ENTER, чтобы показать что вы закончили ввод данных. ENTER AMATRIX Введите имя символьной матрицы, которая WITH THE содержит метки для каждого уровня переменной PRIMARY CLASS основной классификации, или нажмите LABELS ENTER,чтобы использовать значения меток по (defaults) умолчанию (CL1, CL2 и т.д.). ENTER AMATRIX Введите имя символьной матрицы, которая WITH THE содержит метки для каждого уровня переменной SECONDARY второстепенной классификации, или нажмите CLASS LABEL ENTER, чтобы использовать метки по умолчанию (defaults) (CLASS1, CLASS2 и т.д.) Эта подсказка появляется только когда вы используете две переменные классификации. Когда вы ответите на эти подсказки, появится табло спецификации столбиковых диаграмм. Табо спецификации столбиковых диаграмм первоначально воспроизводится со значениями по умолчанию, выбранными системой STATGRAPHICS. Метки класса будут такие, какие вы ввели в ответ на подсказки. Вы можете ввести символы табуляции в любое выделеное поля и изменить значения по умолчанию до или после воспроизведения диаграммы. Поля в табло спецификации столбиковых диаграмм описаны ниже. Поле Описание ------------------------------------------------------------ MAIN CLASS Специфицирует метки для уровней переменно LABEL основной классификации. (метка основног класса) MAIN CLASS Специфицирует коды цветов для каждого столбик COLOR на диаграмме. Используйте коды с 1 по n, где n-это (цвет основного максимальное числ цветов, имеющихся на вашем графике класса ческом адаптере. Если вы использует графический адаптер с высокой разрешающе способностью, то однородные области использующие цветовые коды от 1 до 7, буду отпечатаны как сплошной черный цвет н матричном печатающем устройстве, тогда ка области, использующие цветовые коды от 8 до 1 будут отпечатаны по другому образцу. Если в запишите вашу диаграмму для дальнейшег создания на перовом графопостроителе, цветовы коды будут сохранены. Если вы использует переменные классификаций, то цветом управляе SECONDARY CLASS COLOR (второстепенног класса). MAIN CLASS Специфцирует коды закрашивания для каждо го FILL столбика на диаграмме. Имеются следующие код закрашивания: С=пустой, 1=сплошной 2=вертикальные линии, 3=правые диагональны линии, 4=левые диагональные линии 5=перекрестные штрихи, 6=более узки вертикальные линии, 7=более узкие перекрестны штрихи, 8=маленькие точки, 9=средние точки 10=большие точки, 11= точки штрихи,12=зигзаг, 13=мозаика. Образцы закрашивания особенно полезны для монохромных воспроизведений и для диаграмм, посылаемых на перовой графопостроитель. Если вы используете графический адаптер с высокой разрешающей способностью, то используйте код закрашивания 1 и коды цветов с 8 по 15. Сплошные цвета появляются на вашем экране, а образцы заполнения будут отпечатаны на матричном печатающем устройстве. Если вы используете переменные, двух классификаций, то коды заполнения управляются посредством SECONDARY CLASS FILL (заполнитель второстепенного класса). ------------------------------------------------------------ SECONDARY Специфицирует метки для уровней переменно CLASS LABEL второстепенной классификации, если в используете две пеменные. Эти метки пояляютс в легенде диаграммы SECONDARY Специфицирует цветовые коды для каждог CLASS COLOR столбика на диаграмме, когда вы использует две переменные. См. описание MFIN CLASS COLOR SECONDARY Специфицирует коды заполнения для каждог CLASS FILL столбика на диаграмме, когда вы использует две переменные (См. описание MAIN CLASS FILL. TOP TITLE Специфицирует основной заголовок, которы воспроизводится над столбиковой диаграммой. X-AXIS TITLE Специфицирует заголовок,который долже появиться на горизонтальной оси. Это заголовок воспроизводится только горизонтальными столбиковыми диаграммами (см поле DIRECTION) Y-AXIS TITLE Специфицирует заголовок, который долже появиться на вертикальной оси. Этот заголово воспроизводится только с вертикальным столбиковыми диаграммами (см. поле DIRECTION) PLOT ORIGIN Начальные параметры (горизонтальный и верти кальный) определяют начальную точку для начал вашего графика с левого нижнего угла экран Элементы должны быть выражены десятичным дробями между 0 и 1. PLOT SISE Параметры размеров (горизонтальный вертикальные) определяют ширину и высоту ваше диаграммы с начала Элементы должны быт выражены десятичными дробями между 0 и 1 Изменяя размер графика и позицию легенды (см поле LEGEND AT)вы можете исправить любо наложение, которое может произойти. LEGEND AT Параметры легенды (горизонтальный вертикальный) определяют где будет левы верхний угол вашей легенды. Элементы должн быть выражены десятичными дробями от 0 до 1 будут измеряться от левого нижнего угл экрана. Изменяя размер графика и позици легенды вы можете решить проблему наложения которое может произойти Легенды появляютс только когда вы используете две переменные FORMAT Имеется три формата: CLUSTERED помещает многочисленные столбики в ряд. (кластеризованный) STACKED помещает многочисленные столбики друг на друг (стековый) PERCENT показывает столбики равной длины воспроизводи проценты для воспомогательной классификации. BASE LINE Специфицирует начальную точку для столбиков. DIRCTION Специфицирует направление столбико (горизонтальное или вертикальное) GRID Напечатайте Y или N, чтобы добавить ил удалить сетку. Нажмите ENTER, чтобы воспроизвести вашу столбиковую диаграмму после того как вы изменили соответствующие поля на табло. ПРИМЕР ------ Сначала мы создадим столбиковую диаграмму одной переменной, используя происхождение (страну-производителя), для нашей выборки из 155 автомобилей Когда появится подсказка для вашего первого набора данных, введите origin. Когда появится подсказка о табулировании, введите Y, так чтобы система табулировала данные. Нажмите ENTER в ответ на следующие две подсказки чтобы показать, что вы используете только одну переменную, и чтобы принять метки по умолчанию для переменной основной классификации. Когда появится табло спецификации столбиковых диаграмм, введите данные в полях как показано ниже: основной класс 1 метка = U.S.A. основной класс 2 метка = EUROPE основной класс 3 метка = JAPAN верхний заголовок = страна-изготовитель --выборка автомобиле основной заголовок = число автомобилей. Мы будем использовать значения по умолчанию для других полей. Нажмите ENTER и появится диаграмма. Нажмите ENTER, чтобы вернуться к табло спецификации столбиковых диаграмм и F10, чтобы покинуть процедуру. Вновь выберите процедуру столбиковой диаграммы. На этот раз мы создадим столбиковую диаграмму двух переменных, используя происхождение (страну-изготовителя) и год изготовления для нашей выборки из 155 автомобилей. Когда появится подсказка для вашего первого набора данных, введите year. Когда появится подсказка о табуляции, введите Y. Когда появится подсказка для вашего второго набора данных, введите origin. Нажмите ENTER в ответ на следующие две подсказки, чтобы принять метки по умолчанию для обеих переменных. Когда появится табло спецификации столбиковых диаграмм, введите данные в поля как показано ниже: основного класса метки = 1978, 1979, 1980, 1981. 1982 вспомогательного класса метки = U.S.A., EUROPE, JAPAN верхний заголовок = BARCHART-- CAR SAMPLE формат = STACKED Мы используем значения по умолчанию для других полей. Нажмите ENTER и будет воспроизведена диаграмма. Нажмите ENTER, чтобы вернуться к табло, и F10, чтобы вернуться к меню описательных методов. 14.12. КРУГОВАЯ ДИАГРАММА. ОПРЕДЕЛЕНИЕ ----------- Круговая диаграмма - целесообразный способ воспроизведения процентной разбивки данных, которые классифицированы по одному фактору. Процедура круговой диаграммы разбивает круг на части, которые могут быть закрашены в зависимости от возможностей ваших графических техсредств. Вы также можете сместить один или более сегментов, так чтобы они были более заметны на графе. ВВОД ДАННЫХ ----------- Подсказка Ответ. ------------------------------------------------------------ ENTER THE NAME Введите имя переменной, которую вы хотит OF THE VARIAB- отобразить в диаграмме. Если вы введет LE CONTAINING цифровую переменную, то появится следующа YOUR DATA: подсказка, спрашивающая хотите ли в табулировать данные.Если вы введете символьну переменную, то система решит, что вы хотит табулировать данные. Ваша переменная може содержать до 15 уровней. DOES THIS Введите Y, или нажмите ENTER, если хотите VARIABLE NEED чтобы система табулировала ваши данные TABULATIAN? Введите N (N0) если ваша переменная содержи (Y/N): подсчет для каждого уровня. ENTER A MATRIX Введите имя символьной матрицы, котора WITH THE CLASS содержит метки для каждого уровня переменной LABEL или нажмите ENTER, чтобы использовать метки п (defaults): умолчанию (CL1, CL2, и.д.) После того как вы ответите на эти подсказки, появится табло спецификации круговых диаграмм. ------------------------------------------------------------ метка класса цвет заполнение смещение 1 CL 1 1 3 .00 2 CL 2 2 4 .00 3 CL 3 3 5 .00 верхний заголовок диаграммы .17 2 : .41 .52 введите поле которое требуется и нажмите чтобы чертить или чтобы выйти ------------------------------------------------------------ Табло спецификации круговых диаграмм, первоначально воспроизводится со значениями по умолчанию, выбранными системой STATGRAPHICS.Метками класса будут те, которые вы выбрали в ответ на подсказку. Вы можете ввести символ табуляции в юбое выделенное поле и изменить значения по умолчанию до или после воспроизведения диаграммы. Поле в табло спецификации круговых диаграмм описаны ниже: Поле Описание ------------------------------------------------------------ CLASS LABEL Специфицирует метки для сегментов диаграммы. COLOR Цветовые коды для круговых диаграмм такие же как и для столбиковых диаграмм (см. раздел 14.11) FILL Коды заполнения для круговых диаграмм такие же как и для столбиковых (см. раздел 14.11) OFFSET Введите дробь от 0 до 1, чтобы указать на сколько вы хотите выдвинуть сегмент из круга. Смещение 0,01 означает, что сегмент будет выдвинут на расстояние 1% (от) ширины экрана. TOP TITLE Введите до двух строк текста для (верхнего) заголов ка круговой диаграммы. RADIUS Это число показывает длину радиуса круговой диаграммы, изменненой как часть ширины экрана. Длина радиу са управляет размером круговой диаграммы. Целесообразный диапазон от 0,05 до 0.020. POSITION Параметры позиции (горизонтальный и вертикальный) определяют где размещается центр диаграммы от левого нижнего угла экрана. Элементы быть выражены десятичными дробями от 0 до 1. LEGENDAT Параметры легенды (горизонтальный и вертикаль ный) определяют где появится левый верхний угол вашей легенды. Элементы должны быть выражены десяти чными дробями между 0 и 1, и будут определяться от левого нижнего угла экрана. Нажмите ENTER, чтобы создать круговую диаграмму после того как вы изменили соответствующие поля на табло. ПРИМЕР ------ В этом примере мы построим круговую диаграмму, используя происхождение (страна-изготовитель) для нашей выборки из 155 автомобилей. Когда появится подсказка для ваших данных, введите origin. Когда появится подсказка о табулированнии, введите Y,чтобы попросить систему табулировать данные. Нажмите ENTER в ответ на следующую подсказку чтобы принять метки класса по умолчанию. Когда появится табло спецификации круговых диаграмм, введите данные в поля как показано ниже: CLASS 1 LABEL : U.S.A. CLASS 2 LABEL : EUROPE CLASS 3 LABEL : JAPAN CLASS 2 OFFSET : 0.05 TOP TITLE : COUNTRY OF ORIGIN--CAR SAMPLE Мы будем использовать значения по умолчанию для других полей. Нажмите ENTER и будет воспроизведена круговая диаграмма. Нажмите ENTER, чтобы возвратиться к табло спецификации круговых диаграмм, и нажмите F10, чтобы возвратиться к меню описательных методов. 14.13.СОСТАВНАЯ ЛИНЕЙНАЯ ДИАГРАММА ОПРЕДЕЛЕНИЕ ----------- Процедура составной линейной диаграммы обеспечивает эффективный способ воспроизведения данных временного ряда, классифицированных по одному фактору. Вы можете вычертить исходные значения данных индивидуально или совокупно. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, содержащего ва THE VRIABLE первый набор данных. CONTAINING YOUR FIRTSTSET OF DATA: ENTER THE NAME Введите имя цифрового вектора, содержащего ва OFTHE VRIABLE следующий набор данных, если такой имеется CONTAINING Эта подсказка будет продолжать появляться YOUR NEST SET позволяя вам вводить дополнительны OF DATA: переменные, до тех пор пока вы не нажмет ENTER в ответ на подсказку,чтобы показать, чт вы закончили ввод данных. Все введенны переменные должны быть такой же длины как первая. ENTER THE NAME Введите имя цифрового вектора, содержащег OF THE VARIAB- ваши временные точки. Этот вектор должен быт LE CONTAINIG такой же длины как и ваши переменные данных. THE TIME POINTS: ENTER A MATRIX Введите имя символьной матрицы, котора WICTH THE LA- содержит метки для ваших переменных данных, и ли BEL FOR EACH нажмите ENTER чтобы ичпользовать метки по VECTOR умолчанию (CL1, CL2,и т.д.) Эта матрица должн (defaults): содержать один ряд для каждой переменно данных. DO YOU WISH TO Введите Y или нажмите ENTER,если хотит PLOTTHE SERIES вычертить переменные совокупно. Введите IN A CUMULATIVE(N0), если хотите вычертить переменны FASHION (Y/N) индивидуально. Эта подсказка не появится, есл вы вычерчиваете только одну переменную. После того как вы ответите на эти подсказки, появится табло спецификации составных линейных диаграмм. Табло спецификации сложных линейных диаграмм первоначально воспроизводится со значениями по умолчанию, выбранными системой STATGRAPHICS. Метками класса будут те метки, которые вы ввели в ответ на подсказки. Вы можете ввести символ табуляции в любое выделенное поле и изменить значение по умолчанию до или после воспроизведения диаграмм. Поля в табло спецификации сложных линейных диаграмм описаны ниже: Поле Описание ------------------------------------------------------------ LABELS Специфицирует метки для каждой переменной данных. (метки) COLOR Цветовые коды для сложных линейных диаграмм такие (цвет) же как и для столбиковых диаграмм(см.раздел 14.11 FILL Коды заполнения для сложных линейных диаграмм так ие (заполне- же как и для столбиковых диаграмм(см. раздел 14.1 1) ние) TOP TITLE Специфицирует основной заголовок, который воспрои з- (верхний водится над диаграммой. заголовок) X-AXIS TITLE Специфицирует заголовок, который должен появить ся (Х-оси заго- на горизонтальной оси. ловок) Y-AXIS TITLE Специфицирует заголовок, который должен появить ся на вертикальной оси. PLOT ORIGIN Исходные параметры (горизонтальный и вертикальн ый) (начала гра- определяют начальную точку для начала вашего гр афи- фика) ка (начиная) от левого нижнего угла экрана. Эле менты должны быть выражены десятичными дробями между 0 и 1. PLOT SIZE Параметры размера (горизонтальные и вертикальны е) (размер гра- определяют ширину и высоту вашего графика от фика) начала. Элементы должны быть вычерчены десятичн ыми дробями между 0 и 1. Изменяя размер графика и позицию легенды (см. п оле LEGENDAT), вы можете разрешить проблему перекры тия которая может возникнуть. LEGEND AT Параметры легенды (горизонтальный и вертикальны й) (легенда) определяют где будет левый верхний угол вашей л е- генды. Элементы должны быть выражены десятичным дробями между 0 и 1, и будут определяться от ле вого нижнего угла экрана. Изменяя размер графика и позицию легенды, вы мо жете решить любые проблемы перекрытия, которые могут возникнуть. Нажмите ENTER, чтобы воспроизвести диаграмму после того как вы изменили соответствующие поля в табло. ПРИМЕР ----- Чтобы проиллюстрировать составную линейную диаграмму, мы введем данные по товарообороту в трех регионах за 6 месяцев. Когда появится подсказка для вашей первой перемнной данных, введите 150, 275, 167, 453, 230, 600. Эти цифры представляют собой товарооборот для первого региона. В ответ на следующие две подсказки введите данные по товарообороту для регионов 2 и 3, как показано ниже: 381 75 221 192 411 484 110 390 128 198 452 583 Затем нажмите ENTER, чтобы показать, что вы закончили ввод данных. Когда появится подсказка для временных точек, введите COUNT6, чтобы указать периоды времени от 1 до 6. Когда вы получите подсказку для меток, нажмите ENTER, чтобы использовать метки по умолчанию. Когда вас спросят хотите ли вы вычертить данные совокупно, нажмите ENTER, чтобы показать, что вы хотите совокупное построение. Когда появится табло спецификации составных линейных диаграмм, введите данные в поля как показано ниже: LABEL 1 = EAST LABEL 2 = WEST LABEL 3 = CENTRAL TOP TITLE = SALES BY REGION --XYZ COMPANY X-AXIS TITLE = JANUARY TO JUNE Y-AXIS TITLE = SALES (S1000' s) Мы будем использовать значения по умолчанию для других полей. Нажмите ENTER и будет воспроизведена диаграмма. На совокупной составной линейной диаграмме, как в нашем примере, каждая переменная "строится" на другой, так что диаграмма показывает общий товарооборот для всех трех регионов. Если вы хотите показать различие между переменными (например, доходы и расходы) вы можете построить переменные отдельно. Нажмите ENTER,чтобы вернуться к табло спецификации составных линейных диаграмм, и F10, чтобы вернуться к меню описательных методов. .0180 .02-2 .1880010300018907052139 .2160 .2303 .2403 .2265/60 .2565/60 .2601/01 .2705/05 .28-10130 .29-2 .3001 Г Л А В А 15 ОЦЕНИВАНИЕ И ТЕСТИРОВАНИЕ 15.1. ВВЕДЕНИЕ В этом разделе содержатся основные статистические процедуры для вычисления доверительных интервалов и проверок гипотез для отдельной выборки, спаренных выборок или двух независимых выборок. Этот раздел также содержит специализированные процедуры связанные с оцениванием, вклю- чая две графические процедуры для того, чтобы определить идут ли данные от нормального распределения. Также включена процедура для того, чтобы проверить могут ли две выборки из Пуассоновского процесса идти от одного и того же распределения. Раздел "Оценивание и тестирование" системы STATGRAPHICS содержит пять процедур, которые суммированы ниже и описаны подробно в разделах с 15.2. по 15.6. Процедура Число Тип Описание переменных данных ------------------------------------------------------------ ONE-SAMPLE 1 N Оценивает и тестирует ANALYSIS среднее (значение) и (анализ одной среднее отклонение из выборки) одной случайной вы- борки или из двух спаренных выборок TWO-SAMPLE 2 N Сравнивает средние ANALYSIS значения и средние (анализ двух отклонения из двух выборок) спаренных выборок NORMAL 1 N Вычерчивает статисти- PROBABILITY ку последовательности PLOT набора данных со спе- (график нормаль- циальной вертикальной ной вероятности) осью так, что выборки из нормального расп- ределения будут сле- довать по прямой линии HANGING HISTOBARS 1 N Аналогична гистограмм за исключением того, что столбики свисают нормальной кривой, да вая вам возможность определить насколько близко распределение к нормальному COMPARISON OF Проверяет являются ли POISSON RATES NA NA средние частоты появ- ления события иден- тичными выборке Чтобы выполнить примеры в этой главе, считайте следующие переменные из диска набора данных выборки: имя файла переменные ------------------------------- CARDATA mpg origin Инструкции по считыванию переменных в вашу рабочую область см. в разд. 9.6. 15.2. АНАЛИЗ ОДНОЙ ВЫБОРКИ ОПРЕДЕЛЕНИЕ ----------- Процедура анализа одной выборки оценивает и проверяет среднее значение и среднее отклонение одной случайной выборки или двух спаренных выборок. Четыре вычисления выполняются над данными: * статистика выборки; * доверительный интервал для среднего значения; * доверительный интервал для среднего откланения; * t-проверка для гипотез касающихся среднего значения генеральной совокупности. Доверительный интервал для среднего отклонения предполагает, что данные выборки берутся из нормального распределения. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего THE VARITABLE данные, которые вы хотите рассмотреть. Вы CONTAINING YOUR можете анализировать одну выборку или две DATA: выборки, в которых данные спарены (например X1 MINUS X2). После того как вы ответили на подсказку о ваших данных, на вашем экране появится табло анализа одной выборки. Воспроизведено число наблюдений (минус пропущенное значение), выборочное среднее, выборочное среднее откланение, стандартное откланение, медиана и 95% доверительного интервала для среднего значения. Результат анализа одной выборки для линий на галлон ------------------------------------------------------------ Анализ выборки mpg Выборочная статистика: число наблюдений 154 54.4232 7.37721 28.9 Доверительный интервал для среднего значения 95 Petcent Sample 1 27.6139 29.9682 153 Доверит. интервал для среднего отклонения Тест гипотезы Вычислительная статистика=48.4354 Уровень значимости=0 Нажмите клавиши F2 и F3 или ENTER, чтобы чертить +1HELP 2BOXPLT 2HISTO 4 5 6 7 8 9 ------------------------------------------------------------ -------------- Внизу экрана вы увидите гипотезы по умолчанию, которые целесообразны для тестирования гипотез о среднем значении генеральной совокупности. Эти значения по умолчанию могут быть изменены следующим образом: * значение теста для нулевой гипотезы (НО) может быть изменено на любое цифровое значение. * символ для альтернативной гипотезы NE для двусторонней проверки; LT или GT для односторонней проверки. * специфицированный альфа уровень может быть изменен на любое значение между 0 и 1. Система воспроизводит вычисленные t-статистику, ее р-значение или урове нь значимости и заключение (отклонять НО или нет). Вы можете ввести символ табуляции в любое активное поле на табло, вводя данные, соответствующие вашему анализу. Первоначально доверительный интервал для среднего отклонения не подсчитан. Однако, т.к. поля, специ фицирующие доверительные интервалы, являются входными и выходными полями, вы можите получить подсчет интервала на различных уровнях доверительности, изменяя 95% и 0% уровни доверительности на другие значения. После того как вы ввели соответствующие значения во все поля, нажмите ENTER,чтобы изменить экран. Вы заметите, на стороке состояния табло, что функциональные клавиши процедуры активны во время этой процедуры F1 и F10 сохраняют свои обычные определения (HELP, QUIT). F2 и F3 определяются, чтобы действовать как описано ниже. F2 Воспроизводит для данных прямоугольный график с (BOXPLT) ответвлениями. Этот график описан в разделе 14.3. После того, как график воспроизведен, нажмите ENTER, чтобы вернуться к табло анализа одной выборки. F3 Воспроизводит для данных гистограмму частот. (HISTO) Если вы выбираете этот вариант, на экране будет воспроизведено число наблюдений в вашей выборке и минимальное и максимальное значение и вам будет подсказано о верхнем и нижнем пределах и числе классов, которые должны использоваться для построения графа. Вы можете использовать значения по умолчанию, показанные в скобках с каждой подсказкой, или вы можете ввести другие значения, соответствующие вышим данным. После того, как гистограмма воспроизведена, нажмите ENTER, чтобы вернуться к табло анализа одной выборки. Нажмите F10, чтобы покинуть процедуру. ПРИМЕР ------ В этом примере мы рассмотрим показатели пробега автомобилей в милях для 155 автомобилей. Когда появится подсказка для ваших данных, введите mpg На экране появится табло анализа одной выборки. Заметьте, что набор данных содержит только 154 наблюдения, показывая, что в наборе данных одно значение пропущено. Теперь давайте построим прямоугольный график с ответвлениями для mpg. Нажмите F2 и будет воспроизведен график. Обратите внимание, что показатели пробега автомобилей в милях отклонены вправо. Нажмите ENTER, чтобы возвратиться к табло анализа одной выборки. Теперь мы создадим для этих данных гистограмму частот. Нажмите F3. Когда вам будет дана подсказка для нижнего предела, верхнего предела и числа классов, нажмите ENTER, три раза, чтобы принять значения по умолчанию. Будет воспроизведена частотная гистограмма. Нажмите ENTER, чтобы вернуться к табло анализа одной выборки и нажмите F10, чтобы вернуться к меню оценивания и 15.3. АНАЛИЗ ДВУХ ВЫБОРОК ОПРЕДЕЛЕНИЕ ----------- Процедура анализа двух выборок сравнивает среднее значение и среднее отклонение двух выборок. Как и при анализе одной выборки, при анализе двух выборок генерируется как цифровой, так и графический вывод. Пять вычислений выполняется над данными: * выборочная статистика; * доверительный интервал для различия между двумя средними значениями предполагая равные средние откланения. * доверительный интервал для различия между двумя средними значениями не предполагая равных средних отклонений. * доверительный интервал для отношения двух средних отклонений. * t- (test)-проверка для гипотез, касающихся различий между двумя средними значениями. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER NAME OF Введите имя цифрового вектора, содержащего THE VARIABLE ваш первый набор данных. CONTAINING YOUR FIRST SAMPE: ENTER NAME OF Введите имя цифрового векотора, содержащего THE VARIABLE ваш второй набор данных. CONTAINING YOUR SECOND SAMPLE: После того как вы ответили на подсказки для ваших данных, на вашем экране появится табло анализа двух выборок. Ввод анализа двух выборок. ------------------------------------------------------------ Статистика выборки: число наблюдений 95 69 154 среднее значение 25.2624 33.1435 28.7935 среднее отклонение 37.4512 41.4022 39.218 стандартное отклонение 6.11974 6.43445 6.26249 24.3 33 28.9 Доверительный интервал для различия в среднем значении (равные средн. -9.88647 -5.87578 152 отклонения) (неравные средн. -9.8981 -5.86415 142 отклонения) Доверительный интервал для соотношения средних отклонений Нажмите клавишу F2 или ENTER, чтобы пересчитать ----------------------------------------------------------- Воспроизведена сводная статистика для спаренных выборок. Также показаны 95% достоверные интервалы, предполагающие равные и неравные средние отклон нения. Внизу экрана вы увидите набор гипотез по умолчанию, которые целесообраз ны для тестирования гипотез о среднем значении генеральной совокупности Эти значения по умолчанию могут быть изменены следующим образом: * значение теста для нулевой гпотезы (НО) может быть изменено на любое цифровое значение. * символ для альтернативной гипотезы-NE для двусторонней проверки, и LT или GT для односторонней проверки. * специфицированный альфа уровень может быть изменен на любое значение между 0 и 1. Вы можете ввести символ табуляции в любое поле на табло, вводя данные соответствующие вашему анализу. Первоначально доверительный интервал для соотношения средних отклонений не подсчитан. Однако, т.к. поля, спе- цифицирующие доверительные интервалы, являются вводимыми и выводимыми полями, вы можете получить вычисления для интервала на различных уровнях доверительности, изменяя 95% и 0% уровни доверительности на другие значения. После того как вы ввели соответствующие значения во все поля, нажмите ENTER, чтобы модифицировать экран. Вы заметите на строке состояния в табло, что функциональные клавиши процедуры активны во время этой процедуры. F1 и F10 сохраняют свои обычные определения (HELP, QUIT). F2 определяется, чтобы функционировать как описано ниже. F2 Воспроизводит для данных прямоугольный график (BOXPLT) с многочисленными ответвлениями. Этот график описывается в разд.17.3. После того как график воспроизведен нажмите ENTER, чтобы вернуть- ся к табло двух выборок. ПРИМЕР ------ В этом примере мы используем данные по показателям пробега автомобиля в милях и по стране-изготовителю для выборки из 155 автомобилей. Автомоби ли изготовленные в США (1), в Европе (2) и в Японии (3). Когда появится первая подсказка, введите mpg SELECT origin EQ1, чтобы выбрать часть данных по mpg, соответствующих автомобилям, изготовлен ным в США (origin equal (EQ) to 1). Введите mpg SELECT origin NE 1 в ответ на вторую подсказку, чтобы выбрать часть данных mpg, соответствующих автомобилям изготовленным не в США (origin not equal (NE) to 1). На вашем экране появится табло анализа двух выборок. Измените доверительный интервал для различия в средних значениях на 90% и доверительный интервал для соотношения средених отклонений на 95%. Нажмите ENTER, и на вашем экране появится модифицированное табло анализа двух выборок. ------------------------------------------------------------ выборка1 выборка2 спаренная статистика выборки: число наблюдений 85 69 154 среднее значение 25.2624 33.1435 26.2935 среднее отклонение 37.4512 41.4022 39.2187 стандартное отклонение 6.11974 6.43445 6.26249 медиана 24.3 33 28.9 доверительный интервал для различия в средних значе 90 (равное сред.отклонение) выборка1-выборка2 -9.5609 -6.20135 132 (неравное средн. откдонение) выборка1-выборка2 -9.57042 -6.19183 142 доверительный интервал для соотн. средних отклонений: 95 выборка1-выборка2 0.570358 1.41884 84 Нажмите клавишу F2 чтобы чертить и ENTER чтобы пересчитать ----------------------------------------------------------- Обратите внимание, что доверительный интервал для различия в средних значениях не включает 0, показывая статистически значимое различие. Однако, доверительный интервал для соотношения средних отклонений включае 1, поэтому мы не можем сделать вывод о том, что два средних отклонения генеральной совокупности являются различными. Теперь давайте построим прямоугольный график с многочисленными ответ влениями. Нажмите F2. и будет воспроизведен график. Нажмите ENTER, чтобы вернуться к процедуре анализа двух выборок, и нажмите F10, чтобы вернуться к меню оценивания и тестирования. 15.4.ГРАФИК НОРМАЛЬНОЙ ВЕРОЯТНОСТИ ОПРЕДЕЛЕНИЕ ----------- Строя график нормальной вероятности, вы можете определить с достаточным ли основанием набор наблюдений получен от нормального распределения. График нормальной вероятности состоит из арифмитической горизонтальной оси и вертикальной оси, масштабированной таким образом, что функция комулятивного распределения (cdf)нормального распределения будет вычерчиваться как прямая линия. ВВВОД ДАННЫХ ------------ Подсказка Ответ ENTER NAME OF Введите имя цифрового вектора, содержащего THE VARIABLE ваши данные. CONTAINING YOUK DATA: ПРИМЕР ------ Для этого примера мы используем данные по показателям пробега автомобиля в милях для 155 автомобилей. Когда будет воспроизведена подсказка, введите mpg, для имени переменной, содержащей ваши данные. Будет воспроизведен график нормальной вероят ности. Обратите внимание, что график вероятности данных mpg значительно изгибается, особенно в нижнем конце. Из этого графика очевидно, что распределение отклонения вправо и, что нижний "хвост" короче, чем можно было бы ожидать если данные брались из нормального распределения (т.к. он не протягивается влево настолько, насколько это предполагает линейный образец в центральной части данных). Нажмите F10, чтобы возвратиться к меню оценивания и тестирования. 15.5 ВИСЯЧАЯ ГИСТОГРАММА. Висячая гистограмма аналогична гистограмме, за исключением того, что столбики не вычерчиваются вертикально от горизонтальной оси, а свисают с наиболее точно подобранной кривой нормального распределения. Если данные действительно следуют нормальному распределению, то нижние концы столбиков должны быть произвольно разбросаны около горизонтальной линии от нуля. Любой пример того как столбики меняются около линии показывает, что данные не следуют нормальному распределению. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- ENTER THE NAME Введите имя цифрового вектора, содержащего OF THE VARIABLE ваши данные. CONTAINING YOUR DATA: После того как вы ответите на эту подсказку, система воспроизведет число наблюдений в ваших данных и минимальное и максимальное значения. Она подскажет вам нижний предел, верхний предел и число классов, которые должны использоваться при создании графа. Нажмите ENTER, чтобы использовать значения по умолчанию, показанные в скобках с подсказками, или введите другие значения,соответствующие вашим данным. После того как будет воспроизведена гистобара,нажмите F10, чтобы возвратиться к меню оценивания и тестирования. ПРИМЕР ------ В этом примере мы будем использовать данные по показателям пробега автомобилей в милях для 155 автомобилей. Когда появится подсказка, введите mpg, для имени переменной, содержащей ваши данные. Мы можем видеть, что данные содержат 154 наблюдения с минимальным значением 15,5 и максимальным значением 46,6. В ответ на подсказку для нижнего и верхнего пределов, которые должны использоваться в графе, нажмите ENTER. В ответ на подсказку о числе классов введите 30. Будет воспроизведена висячая гистобара. В этом случае оказывается больше значений mpg в диапазоне 16-22 и мень ше в диапазоне 24-30, чем мы могли бы предполагать, если бы данные были нормальными. 15.6.СРАВНЕНИЕ КОЭФФИЦИЕНТОВ ПУАССОНА. ОПРЕДЕЛЕНИЕ ----------- Процедура сравнения коэффициентов Пуассона сравнивает число событий, наблюдаемых за два независимых выборочных периода, чтобы проверить одинаковые ли средние частоты наступления событий в двух этих периодах. Процедура генерирует контрольную статистическое значение для равных частот и вычисляет уровень вероятности, основанный на большой выборочной апроксимации. ВВОД ДАННЫХ ------------ Подсказка Ответ ----------------------------------------------------------- ENTER LENGTH OF Введите число, соответствующее длине пер- SAMPLING INTERVAL вого временного интервала. FOR FIRST SAMPLE: (TOOO): ENTER NUMBER OF Введите число событий, подсчитанных за EVENTS COUNTED IN первый временной интервал. FIRST INTERVAL (10): ENTER LENGTH OF Введите число, соответствующее длине вто- SAMPLING INTERVAL рого временного интервала. FOR SECOND SAMPLE (1000): ENTER NUMBER OF Введите число событий, подсчитанных за EVENTS COUNTED IN второй временной интервал SECOND INTERVAL ПРИМЕР ------ В этом примере мы сравним частоту прибытий 236 самолетов, прибывающих в сектор управления воздушным сообщением. Время прибытий фиксировалось в течение восьми часов и записано в файл TSDATA на вашем диске наборов данных выборки в переменной arrivals. Чтобы определить была ли частота прибытий в первые четыре часа равна частоте прибытий за вторые четыре часа, мы можем сравнить за два четырех часовых периода результаты подсчета (105 и 131). Когда появится первая подсказка,введите 4 для длины временного интерва для первой выборки-четыре часа. Когда появится вторая подсказка, введите 105-для числа самолетов, которые прибывали за первый выбранный временной интервал. Когда появится третья подсказка, введите 4-для длины временного интервала второй выборки (тоже четыре часа). Когда появится четвертая подсказка, введите 131- для числа самолетов, которые прибыли за второй выбранный интервал. Будет воспроизведена свободная статистика, показанная ниже: выборка 1 2 колич. событий 105 131 интервал 4 4 Процедура сравнения коэффициентов Пуассона вычисляет частоту прибытий, используя выражение count interval. Затем вычисляется коэффициент частот посредством деления первой вычисленной частоты на вторую. Наконец вычисляется стандартизированное контроль ное значение Z, чтобы проверить гипотезу о том, что частоты одинаковы, и воспроизводится уровень значимости. В этом примере мы не можем сделать вывод о том, что средняя частота прибытий в двух периодах различается на 5% уровня значимости, т.к. показанная "хвостовая" область приблизительно равна 9%. Этот вывод зависит от предположения о том, что прибытия в каждом периоде следовали однородному Пуассонову процессу, предположение, которое следует тщательно проверить. Нажмите ENTER, чтобы вернуться к меню оценивания и проверки. .3460 Г Л А В А 16 ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 16.1. ВВЕДЕНИЕ. Система STATGRAPHICS представляет несколько процедур, которые вы можете использовать, чтобы подобрать распределение к данным, вычертить распределение вероятностей, вычислить "хвостовые" области или важные значения, и сгенерировать случайные числа. Вы можете выбирать из шести дискретных распределений и двенадцати непрерывных распределений. Уравнения для каждого из распределний вероятностей можно найти в приложении С. Раздел Функций распределений содержит пять процедур,которые суммируются ниже и подробно описываются в разделах с 16.2. по 16.6. Процедура Описание ------------------------------------------------------------ DISTRIBUTION Подбирает одну из 18 различных функций распре- FITTING деления к количественной переменной. (подборка распределения) DISTRIBUTION Вычерчивает распределение вероятностей и нес- PLOTTING колько связанных с ним функций. (графическое вычерчивание распределения) TAIL AREA Вычерчивает значение совокупного распределе- PROBOBILITIES ния в любой точке. (вероятности хвостовой области) INVERSE Вычисляет значение, ниже которого лежит специ- DISTRIBUTION фицированная область. FUNCTIONC (ФУНКЦИИ обратного распределения) RANDOM NUMBER Генерирует случайные числа из различных рас- GENERATION пределений (генерация случ.чисел) Чтобы выполнить примеры в этой главе, считайте переменную mpg из файла GARDATA на вашем диске набора данных выборки. Инструкции по считыванию переменных в рабочую область см. разд.9.6. 16.2. ПОДБОРКА РАСПРЕДЕЛЕНИЯ. Процедура распределения подбирает одну из 18 различных функций распределения к вашим данным. Вы можете либо определить параметры, либо прямо ввести известные значения параметров. Система воспроизведет результаты критерия пригодности хи-квадрата, примененного к соответствующему распределению. Для непрерывного распределения вам также будет дана возможность использовать критерий Коллмогорова-Смирнова для подборки ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Имеются следующие распределения: Дискретные данные 1. BERNOULII 4. GEOMETRIC 2. BINOMIAL 5. NEGATIVE 3. DISCRETE BINOMIAL UNIFORM 6. POISSON Непрерывные данные 7. BETA 13. LOGNORMAL 8. CHISOUARE 14. NORMAL 9. ERLANG 15. STUDENT^S т 10. EXPONENTIAL 16. TRIANGULAR 11. F 17. UNIFORM 12. GAMMA 18. WEIBULL ENTER THE Введите номер, соответствующий распределе- NUMBER нию,которое вы хотите использовать. OF YOUR CHOICE (1): ENTER NAME OF Введите имя вектора, содержащего данные, VECTOR CONTAINING которые будут использоваться YOUR DATA: DO YOU WANT TO Введите N или нажмите ENTER, если вы хоти- ENTER KNOWN те чтобы система STATGRAPH определила па- PARAMETER VALUES раметры .Введите Y если вы хотите специфи- (N/Y): цировать свои собственные значения. В зависимости от распределения, которое вы выбираете, и от того вводите ли вы известные значения параметров, система подскажет вам ? ? ? ? Дискретные данные: 1. BERNOULLI Если вы выбираете распределение BERNOULLI, вам будет дана подсказка для вероятности появления события (в директивный срок) или вероятность успеха 2. BINOMIAR Если вы выбираете биноминальное распреде- ление вам будет дана подсказка для числа проверок и для вероятности появления собы- тия (в директивный срок) 3. DISKRETE Если вы выбираете дискретное однородное UNIFORM распределение, вам будет дана подсказка для верхнего и нижнего пределов. 4. GEOMETRIC Если вы выбираете геометрическое распреде- ление вам будет дана подсказка для вероят- ности появления события в (директивный срок) 5. NEGATIVE Если вы выбираете отрицательное биномиаль- BINOMIAL ное распределение (или Паскаля), вам будет дана подсказка для количества успехов и для вероятности наступления события 6. POISSON Если вы выбираете пуассоновское распреде- ление вам будет дана подсказка для сред- него (значения) распределения Непрерывные данные 7. BETA Если вы выбираете бета-распределение, вам будет дана подсказка для альфа и бета параметров 8. CHISQUARE Если вы выбираете распределение хи-квадрат вам будет дана подсказка для степеней свободы 9. ERLANG Если вы выбираете эрланговкое распределение вам будет дана подсказка для параметров формы (альфа) и масштаба (бета) 10.EXSPONENTIAL Если вы выбираете экспоненциальное распределение вам будет дана подсказка для среднего значения распределения 11.F Если вы выбираете F распределение, вам бу- дет дана подсказка для степеней свободы числителя и знаменателя 12. GAMMA Если вы выбираете гамма-распределение, вам будет дана подсказка для параметров формы (альфа) и масштаба (бета) 13. LOGNORMAL Если вы выбираете логарифмическое нормаль- ное распре деление, вам будет дана под- сказка для среднего значения и стан- дартного отклонения распределения 14. NORMAL Если вы выбираете нормальное распределение вам будет дана подсказка для среднего зна- чения и стандартного отклонения распреде- ления 15. STUDENT^S T Если вы выбираете Т распределение Стьюден- та, вам будет дана подсказка для степеней свободы 16. TRIANGULAR Если вы выбираете треугольное распределе- ние, вам будет дана подсказка для нижне- го центрального и верхнего пределов рас- преления. 17. UNIFORM Если вы выбираете равномерное распределе- ние, вам будет дана подсказка для нижнего и верхнего пределов распределения. 18. WEIBULL Если вы выбираете WEIBULL распределение, вам будет дана подсказка для параметров формы (альфа) и масштаба (бета) ПРИМЕР ------ В этом примере мы используем нормальное распределение к значениям в нашей переменной mpg. Когда появится первая подсказка, введите число 14, чтобы показать что вы хотите использовать нормальное распределение к данным. Теперь введите mpg, для вектора содержащего значения, которые должны использоваться. Введите N в ответ на следующую подсказку, чтобы дать системе STATGRAP HICS определить неизвестные параметры. Будет воспроизведен граф. На графе показана гистограмма данных с наиболее точным подбором нормаль ного распределения, добавленным к ней. Обратите внимание, что распределение, видимо, не очень подходит этим данным. Нажмите ENTER, и система воспроизведет результаты критерия пригодности хи-квадрата, примененного к соответствующему распределению. Уровень значимости меньше 0,05, как происходит в этом случае, предполагает значительное отсутствие соответствия. Введите Y в ответ на следующую плдсказку, чтобы провести одновыборочную проверку Колмогорова-Смирнова на соответсвие. Эта проверка определяет насколько эмпирическая кумулятивная дистрибутивная функция отличается от функции подобного распределения. (см. раздел 26.12. более подробное описание критерия Колмогорова- Смирнова.) В данном случае уровень значимости 0,35 не означает плохое соответствие. Нажмите ENTER, чтобы вернуться к меню функций распределения. 16.3. ГРАФИЧЕСКОЕ ВЫЧЕРЧИВАНИЕ РАСПРЕДЕЛЕНИЯ ОПРЕДЕЛЕНИЕ ----------- Когда вы подобрали ваши данные, вы можете графически вычертить распре деление, используя процедуру вычерчивания распределения. Эта процедура позволяет вам выбрать из шести дискретных распределений и двенадцати непрерывных распределений. В зависимости от распределения, которое вы выбираете, система даст различные подсказки. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ THE FOLLOWING Полный список подсказок для дискретного и DISTRIBUTIONS непрерывного распределения см. в разд.16.2. ARE AVAILABLE: Дискретные данные 1. BERNOULLI 4. GEOMETRIC 2. BINOMIAL 5. NEGATIVE 3. DISCRETE BINOMIAL UNIFORM 6. POISSON Непрерывные данные 7. BETA 13. LOGNORMAL 8. CHISOUARE 14. NORMAL 9. ERLANG 15. STUDENT^S T 10. EXPONENTIAL 16. TRIANGULAR 11. F 17. UNIFORM 12. GAMMA 18. WEIBULL ENTER THE NUMBER Введите номера, соответствующие распреде- OF YOUR CHOICЕ лению, которое вы хотите вычертить (1): Имеющееся варианты: 1. PLOT OF Плотность вероятности и массовая функция DENSITY OR вероятности следуют своим обычным опреде- MASSFUNCTION лениям 2. PLOT OF Функция распределения кумулятивных веро- CUMULATIVE ятностей следует своему обычному опреде- DISTRIBUTION лению FUNCTION 3. PLOT OF Функция выживаемости равна 1 минус функ- SURVIVOR ция кумулятивных вероятностей FUNCTION 4. PLOT OF LOG Логарифмическая функция выживаемости вы- SURVIVOR черкивает натуральный логарифм функции FUNCTION выживаемости 5. PLOT OF Функция риска имеется только для непре- HAZARD рывных данных и равна функции плотности FUNCTION или массовой функции, разделенной на функцию выживаемости ENTER DESIRED Введите номер соответствующий варианту OPTION BY вычерчивания распределения, который NUMBER вы хотите применить к данным (1): ПРИМЕР ------ Для этого примера мы вычертим функцию плотности или массовую функцию для функции нормального распределения со средним значением = 5 и со стандартным отклонением = 1 Когда появится первая подсказка, введите число 14, чтобы выбрать норма льное распределение. Введите число 5, чтобы специфицировать среднее значе ние = 5 для распределения. Введите число = 1 для распределения.Тогда систе ма воспроизведет список вариантов вычерчивания для вашего выбора. Введите номер 1, чтобы вычертить функцию плотности или массовую функцию для нормального распределения. Будет воспроизведен граф. Нажмите ENTER, чтобы возвратиться к меню функции распределения. 16.4. ВЕРОЯТНОСТИ ХВОСТОВОЙ ОБЛАСТИ ОПРЕДЕЛЕНИЕ ----------- Процедура вероятности хвостовой области позволяет вычислить значение распределения комулятивных вероятностей в любой точке. Процедура позволя- ет выбрать из шести дискретных распределений и двенадцати непрерывных распределений. В зависимости от процедуры, которую вы выбираете, система даст различные подсказки. После того как вы выбрали распределение, введи те значение параметра и введите значения для случайной переменной, и сис тема воспроизведет область под этим значением. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ THE FOLLOWING Полный список подсказок для различных DISTRIBUTIONS распределений см. в разделе 16.2. ARE AVAILABLE Дискретные данные 1.BERNOULLI 4. GEOMETRIC 2.BINOMIAL 5. NEGATIVE 3.DISCRETE BINOMIAL UNIFORM 6. POISSON Непрерывные данные 7.BETA 13.LOGNORMAL 8.CHISOUARE 14.NORMAL 9.ERLANG 15.STUDENT^S T 10.EXPONENTIAL 16.TRIANGULAR 11.F 17.UNIFORM 12.GAMMA 18.WEIBULL ENTER THE Введите номер, соответствующий распределению, NUMBER OF которое вы хотите использовать YOUR CHOICE: (1) ENTER VALUE OF Введите значение переменной, под которым ле- YOUR VARIABLE жит интересующая вас область. Система вос- (QUIT) произведет результат для этого значения, а затем подскажет вам о другом значении. Чтобы выйти из процедуры нажмите ENTER, не вводя значения ПРИМЕР ------ Для этого примера мы рассмотрим распределение роста воображаемого насе ления, для которого средний рост равен 5 футам. Когда появится первая подсказка, введите число 14, чтобы выбрать норма льное распределение. Введите число 5, чтобы указать средний рост для насе ления = 5 футам. Теперь введите число 1, чтобы показать, что чтандартное отклонение от среднего роста = 1 футу. Теперь введите число 6, чтобы пока зать, что вы хотите вычислить часть ростов, которые меньше 6 футов. Система воспроизведет сообщение: AREA AT OR BELOW6 = 0,84135 Этот результат говорит о том, что более 84% населения ниже 6 футов ростом. Нажмите ENTER, чтобы вернуться к меню функций распределения. 16.5. ФУНКЦИИ ОБРАТНОГО РАСПРЕДЕЛЕНИЯ ОПРЕДЕЛНИЕ ---------- Процедура функций обратного распределения вычисляет значение под кото рым лежит интересующая вас специфицированная область кумулятивного распре деления вероятностей. Процедура позволяет выбирать из шести дискретных и двенадцати непрерывных. В заывисимости от процедуры, которую вы выбирае те, система даст различные подсказки. После того как вы выбрали распределе ние, ввели значение параметров и ввели значения для нижней хвостовой облас ти, система воспроизведет значение случайной перемнной для специфицирован ной области. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ THE FOLLOWING Полный список подсказок для различных фун- DISTRIBUTIONS нкций распределения см. в разделе 16.2. ARIAVAILABLE Дискретные данные 1. BERNOULLI 4. GEOMETRIC 2. BINOMIAL 5. NEGATIVE 3. DISCRETE BINOMIAL UNIFORM 6. POISSON Непрерывные данные 7. BETA 13. LOGNORMAL 8. CHISOUARE 14. NORMAL 9. ERLANG 15. STUDENT S T 10. EXPONENTIAL 16. TRIANGULAR 11. F 17. UNIFORM 12. GAMMA 18. WEIBULL ENTER THE NUMBER Введите номер, соответствующий распреде- OF YOUR CHOICE лению, которое вы хотите использовать. (1): ENTER LOW TAIL Введите значение распределения кумуляти- AREA (QUIT) вных вероятностей. Система воспроизведет результат для этого значения, а затем подскажет вам о другом значении. Чтобы покинуть процедуру, нажмите ENTER, не вводя значения. ПРИМЕР ------ Для этого примера мы рассмотрим распределение ростов воображаемого населения, для которого средний рост = 5 футам. Когда появится первая под сказка, введите число 14, чтобы выбрать нормальное распределение. Введите число 5, чтобы обозначить средний рост для населения, равный 5 футам. Теперь введем число 1, чтобы указать, что стандартное отклонение от сред него значения роста = 1 футу. Когда система подскажет вам ввести значения для нижней хвостовой области, введите число 0,1 чтобы показать, что вы хотите вычислсить рост человека на десятой процентили распределния. Система воспроизведет подсказ ку: AREA BELOW 3.7184 = 0,1. Этот результат говорит о том, что 10% воображаемого населения имело бы рост приблизительно 3 фута восемь дюймов или меньше. Нажмите ENTER, чтобы вернуться к меню функции распределения. 16.6. ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ЧИСЕЛ ОПРЕДЕЛЕНИЕ ------------ Часто целесообразно сгенерировать случайные числа из известных распреде ний. Вы можете использовать эти случайные числа для проверки ответа выбранных статистических процедур или для получения оценки изменчивости выборочных данных. Система STATGRAPHICS представляет ряд генераторов случайных чисел для выбранных дискретных и непрерывных распределений. Система также позволяет сгенерировать случайные векторы из многомерного нормального распределения со специфицированной ковариационной матрицей. Процедура позволяет выбирать из шести дискретных распределений, двенад цати непрерывных распределений и одного многомерного распределения. В зависимости от распределения, которое вы выбираете, система даст различные подсказки. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ THE FOLLOWING Полный перечень подсказок для дискретного DISTRIBUTIONS и непрерывного распределений см. в разд. ARE AVAILABLE: 16.2. Дискретные данные 1.BERNOULLI 4. GEOMETRIC 2.BINOMIAL 5. NEGATIVE 3.DISCRETE BINOMIAL UNIFORM 6. POISSON непрерывные данные 7. BETA 13. LOGNORMAL 8. CHISQUARE 14. NORMAL 9. ERLANG 15. STUDENT S T 10. EXPONENTIAL 16. TRIANGULAR 11. F 17. UNIFORM 12. GAMMA 18. WEIBULL MULTINARIATE Если вы выбираете многомерное нормальное DATA распределение, вам будет дана подсказка для 19. MULTIVARIATE вектора средних значений и для матрицы дис- NORMAL персии-ковариации ENTER THE NUMBER Введите число, соответствующее распределе- OF YOUR CHOICE нию, которое вы хотите использовать. (1): ENTER NUMBER OF Введите число случайных значений, которые SAMPLES TO BE вы хотите, чтобы система сгенериро вала. GENERATED (100): ENTER NAME OF Введите имя переменной, которую вы хотите VARIABLE INWHICH использовать для хранения случайных чисел TO SAVE THE SAMPLES: ПРИМЕР ------ Для этого примера мы сгенерируем и сохраним 200 случайных чисел из нормального распределения со средним значением равным 5 и стандартным отклонением равным 1. Когда появится подсказка о распределении, введите число 14, чтобы выбрать нормальное распределние.Введите число 5, чтобы показать, что средним значением для случайных чисел, будет 5. Теперь введите число 1, чтобы показать, что стандартным отклонением от среднего значения будет 1. Теперь введите число 200, чтобы показать, что вы хотите, чтобы было создано 200 случайных чисел, для распределения. Когда система подскажет об имени переменной, в которой хранить случайные числа, введите -random. Система сохранит эти значения в переменной random оперативной памяти Эта переменная может теперь использоваться в любой другой процедуре STATGRAPHICS. Если вы хотите сохранить эту переменную для использования во время будующих сеансов, запишите переменную в файл, используя процедуры описанные в разделе 9.7. .3460 Г Л А В А 17 ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ДАННЫХ Система STATGRAPHICS предоставляет различные методы, которые вы можете использовать для выполнения исследоватольского анлиза данных. Исследовательские работы Джона Пеки (1977) и др. были вкючены в процедуры, содержа- щиеся в этом разделе. Вдобавок к исследовательским методам, предоставленным в этом разделе прогнозирование и сглаживание (см. главы 20 и 22) предоставляют дополниптельные выборы сглаживания, а раздел описательных методов (см. главу 14) предоставляет процедуру прямоугольного графика с ответвлениями идентичную процедуре, описанной в этой главе. Раздел исследовательского анализа данных содержит шесть процедур, которые суммируются ниже и подробно описываются в разделах с 17.2 по 17.7. Процедура Число тип Описание переменных данных ------------------------------------------------------------ BOX-AND Вычерчивает графический WHISKER PLOT 1 N статистический пятиз- (прямоугольный начный итог набора наб- график с ответ- людений ветвлениями) MULTIPLE 2 N Строит ряд прямоуголь- BOX-AND ных графиков с ответв- WHISKER PLOT лениями, чтобы проил- люстрировать данные 10 % подгрупп NOTCHED 2 N Строит прямоугольный BOX-AND график с ответвлениями WHISKER PLOT и выемкой на довери- тельных интервалах для медиан MEDIAN POLISH 1 N Удаляет результат рядо OF TWO-WAY и колонок из двунаправ TABLE ленной таблицы RESISTANT Сглаживает временной NONLINEAR ряд, используя один и SMOOTHNG из пяти вариантов не- линейного сглаживания SUSPENDED 1 N Подбирает нормальное ROOTOGRAM распределение к выбор ке данных и вычерчива ет отклонение между квадратными корнями наблюдаемого и ожида- емого класса частот Имя файла Переменные ------------------------------------ CARDATA mpg origin TSDATA ibm ggb Инструкциипо считыванию переменных в вашу рабочую область см. в разделе 9.6. Чтобы выполнить примеры в этой главе, считайт следующие переменные из вашего диска наборов данных выборки . ВВОД ДАННЫХ ННЫХ 17.2. ПРЯМОУГОЛЬНЫЙ ГРАФИК С ОТВЕТВЛЕНИЯМИ ------------ Подсказка Ответ ОПРЕДЕЛЕНИЕ ----------------------------------------------------------- ----------- Эта процедура вычерчивает несколько модифицированный прямоугольный график с ответвлениями тем, что ответления протягиваются только к наибольшему и наименьшему (значениям) наблюдениям, которые находятся в пределах в 1,5 раза превышающих межквартильный размах их ближайших квартилей. Точечные символы вычерчиваются отдельно для всех. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, содержащего CONTAINING YOUR ваши наблюдения. DATA: ПРИМЕР ------ В этом примере мы рассмотрим распределение показателей пробега автомобилей в мпилях. Когда появится подсказка, введите mpg для имени цифрового вектора. Будет воспроизведен график. Т.к. график разделяет данные на четыре области равной частоты, легко можно заметить ассиметричное поведение. В этом случае не существует крайних (значений) точек. Когда вы закончили рассматривать график, нажмите ENTER, чтобы вернуться к меню исследовательского анализа данных. по-видимому, различаются несколько больше чем (для) японских, с большим центральным прямоугольником и более длинными ответвлениями. Когда вы закончили рассматривать график, нажмите ENTER, чтобы возвратиться к меню исследовательского анализа данных. 17.3. РЯД ПРЯМОУГОЛЬНЫХ ГРАФИКОВ С ОТВЕТВЛЕНИЯМИ ОПРЕДЕЛЕНИЕ ----------- Если наблюдения, которые вы рассматриваете могут быть подразделены на группы, вы можете использовать ряд прямоугольных графиков с ответвлениями чтобы проиллюстрировать данные для каждой группировки. Каждое 17.4. ПРЯМОУГОЛЬНЫЙ ГРАФИК С ОТВЕТВЛЕНИЯМИ И ВЫЕМКОЙ наблюдение в группе должно иметь соответствующий номер выборки или другой фактор классификации. Крайние точки, в ОПРЕДЕЛЕНИЕ 1,5 раза превышающие длину прямоугольника (межквартильных ----------- размах) вычерчиваются как отдельные примыкающие значения. Прямоугольный график с ответвлениями и выемкой является модификацией (Макджим и др, 1978) стандартного графика с ENTER THE NAME Введите имя цифрового вектора, содержащего ответвлениями. К каждому прямоугольнику добавляется выемка, OF VARIABLE ваши наблюдения. соответствующая ширине доверительного интервала для медианы, CONTAINING YOUR тогда как ширина прямоугольника пропорциональна квадратному DATA: корню числа наблюдений в наборе данных. На выемках установлен доверительный уровень, который позволяет ENTER THE NAME OF Введите имя переменной, содержащей номера выполнять попарное сравнение на 95% уровне, выявляя не THE VARIABLE выборок или другие факторы классификации. перекрыватся ли две выемки. CONTAINING вы должны ввести цифровой вектор, который THE SAMPLE NUMBERS: имеет такую же длину, как и переменная, ВВОД ДАННЫХ содержащая наблюдения ----------- Подсказка Ответ ПРИМЕР ------------------------------------------------------------ ------ ENTER THE NAME OF Введите имя цифрового вектора, содержа- В этом примере мы сравним показатели пробега THE VARIABLE щего ваши наблюдения. автомобилей в милях для автомобилей изготовленных в США, CONTAINING YOUR Европе и Японии. Когда появится подсказка введите mpg для DATA: имени цифрового вектора и origin для имени переменной содержащей факторы классификации. Будет воспроизведен ENTER THE NAME OF Введите имя переменной, содержащей но- график. THE VARIABLE мера вашей выборки или другие факторы CONTAINING THE классификации. Вы должны ввести цифро- Обратите внимание, что медиана для европейских SAMPLE NUMBERS: вой вектор такой же длины, как перемен- автомобилей (2) очень близка к медиане для японских ная, содержащая ваши наблюдения автомомбилей (3), а медиана для американских автомобилей значительно ниже этих двух. График для японских автомоби- ПРИМЕР лей показывает два крайних значения, одно значительно выше ------ основной части значений, а второе значительно ниже. Также В этом примере мы снова рассмотрим показатели пробега обратите внимание на то, что показатели пробега автомобилей, автомобилей в милях для автомобилей, созданных в США, Европе и Японии. Когда появится подска зка, введите mpg для цифрового вектора и origin для фактора классификации, который содержит номера выборки. Будет воспроизведен график. На графике медианы для европейских (2) и японских (3) автомобилей находятся на одинаковом значении mpg и выемки совмещаются. Это совмещение означает, что нет значительного Зазличия между медианой миль на галон для европейских и японских автомобилей. Однако, медиана для американских автомобилей (1) значительно ниже двух других и ее выемка не совмещается с двумя другими. Вообще, два прямоугольника с выемками, которые не совмещаются означают значительное различие значений медиан. Ситуация, в которых ветка протягивается за пределы квартили показывает характер свертывания. В такие прямоугольники поместилось бы мало доверительности. Когда вы закончили рассматривать график, нажмите ENTER, чтобы вернуться к меню исследовательского анализа данных. 17.5. УСОВЕРШЕНСТВОВАНИЕ МЕДИАН ДВУНАПРАВЛЕННОЙ ТАБЛИЦЫ ОПРЕДЕЛЕНИЕ ----------- Процедура усовершенствования медиан является непараметрическим методом, предназначенным для того, чтобы помочь обнаружить образцы в двунаправленной таблице. Она аналогична двустороннему анализу среднего отклонения тем что она основана на общей модели, которая выражает каждое значение данных как сумму следующего: * общее значение (аналогично итоговому среднему) * результат для ряда, на котором находится значение * результат для колонки, в которой находится значение * остаток Значение таблицы могут быть отдельные изменения или результаты перекрес тного табулирования. Интерактивный метод, включающий последовательное вычерчивание медиан из значений данных, используется для вычисления результатов рядов и колонок. Процедура удалит результаты рядов и колонок, чтобы создать новую усовер шенствованную таблицу, содержащую только остатки. Вы можете сохранить следующие результаты: * матрицу с усовершенствованной таблицей * вычесленные результаты ряда * вычесленные результаты колонки Дополнительную информацию об усовершенствовании медиан см. в Velleman u Hoaglin, 1981г. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME OF Введите имя цифровой матрицы, содержа- MATRIX CONTAINING щей двунаправленную таблицу значений. THE TABLE TO BE POLISHED ENTER THE STOPPING Введите значения, чтобы остановить про- CRITERION FOR цесс, когдасумма пропорциональных изме- INTERATION (0,01) нений во всех остатках меньше, чем зна- чение, которое вы специфицировали ПРИМЕР ------ В этом примере мы рассмотрим данные по объему перевозок через мост Голден Гейт Бридж (золотые ворота) за каждый месяц в течение 168 месяцев. Данные для этого изучения хранятся в цифровом векторе данных ggb. Однако до того как вы сможете использовать перемнную ggb в этой процедуре, она должна быть переделана в матрицу. Когда появится подсказка, которая попросит вас ввести имя матрицы, которая должна быть усовершенствована, введите 14 12 RESHAPE ggb чтобы переделать вектор ggb в матрицу 12 х 14, содержащую таблицу, которую вы хотите усовершенствовать. Когда появится подсказка, предлагающая вам ввести критерий остановки для прцесса итерации, нажмите ENTER, чтобы использовать значение по умолчанию 0.01. Будет воспроизведена таблица, которая показывает данные ggb с удаленными результатами ее рядов и колонок. Вы можете горизонтально прокручивать таблицу, используя левую и правую клавиши управления курсором, или вы можете ввести номер страницы (1,1 1,2 или 1,3) чтобы рассмотреть определенный экран данных. Обратите внимание на большое значение в колонке 3, в седьмом ряду таблицы. Это соответствует первому эмбарго на нефть в 1973 году, когда длинные очереди у бензозаправных станций вынуждали водителей простраивать. Чтобы рассмотреть сезонные и годовые тенденции данных по Голден Гейт Бридж мосту, можно рассмотреть результаты рядов и колонок. Нажмите F10, чтобы очистить экран, и нажмите ENTER, когда получите подсказку для имени переменной, в которой хранить усовершенствованную таблицу. Будут воспроизведены типичные результаты рядов и колонок. Колонки двунаправленной таблицы покзывают каждый из двенадцати месяцев за которые данные собирались за 14-летний период. Результаты колонок показывают, что сеэонные тенденции повторяются каждый год. Оказывается что годичные объемы движения транспорта самые низкие в январе, что они неуклонно возрастают весной и достигают пика в летнии месяцы, а осенью и зимой резко снижаются. Нажмите ENTER, чтобы вернуться к меню исследовательского анализа данных. 17.6. РЕЗИСТНОЕ НЕЛИНЕЙНОЕ СГЛАЖИВАНИЕ Система STATGRAPHICS представляет различные средства для сглаживания данных временного ряда, записанных с равными интервалами во времени Процедура резистного сглаживания позволяет создавать ряды сглаженных данных равной длины с переменной первоначальных данных, чтобы построить результатирующий граф, используя один из резисторных нелинейных средств сглаживания. Используемые средства сглаживания описываются в Tukey (1977) и обычно упоминаются посредством использования компактного обозначения, такого как 3RSSH. Значения каждого символа описываются ниже: * Числа 3 и 5 обозначают диапазон используемой медианы (т.е. вы можете найти медиану для значений 3 и 5, окружающих каждую точку) * R-означает повторное сглаживание * S-означает, что будет выполнена специальная операция разбиения, чтобы исключить "плоские" сегменты в последовательности данных. Вторая S означает, что будет выполнено второе разбиение * Н обозначает "Hanninga" - означает специально используемое взвешенное среднее с весами 1/4, 1/2, и 1/4. За более подробной информацией о резисторном нелинейном сглаживании обращайтесь к Velleman и Hoaglin 1981. Чтобы выполнить резисторное нелинейное сглаживание, вы должны ввести вектор временного ряда, который содержит последовательно записанные значения с равными интервалами во времени. Преимуществом нелинейных средств сглаживания перед линейными, описанными в главе 22, являются их сопротивление изолированным "выпадающим показателям" далеко отстающим от остальных данных. Ключом к средствам сглаживания является используемая медиана. Мы называем эти средства "средства ми текущей медианы", т.к. вы проходите по последовательности данных и нахо дите медиану для значений данных 3 или 5, окружающих каждую точку. Если хотите, то можете провести повторное сглаживание, вновь выбирая из списка средств резисторного сглаживания. ВВОД ДАННЫХ ------------ Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, который вы OF THE VARIABLE хотите сгладить CONTAINING YOUR TIME SERIES DATA: THE FOLLOWING Введите номер, соответствующий требуемому RESISTANT средству сглаживания. Ключ к аббревиатуре SMOOTHERS ARE см. в описании в начале этого раздела. AVAILABLE: (1)3RSS (2)3RSSH (3)5RSS (4)5RSSH (5)3RSR ENTER THE DESIRED Введите Y или нажмите ENTER, если вы SMOOTHER (1/2/3/4/5) хотите изитобразить данные графически. DO YOU WANT Введите N, если вы не хотите вычертить TOPLOT THE SMOOTHED данные DATA (Y/N) DO YOU WANT TO Если вы хотите повторно сгладить сглаженные SMOOTH THE данные введите Y; вновь будет воспроизведен SMOOTH? (Y/N) перечень средств сглаживания . Если вы не хотите повторного сглаживания, введите N. ENTER NAME OF Введите имя переменной, которую вы хотите VARIABLE INWHICH испльзовать, чтобы хранить сглаженные дан- TO SAVE THE ные или нажмите ENTER,чтобы оставить проце- SMOOTHED DATA: дуру, не сохранив данные ПРИМЕР ------ В этом примере мы используем данные по курсу (акций) на момент закрытия биржи для курса акций IBM за 120 дневный срок. В ответ на подсказку введите ibm для переменной временного ряда, и введите число 1, чтобы вариант сглаживания 3RSS. Введите Y, чтобы графически представить сглаженные данные; будет воспроизведен граф. Заметьте, что сглаженная линия на рисунке "сопротивляется" изолирован ным значениям данных. Степень сопротивления зависит от выбранного средства сглаживания. После того как вы закончили рассматривать граф, нажмите F10, чтобы очистить экран. Тогда появится подсказка, спрашивающая хотите ли вы повторно сгладить данные. Введите N, чтобы показать, что вы не хотите повторного сглаживания. Затем вам будет дана подсказка об имени переменной, в кото- рой хранить сглаженные данные; нажмите ENTER, чтобы вернуться к меню исследовательского анализа данных. 17.7. ПРИОСТАНОВЛЕННАЯ КОРНЕВАЯ ДИАГРАММА ОПРЕДЕЛЕНИЕ ----------- Преостановленная корневая диаграмма подобна гистограмме, за исключением того, что вычерчиваются квадратные корни отклонений между наблюдаемыми и ожидаемыми частотами из наблюдения точного подбора нормального распреде ления ВВОД ДАННЫХ ------------ Подсказка Ответ ------------------------------------------------------------ ENTER THE NAME Введите имя цифрового вектора, который вы OF THE VARIABLE хотите рассмотреть. Минимальное и макси- CONTAINING YOUR мальное значение и число наблюдений будет DATA: воспроизведено после того, как вы введете имя переменной ENTER THE LOWER Введите нижний предел для первого класса LIMIT (n): частот или нажмите ENTER, чтобы использо- вать значение по умолчанию, показанное в скобках с подсказкой. ENTER THE UPPER Введите верхний предел для последнего клас- LIMIT (n): са частот или нажмите ENTER, чтобы исполь- зовать значение по умолчанию, показанное в скобках с подсказкой. ENTER THE NUMBER Введите число классов частот, или нажмите OF CLASSES (n): ENTER, чтобы использовать значение по умолчанию, показанное в скобках с под- сказкой ПРИМЕР ------ В этом примере мы рассмотрим распределение показателей пробега автомоби лей в милях. Когда появится подсказка, введите mpg для цифрового вектора, который вы хотите рассмотреть. Нажмите ENTER, чтобы принять значения по умолчанию для каждой из трех следующих подсказок. Будет воспроизведен граф. Корневая диаграмма ясно представляет отклонения средств передвижения от наиболее точного подбора нармального распределения данных по милям на голон. .3460 Г Л А В А 18 ДИСПЕРСИОННЫЙ АНАЛИЗ 18.1. ВВЕДЕНИЕ Методы дисперсионного анализа (ANOVA) используются для ряда статистических проблем, в которых пользователь заинтересован в воздействии одной или нескольких переменных на одну зависимую переменную, называемую переменной ответа. При использовании методов ANOVA неметрические переменные называются показателями или классификационными переменными. Несмотря на то, что ANOVA главным образом применяется для анализа неметрических показателей, эти методы могут использоваться для анализа метрических переменных, если эти переменные можно сгруппировать или объединить (пакетировать) в блоки. Общие линейные регрессионные процедуры могут быть использованы для анализа неметрических данных, однако процедуры ANOVA для единичных или многофакторных моделей проще использовать в том случае, когда данные пользователя содержат только неметрические показатели. Если данные пользователя содержат только метрические показатели, как в ковариационном анализе, то нужно использовать процедуру множественной регресии, описание которой приводится в разделе 19.8. Первые три процедуры ANOVA (для сбалансированного плана, несбалансированного и иерархического плана) предполагают, что данные пользователя соответствуют нормальному распределению. Во многих экс- периментальных проектах данные могут не соответствовать нормальному распределению, или же у пользователя может возникнуть потребность проверки справедливости данного предположения. Система STATGRAPHICS обеспечивает выполнение двух непараметрических процедур ANOVA: однонаправленный (односторонний) классификационный анализ Краскела-Уоллиса и двунаправленный классификационный анализ Фридмана. Процедура Краскела-Уоллиса позволяет изучать сбалансированный или несбалансированный однонаправленный план; процедура Фридмана позволяет изучать сбалансированный двунаправленный план. Раздел, посвященный методам ANOVA, содержит пять процедур, которые обобщаются ниже и подробно рассматриваются в разделах 18.2 -- 18.6. Процедура Число пе- Тип данных Описание ременных ------------------------------------------------------------ Анализ сба- n N Анализирует влияние лансирован- одного или нескольких ных планов качественных факторов на одну переменную ответа, если число наблюдений равно во всех комбинациях факторных уровней Анализ не- n N Анализирует влияние сбалансиро- одного или нескольких ванных пла- качественных факторов нов на одну переменную ответа, если число наблюдений равно во всех комбинациях факторных уровней Анализ иерар- n N Анализирует влияние хических пла- одного или нескольких нов качественных факто- ров на одну переме- нную ответа, если данные полностью гнездовые или иерар- хические и число наблюдений равно во всех комбинациях факторных уровней Однонаправ- 2 N Анализирует влияние ленный клас- классификационного сификационный фактора на сбаланси- анализ Краске- рованный или несба- ла-Уоллиса лансированный одно- направленный план Двунаправлен- 2 N Анализирует влияние ленный класси- двух классификацион- фикационный ных факторов на сба- анализ Фрид- лансированный двуна- мана правленный план Для выполнения примеров, приведенных в данной главе, считайте следующие переменные с диска с наборами выборочных данных: Имя файла Переменные -------------------------- ANOVA poison (яд) treatment (лечение) survival (выживаемость) batch (партия) sample (проба) test (проверка) moistupe (влага) CARDATA mpg (столько-то) миль на галлон year (год) origin (страна-изготовитель) Инструкции по считыванию переменных в рабочую область приведены в разделе 9.6. 18.2. АНАЛИЗ СБАЛАНСИРОВАННЫХ ПЛАНОВ Быстрый доступ: Y1 ОПИСАНИЕ -------- Процедура анализа сбалансированных планов анализирует влияние одного или нескольких качественных факторов на одну переменную ответа, когда число наблюдений равно во всех комбинациях факторных уровней. Перед выбором метода ANOVA для сбалансированных планов убедитесь, что ваши данные соответствуют этой статистический процедуре. В данном руководстве данная процедура применялась для несбалансированных данных по автомобилям, т.к. рассматривался только один фактор-страна-изготовитель. Однако в большинстве случаев методы сбалансированного планирования могут использоваться только, если имеется одно и то же число наблюдений для каждой комбинации рассматриваемых факторных уровней. Если же число наблюдений для различных факторов не совпадает, то необходимо использовать методы ANOVA для несбалансированных планов. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- Ввести имя пере- Введите имя зависимой переменной, менной ответа которую хотите проверить После ответа на это подсказывающее сообщение появится табло спецификаций ANOVA. Введите необходимые факторы,затем нажмите клавишу ENTER или функциональную клавишу (функциональный ключ) для подборки (построения) Поля, изображенные на данном табло, описаны ниже. Поле Описание ------------------------------------------------------------ Переменная Содержит переменную, которая была введена в ответ ответа на правую подсказку. Это поле можно отредактиро- вать для проверки преобразования данной перемен- ной или для анализа второй переменной ответа Источник Введите имена классификационных факторов (показа- изменчи- телей), которые вы хотите проверить. Все факторы вости должны иметь одинаковую длину и должны быть равны по длине переменной ответа. Можно использовать лю бое действительное выражение системы STATGRAPHICS если с помощью его создается переменная той же са мой длины, что и другие переменные. Можно ввести информацию в поля путем печати переменных и других выражений,подходящих (соответствующих) для вашего анализа с клавиатуры. После окончания ввода данных нажмите клавишу ENTER для обновления табло. Если при вводе была допущена ошибка, то в нижнем правом углу экрана появится сообщение об ошибке. Вы можете увидеть в строке состояния табло, что функциональные ключи процедуры во время выполнения этой процедуры находятся в активном состоянии. F1 и F10 сохраняют свои обычные описания (HELP и QUIT) Другие ключи функционируют как описано ниже. Ключ Описание ------------------------------------------------------------ F2 Вычерчивает средние значения для выбранных факторов (MEANS) Вам будет выдано подсказывающее сообщение относи- тельно фактора и типа графика.Предлагаются три типа графиков: 1 - График среднеквадратических (квадратических) ошибок. График отдельных доверительных интервалов для значений факторного уровня. Выдается подска- зывающее сообщение по доверительному уровню. Стандартное значение равно 95%. 2 - Доверительные интервалы. График отдельных дове- рительных интервалов для значений факторного уров- ня.Выдается подсказывающее сообщение по доверитель- ному уровню. Стандартное значение равно 95%. 3 - Наименьшие шаги разности. График наименьших ша- гов разности. С помощью интервалов LSD можно проверить разницу выбранных средних значений. Средние значения фак- торов уровня значительно отличаются,если интерваль- ные оценки не совмещаются на графике. После оконча- ния построения графика нажмите клавишу ENTER, на экране появится таблица, содержащая подсчитанные результаты значений факторных уровней, средние зна- чения и средние неквадратические (квадратические стандартные) ошибки для средних значений факторного уровня. По окончании работы с таблицей для возврата к табло спецификаций ANOVA нажмите клавишу F10. F3 Вычерчивает прямоугольный график наблюдений с от- (BOXPLT) ветвлениями на каждом факторном уровне.Пользовате- лю выдается подсказка фактора, который должен испо- льзоваться. Более подробная информация по интерпре- тации прямоугольных графиков с ответвлениями приве- дена в разделе 14.3. По окончании работы с графопо- строителем нажмите клавишу ENTER для возврата к та- бло ANOVA. F4 Вычерчивает прямоугольный график с выемками и от- (NBXPLT) ветвлениями наблюдений на каждом факторном уровне. Пользователю выдается подсказка фактора, который должен использоваться. Более подробная информация по интерпретации прямоугольных графиков с выемками и ответвлениями приводится в разделах 14.3 и 17.4. По окончании работы с данным графиком нажмите кла- вишу ENTER для возврата к табло ANOVA. F5 Вычерчивает график остаточных величин по сравнению (RESIDS) с одним из классификационных факторов или по срав- нению с предсказанными значениями (прогнозируемыми величинами). Пользователю выдается подсказывающее сообщение о факторе, который должен использоваться. По окончании работы с данным графиком нажмите кла- вишу ENTER для возврата к табло ANOVA. По окончании работы с моделью ANOVA нажмите клавишу F10 для окончания работы данной процедуры. Остаточные величины из данной процедуры хранятся в переменной оперативной памяти, называемые RESIDUALS. Если вы хотите сохранить остаточные величины для использования после текущего сеанса, вы должны переименовать переменную и записать ее в файл при помощи процедур, описанных в разделе 9.7. ПРИМЕР ------- В данном примере мы будем использовать данные по времени выживаемости животных, к которым были применены три различных яда и четыре различных метода лечения (Вох и Сох, 1964 и Вох, Hunter и Hunter, 1978). Сорок восемь животных были произвольно объединены в двенадцать групп по четыре животных в каждой. Каждой группе был дан различный яд и проводилось разное лечение. Затем проводились наблюдения за сроком выживаемости отдельного животного. После появления подсказки для переменной ответа введите: выживаемость (survival) Когда появится табло спецификаций ANOVA, напечатайте: яд (poison) в первой строке поля источника изменчивости. Перейдите на вторую строку (нажмите табулятор) и напечатайте: лечение (treatment) Затем нажмите клавишу ENTER и на дисплее снова появится табло ANOVA со статистикой для классификационных факторов и статистикой ERROR. Посмотрите на значения в колонке (столбце) PROB (>F).Чем меньше вероятность, тем более возможно, что фактор оказал значительное влияние на переменную ответа. В данном примере оба значения poison и treatment обладают высокой значимостью. Это означает, что тип яда и вид лечения воздействуют на длительность выживания животных. Оба эти значения имеют основное влияние и предполагается, что они должны фиксироваться. Теперь исследуем влияние взаимодействия двух факторов. Перейдем к строке 4. Напечатайте poison * treatment и нажмите клавишу ENTER Фактор взаимодействия добавляется к вычислениям и табло повторно появляется на экране с новыми результатами. Затем создадим прямоугольный график с выемкой и ответвлениями для наших данных. Нажмите F4 и введите I в ответ на подсказку фактора, который должен использоваться. С помощью этого будет создан прямоугольный график с выемкой и ответвлениями для фактора poison. Обратите внимание на единственное необычно большое значение второго уровня poison, изображенного на графике в виде точки над прямоугольником. Нажмите ENTER для возврата к табло ANOVA. Теперь построим график остаточных величин. Укажите: FS и введите 0 в ответ на подсказку фактора, который должен использоваться. Получим график остаточных величин по сравнению с прогнозируемыми величинами. Отметим как остаточные значения возрастают по мере возрастания прогнозируемых значений. Это указывает на непостоянную дисперсию и предполагает, что мы должны проанализировать логарифмы времени выживания, а не исходные данные. Нажмите ENTER для возврата к табло ANOVA. Нажмите табулятор для возврата к переменной ответа и напечатайте (наберите с клавиатуры) LOG survival затем нажмите ENTER для повторной подборки модели. Нажмите F5 и введите 0 в ответ на подсказывающее сообщение фактора, который должен использоваться. С помощью этого получим график остаточных величин по сравнению с новыми прогнозируемыми значениями. Нажмите клавишу ENTER для возврата к табло ANOVA и F10 для выхода из процедуры. 18.3. АНАЛИЗ НЕСБАЛАНСИРОВАННЫХ ПЛАНОВ Быстрый доступ:Y2 ОПИСАНИЕ -------- ANOVA для несбалансированных планов выполняет анализ влияния одного или нескольких качественных факторов на одну переменную ответа, если число наблюдений не равно во всех комбинациях факторных уровней. Многие эмпирические исследования в отличие от запланированных экспериментов могут содержать неравное число наблюдений на фактор. Даже в запланированных экспериментах могут быть спорные данные или вам пришлось бы сократить некоторое количество запланированных экспериментов. ВВОД ДАННЫХ ----------- Ввод данных для процедуры анализа несбалансированных планов аналогичен вводу данных для процедуры анализа сбалансированных планов. Описание подсказывающих сообщений, табло спецификаций ANOVA и функциональных ключей процедуры приведены в разделе 18.2. ПРИМЕР ------ В данном примере исследуется прогон автомобиля в милях для 155 автомобилей по сравнение с годом, когда был изготовлен каждый автомобиль и в какой стране. Когда появляется подсказывающее сообщение для переменной ответа, введите mpg (столько-то миль на галлон) Когда появляется пустое табло спецификаций ANOVA, наберите с клавиатуры year (год) в первой строке поля (исходного поля) источника изменчивости. Перейдите ко второй строке и напечатайте origin (страна-изготовитель) Затем нажмите ENTER и результаты будут отображены на новом экране, как это показано на рисунке 18.6. Результаты включают в себя стандартные результаты основных эффектов и любые двуфакторные взаимодействия. Общая сумма квадратов основ- ных эффектов (3758.3418) представляет собой сумму влияний за исключением термов взаимодействия. Влияние каждого основного эффекта оценивается с учетом того, что все другие основные эффекты уже входят в данную модель. Сумма отдельных основных эффектов не обязательно будет равна сумме всех основных эффектов, как в данном примере. Используя эти результаты, можно определить может ли отдельный фактор быть удален из модели. Итог для двуфакторных взаимодействий (252.19838) представляет собой сумму всех взаимодействий между факторами, если брать по два в единицу времени и предположить, что влияние основных эффектов уже удалено из модели. Каждый эфект двуфакторного взаимодействия отдельно отображается на экране и вычисляется, при этом предполагается, что все другие двуфакторные взаимодействия уже вычислены. Заметим, что в нашем примере оба основных эффекта являются значащими, а эффект взаимодействия таковым не является. Разбиение каждого эффекта либо основного, либо для возврата к табло ANOVA. Теперь вычертим график значений факторного уровня. Нажмите F2 и введите 2 в ответ на подсказку для фактора, который должен использоваться. Затем введите 2 в ответ на подсказку для типа графика, который должен быть построен. Нажмите ENTER в ответ на подсказку доверительного уровня для выбора стандартных значений (953). С помощью этих элементов можно построить график. Когда закончите работу с графиком, нажмите ENTER и на экране появится итоговая таблица средних значений факторного уровня. Для возврата к табло ANOVA нажмите ENTER. Затем для выхода из процедуры нажмите F10 18.4. АНАЛИЗ ИЕРАРХИЧЕСКИХ ПЛАНОВ Быстрый доступ:J3 ОПИСАНИЕ -------- Процедура анализа иерархических планов анализирует влияние одного или нескольких качественных фкторов на одну переменную ответа, если данные являются полностью вложенными или иерархическими и число наблюдений равно во всех комбинациях факторных уровней. ВВОД ДАННЫХ ----------- Ввод данных для процедуры анализа иерархических планов аналогичен вводу данных для процедуры анализа сбалансированных планов. Описание подсказывающих сообщений и табло спецификаций ANOVA приводится в разделе 18.2. При анализе иерархических планов факторы должны быть специфици- рованы на табло в том порядке, в котором они вложены. Функциональные ключи процедуры для этой процедуры не определяются ПРИМЕР ------ Данные для этого примера взяты из лабораторного эксперимента по определению содержимого влаги в краске (с. Box, Hunter b Hunter,1978) Химический производственный процесс повторялся 15 раз. Две пробы были взяты из каждой из 15 банок изготовленной краски. По определению содержания влаги по каждой пробе краски было выполнено по 2 проверки. Когда появляется подсказывающее сообщений для переменной ответа введите moisture (влажность) Когда появляется табло спецификаций ANOVA, напечатайте batch (порция, дозировка, банка) в первом ряду исходного поля отклонений. Перейдите ко второй строке и напечатайте sample (проба) затем нажмите ENTER и табло снова появится на экране с результатами вычислений. Со стандартными суммами квадратов и степенями свободы включены: Квадрат оценки среднего для каждого фактора (MEAN SQUARE). Компонента дисперсии, связанная с каждым фактором (VAR.COMP). Процентное распределение компонент дисперсии (PERCENT). Дисперсионный анализ - Иерархические планы ------------------------------------------------------------ переменная ответа - moisture (влага) ------------------------------------------------------------ источник сумма D.F. среднеквад- компонента процент отклонений квадратов ратическое дисперсии значение ------------------------------------------------------------ Итог 2108.1833 59 ------------------------------------------------------------ batch банка 1210.9333 14 86.495238 7.128 19.49 (порция) sample 869.7500 15 57.983333 28.533 78.01 проба ERROR 27.5000 20 .916667 .917 2.51 ------------------------------------------------------------ ANOVA - порция (банка) и проба по сравнению с влагой Компонента дисперсии является мерой произвольного влияния каждого фактора. Если вы производите какое-либо количество продукта, то вы захотите выяснить основные источники изменчивости. Данные факторы с относительно высокими компонентами дисперсии оказывают соответственно большее влияние на переменную ответа. В данном примере изменчивость между образцами является основным источником отклонений. Если изучаемые факторы не являются конкретными трактовками (как, например, вид яда), а произвольно выбираются из большого числа возможностей (как, например, влажность красок), то такие факторы лучше всего обрабатывать как произвольные эффекты. Затем с помощью анализа определяется пропорция изменчивости в ответе, который является атрибутом каждого фактора. Чем больше компонента оценки дисперсии, тем больше ее влияние на ответ. Для выхода из процедуры нажмите F10 18.5. ОДНОНАПРАВЛЕННЫЙ АНАЛИЗ КРАСКЕЛА-УОЛЛИСА Быстрый доступ:J4 ОПИСАНИЕ -------- Процедура Краскела-Уоллиса анализирует влияние классификационного фактора на сбалансированный или несбалансированный однонаправленный план. Для использования процедуры Краскела-Уоллиса ваши данные должны состоять из набора наблюдений для каждого из k уровней одного фактора. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя Введите имя зависимой переменной, кото- переменной рую вы хотите проверить ответа Введите имя Введите имя классификационного фактора классификационной переменной ПРИМЕР ------ В данном примере будут проверяться оценки пробега автомобиля в милях по отношению к стране-изготовителю автомобиля. В процедуре Краскела-Уоллиса весь набор наблюдений сначала ранжирован с наименьшего до наибольшего пробега автомобиля. Каждому наблюдению присвоен ранг. Значение этого ранга вычисляется для каждой группы (США=1, Европейские=2 и Японские=3). Затем статистика (тестовая статистика) испытаний вычисляется для проверки гипотезы, что выборки делаются из одной и той же совокупности. Если статистика испытаний высока, то гипотеза должна быть отклонена. Если общее число наблюдений большое, то ста- тистика испытаний будет развиваться в направлении распределения хи-квадрат. Если выборка небольшая, то необходимо обратиться к специальным таблицам для определения значимости. Данная процедура корректирует связи (справедлива для них). Связям дается средний ранг связанных элементов и устанавливается (согласовывается) статистика испытаний для отображения расширения связей. Когда появляется подсказывающее сообщение для переменной ответа, введите mpg (мили на галлон) Когда появляется подсказка для классификационной переменной, введите origin (страна-изготовитель) На экран будут выведены следующие результаты: Средние ранги по уровню страны 56.1353 98.36 106.92 Статистика испытаний = 44.1396 Уровень значимости = 2.60145Е-10 На экране отображаются средние ранжирования mpg для каждой из трех стран-изготовителей. Статистика испытаний и приблизительный уровень значимости для статистики также выводится на экран. Стаитстика испытаний является мерой различия (разниц) значимости между распределениями данных для каждой группы. В данном случае статистика испытаний и очень небольшой уровень значимости означают, что mpg для разных стран-изготовителей имеет большое различие. Для возврата к меню дисперсионного анализа нажмите ENTER снова выберите процедуру Краскела-Уолиса. В этот раз используйте процедуру для получения значений mpg и year. На экран будут выведены следующие результаты: Средние ранги по уровню года 48.8889 55.6724 104.776 88.1207 95.6935 Статистика испытаний = 39.4399 Уровень значимости = 5,65103Е-8 Вычисляется среднее ранжирование расхода топлива при пробеге автомобиля в милях для каждой модели в течение 5 лет. Очень небольшой уровень значимости указывает, что распределение mpg значительно меняется в зависимости от года изготовления автомобиля. Для выхода из процедуры нажмите ENTER 18.6. ДВУНАПРАВЛЕННЫЙ КЛАССИФИКАЦИОННЫЙ АНАЛИЗ ФРИДМАНА Быстрый доступ: J5 ОПИСАНИЕ -------- Процедура Фридмана анализирует влияние двух классификационных факторов на анализ данных с помощью сбалансированного двунаправленного плана. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- Введите имя Введите имя зависимой переменной, ко- переменной ответа торую вы хотите проверить Введите имя Введите имя классификационного фактора классификационной переменной ПРИМЕР ------ При использовании процедуры Фридмана ваши данные должны состоять из равного числа наблюдений каждой группировки k в каждом из n блоков. Данные должны вводится, как если бы они были организованы в виде таблицы из n строк и k столбцов (колонок). Статистика испытаний вычисляется для проверки гипотезы, что распределения каждой группировки идентичны. Если статистика испытаний высокая, то гипотеза должна быть отклонена. Когда общее число наблюдений большое, статистика испытаний будет развиваться в направлении распределения хи-квадрат. В случае небольших выборок необходимо обратиться к специальным таблицам для определения значимости. Данная процедура справедлива для связей. Связям дается средний ранг связаных элементов и устанавливается статистика испытаний для отображения расширения связей. Когда появляется подсказка для переменной ответа, введите survival (выживаемость) Когда появляется подсказывающее сообщение для классификационной переменной, введите poison (яд) На экране будут выведены следующие результаты: Средние ранги по уровню яда 2.5625 2.40625 1.03125 Статистика испытаний = 23.0794 Уровень значимостьи = 9.73598Е-6 В данной процедуре ранжируются значения каждого блока строк. Затем вычисляется средний ранг для каждой строки poison или колонки. Результаты указывают, что poison 3 почти всегда наибольший в каждом блоке, в то время как poison 1 и 2 (яды 1 и 2) занимают попеременно второе и третье места. В данном примере очень небольшой уровень значимости указывает, что распределение времени выживаемости значительно отличается в зависимости от ядов. Для возврата к меню дисперсионного анализа нажмите ENTER Снова вызовите процедуру Фридмана. На этот раз используйте процедуру для (выживаемости) survival и (лечения) tre atment. На экран будут выведены следующие результаты: Средние ранги по уровню лечения 1.20833 3.625 2.04167 3.125 Статистика испытаний = 25.8814 Уровень значимости = 1.00988Е-5 Очень небольшой уровень значимости означает, что время выживания значительно отличается от используемого лечения. Для выхода из процедуры нажмите ENTER .3460 Г Л А В А 19 РЕГРЕССИОННЫЙ АНАЛИЗ 19.1. ВВЕДЕНИЕ STATGRAPHICS обеспечивает разнообразие методов моделирования, которые дают возможность пользователю связывать зависимую переменную с одной или более независимыми переменными. Во многих статистических задачах целесообразно выразить зависимую переменную как линейную функцию независимых переменных. При анализе других проблем (задач) вы можете быть заинтересованы в построении нелинейных моделей. Регрессионный анализ позволяет суммировать данные и квантифицировать основные свойства и устойчивость связей между переменными. Регрессионный анализ можно использовать также для прогнозирования будущих значений зависимых переменных на основе наблюдаемых связей. В STATGRAPHICS графические отображения тесно объединены с вычислениями регрессионного анализа для управления процессом построения модели. Раздел, посвященный регрессионному анализу содержит 11 процедур, которые более подробно описываются в разделах 19.2- 19.12. Процедура Число пе- Тип Описание ременных данных ------------------------------------------------------------ Матрица корре- 2 или более N Создает таблицу коэффи- ляции циентов корреляции Ковариационная 2 или более N Создает таблицу ковари- матрица ационных оценок Простая рег- 2 N Выполняет регрессию с рессия использованием одной не- зависимой переменной. Оценивает линейные или выбранные нелинейные модели Интерактивное 2 N Позволяет удалять зна- отклонение рез- чения данных интерактив- ко отклоняющих- ной графики из простой ся значений линейной регрессии Переменные типа 1 N Создает "фиктивные пере- - указатель менные" из классификаци- онных факторов Частичная кор- 2 или более N Создает таблицу коэффи- реляция циентов частичной кор- реляции Множественная 2 или более N Выполняет линейные рег- регрессия рессии с использованием нескольких независимых переменных Пошаговая вы- 2 или более N Выполняет множественные борка пере- пошаговые регрессии в менных обратном или прямом по- рядке Гребенчатая 2 или более N Выполняет гребенчатую регрессия регрессию на стандарти- зованных переменных Гребенчатая 2 или более N Выполняет гребенчатую кривая регрессию и создает график результатов Нелинейная 2 или более N Производит оценку пара- регрессия метров по методу наи- меньших квадратов в не- линейной регрессионной модели пользователя Для выполнения примера, приведенного в данной главе, считайте следующие переменные из диска с выборочным набором данных. Имя файла Переменные --------------------------- CARDATA mpg cylinders цилиндры (перемещение) displace объем цилиндров двигателя horsepower мощность в лошадиных силах accel скорость year год weight вес origin страна-изготовитель price цена NONLIN chlorine хлор weeks недели В главе 9.6 приводятся инструкции по считыванию переменных в рабочую область памяти. Все регрессионные процедуры за исключением простой регрессии исключают отсутствующие значения в режиме списка, т.е. исключаются все случаи, которые содержат отсутствующее значение в любом векторе. Процедура простой регрессии генерирует статистику прогнозирования и связанную статистику для всех случаев, которые не имеют отсутствующих значений в независимой переменной. Для того, чтобы прогнрозировать ответ для выбранного значения независимой переменной не в исходном наборе данных, добавьте необходимое значение к независимой переменной и закодируйте зависимую переменную как отсутствующую. 19.2. КОРРЕЛЯЦИОННАЯ МАТРИЦА (МАТРИЦА КОРРЕЛЯЦИИ) Быстрый доступ: K1 ОПИСАНИЕ -------- Процедура корреляционной матрицы (матрицы корреляции) оценивает корреляционные коэффициенты для набора цифровых векторов. Матрица корреляции обеспечивает целесообразное предварительное представление отношений (связей) между переменными. Коэффициенты корреляции обеспечивают нормадизованный и свободный от масштаба критерий связи между двумя переменными. Значения коэффициентов составляют диапазон от -1 до +1. Положительная корреляция обозначает, что переменные изменяются в одном и том же направлении, в то время как отрицательная коррелиция обозначает, что переменные изменяются в противоположных направлениях. Статистически независимые переменные будут иметь корреляцию около нуля. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя первой Введите имя цифрового вектора,содержаще- переменной го первый набор данных пользователя Введите имя следу- Введите имя цифрового вектора, содержа- ющей переменной щего следующий набор данных пользователя Данная подсказка будет повторно появля- ться до тех пор, пока вы не нажмете кла- вишу ENTER, для обозначения окончания ввода данных. Все векторы должны быть одинаковой длины. ПРИМЕР ------ В данном примере мы будем использовать данные по определению пробега автомобиля в милях, веса, мощности в лошадиных силах и объема цилиндров 155 автомобилей. Когда появляется подсказка для первой переменной, введите mpg (столько-то миль на галлон) По мере появления последующих подсказок введите weight (вес) horsepower (мощность в лошадиных силах) displace (объем цилиндра) Нажмите ENTER для останова подсказок. На экран будет выведена следующая таблица коэффициентов корреляции: Матрица корреляции mpg weight horsepower displace mpg 1.00000 -.82576 -.78875 -.75652 weight -.82576 1.00000 .81071 .91495 horsepower -.78875 .81071 1.00000 .82260 displace -.75652 .91495 .82260 1.00000 Заметим, что weight, horsepower и displace отрицател ьно коррелируются с помощью mpg. В целом, чем выше мощность и тяжелее автомобиль, тем меньше получается миль на галлон. Если вы хотите создать матрицу корреляции и сохранить ее для дальнейшего использования, то необходимо воспользоватьс процедурой генерации матрицы корреляции, описанной в разделе 25.4. Для возврата к меню Регрессионного анализа нажмите F10 19.3. КОВАРИАЦИОННАЯ МАТРИЦА Быстрый доступ: K2 ОПИСАНИЕ --------- Процедура кавариационной матрицы вычисляет (оценивает) ковариации для набора цифровых векторов. С помощью ковариации измеряется линейная связь между переменными. Если обе переменные имеют тенденцию быть выше или ниже их средних значений в одно и тоже время, то ковариация будет положительной. Если одна переменная как правило выше ее среднего значения, в то время, как значение другой ниже среднего, то ковариация будет отрицательной. Знаяение ковариации чувствительно к масштабированию, т.к. оно сохраняет элементы исходных переменных. ВВОД ДАННЫХ ----------- Подсказка Ответ ----------------------------------------------------------- Введите имя Введите имя цифрового вектора, содержа- первой щего первый набор данных переменной Введите имя Введите имя цифрового вектора, содержа- следующей щего следующий набор данных. Эта подсказка переменной будет повторно появляться на экране до тех пор, пока вы не нажмете клавишу ENTER, для обозначения окончания ввода данных. Все вектора должны быть одинаковой длины. ПРИМЕР ------ В данном примере будут использоваться данные по определению пробега автомобиля в милях, вес, мощность в лошадиных силах и объем цилиндров двигателя 155 автомобилей. Когда появится подсказка для первой переменной, введите mpg По мере появления следующих подсказок, введите weight (вес) horsepower (мощность) displace (объем цилиндров двигателя) Нажмите ENTER для останова подсказок. На экран выводится следующая таблица ковариаций Ковариационная матрица mpg weight horsepower displace mpg 54.274 -3683.3 -142.04 -408.55 weight -3683.336 366592.5 11999.10 40608.80 horsepower -142.044 11999.1 597.56 1474.03 displace -409.551 40608.8 1474.03 5373.55 Результаты показывают отрицательное отношение между weight и mpg, horsepower и mpg, displace и mpg. Поскольку ковариационные значения зависят от элементов, используемых для измерения переменных, мы не можем ничего вывести из относительных размеров данных значений. Для того, чтобы сохранить ковариационную матрицу для дальнгейшего ис- пользования, необходимо использовать процедуру генерации ковариационной матрицы, описанную в разделе 25-5. Для возврата к меню регрессионного анализа нажмите F10. 19-4. ПРОСТАЯ РЕГРЕССИЯ Быстрый доступ: К3 ОПИСАНИЕ -------- С помощью процедуры простой регрессии составляется модель отношения одной зависимой переменной с одной независимой переменной путем минимизации суммы квадратов остаточных величин для подбираемой линии. Может быть создана любая из четырех моделей: - линейная - множественная - экспоненциальная - обратная Во множественной и экспоненциальной моделях первой преобразуется зависимая переменная путем взятия ее натуральных логарифмов. Затем оцениваются параметры модели. В обратной модели используется обратная величина зависимой переменной. Для всех моделей можно построить график линии, вычерченной по точкам, и график остаточных величин. Система может сгенерировать и построить график прогнозируемых величин, давая значения либо для x, либо для y. В переменных оперативной памяти могут также храниться остаточные величины, прогнозируемые величины, среднеквадратические (стандартные квадратические) ошибки для средних значений и средние (стандартные) квадратические отклонения для прогнозируемых величин. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя зависомой Введите имя цифрового вектора,который переменной содержит зависимую переменную Введите имя независи- Введите имя цифрового вектора,который мой переменной содержит независимую переменную. Дан- ный вектор должен быть той же самой длины, что и зависимая переменная После ответов на эти подсказывающие сообщения система выведет на экран список имеющихся моделей и выдаст подсказывающее 0сообщение для модели, которую вы хотите подобрать. После того, как вы выберите модель, система выведет на экран таблицу статистики и сделает запрос относительно вашего желания построить график подходящей линии. Если вы ответите Y (Yes), то график будет выведен на экран. Когда построение графика заканчивается, то в нижнем правом углу экрана появляются левые круглые скобки (вместо графичес- кого курсора, который обычно появляется в нижнем левом углу). Данное пространство выделяется для того, чтобы можно было использовать выбранную модель для генерации и построения графика прогнозируемых величин путем указания значения X или Y. Когда работа с графиком закончится, нажмите F10 а затем ENTER С помощью STATGRAPHICS можно вычерчивать графики остаточных величин и запоминать различную статистику из модели. Предлагается список различных версий. Каждый раз при выборе какой-либо версии из списка, STATGRAPHICS выполняет соответствующую операцию и затем возвращается к списку. По окончании работы нужно выбрать версию 6 (DONE) (выполнено) Затем STATGRAPHICS возвращается к списку имеющихся моделей, чтобы вы могли выбрать (построить) другую модель, если это потребуется. После окончания работы с данной процедурой, нажмите F10 для возврата к меню регрессионного анализа. ПРИМЕР ------ В данном примере используются данные о пробеге автомобиля в милях в вес для 155 автомобилей. Когда появится подсказка для зависимой переменной, введите mpg Когда появится подсказка для независимой переменной, введите weight (вес) Когда появится подсказка для типа модели, введите 0 для выбора простой линейной модели. На экране появятся таблицы. ------------------------------------------------------------ Простая регрессия mpg (в зависимости от веса) Параметр Оценка вы- Среднеквадрати- Значение Уровень ве- числения ческая ошибка Т роятности ------------------------------------------------------------ Отрезок 55.8871 1.51963 36.7834 0 Склон -0.0101429 5.5482Е-4 -18.2813 0 ------------------------------------------------------------ Дисперсионный анализ ------------------------------------------------------------ Источник Сумма квад- Df Среднеквадрати- F-показатель ратов ческое значение Модель 5723.6010 1 5723.6010 334.2053 Ошибка 2603.1525 152 17.1260 ------------------------------------------------------------ Общая сумма 8326.7535 153 (откоррект.) Коэффициент корреляции = -0.829081 Среднеквадратическая ошибка вычисления = 4.13836 Хотите ли вы построить выбранную кривую (Y/N) (Да/Нет) ------------------------------------------------------------ В таблице простой регрессии отображается вычисленный отрезок и угол склона, среднеквадратическая (квадратическая) ошибка для каждого вычисления и +-статистика, используемая для проверки равенства истинного коэффициента нулю. В таблице дисперсионного анализа общая скорректированная сумма квадратов разбивается на вклады из модели и остаточных величин. Показан коэффициент корреляции между зависимой и независимой переменной, который может быть возведен в квадрат для получения R-квадратуры. На экран выводится также ошибка квадрата оценки среднего и его квадратный корень (среднеквадратическая ошибка при вычислении). Последнее значение представляет собой среднее квадратическое отклонение ошибки. С помощью этого отклонения измеряется (оценивается) объем изменчивости в зависимой переменной, не объясняемой моделью оценивания (расчетной моделью). В ответ на подсказывающее сообщение, которое появляется в нижней части экрана, введите Y (Yes) для построения графика подходящей линии. На экран будет выведен график. На данном графике показан разброс исходных значений данных с расчетной линией регрессии. Используем данную модель для прогнозирования и построения графика некоторых X - Y. Во-первых, предположим, что пробег автомобиля в милях (Y) основывается на весе (X) в 2500 фунтов (933кг). Наберите с клавиатуры 2500 и нажмите ENTER То, что вы набираете, появится в нижнем правом углу экрана после левой скобки. Когда вы нажмете ENTER, соответствующее расстояние в милях будет прогнозироваться и выводиться на экран за вводом данных. На графике будут вычерчиваться линии от осей X и Y до прогнозируемой точки на расчетной линии регрессии. Нажмите ENTER для сброса цифр в нижнем правом углу экрана. Теперь будем прогнозировать вес (X) на основе показателя пробега автомобиля в милях (Y), равного 35 Для того, чтобы сообщить системе STATGRAPHICS специфицированное значение Y, перед этим значением нужно набрать на клавиатуре запятую. Наберите с клавиатуры 35 и нажмите ENTER Соответствующее значение веса будет прогнозироваться и выводиться на экран, линии будут вычерчиваться по двум осям до прогнозируемой точки на расчетной линии регрессии. При использовании средства прогнозирования гарантируйте ввод значений данных в тех же самых единицах, что и исходные переменные, независимо от масштаба, применяемого для отображения значений на графике. В системе STATGRAPHICS часто испльзуются такие масштабы данных графического изображения, чтобы сделать его более четким и легким для восприятия. В данном примере веса масштабируются по 100, но тем не менее веса указываются в исходных единицах (например, 2500 фунтов). Нажмите ENTER для сброса цифр с экрана. Затем нажмите F10 для сброса средства прогнозирования и ENTER для выхода из графика. В системе STATGRAPHICS предусмотрена возможность составления графика остаточных величин и хранения остаточных величин, прогнозируемых величин, среднеквадратических (квадритических) ошибок для квадрата оценки среднего и среднеквадратических отклонений для новых прогнозируемых значений. Все значения за исключением прогнозируемых величин хранятся в любых преобразуемых единицах, которые использова- лись для подборки модели. Прогнозируемые величины хранятся в исходных единицах. Для нашего примера не будем вычерчивать график остаточных величин или сохранять результаты. Напечатайте 6 (DONE). Когда предлагается несколько вариантов модели, нажмите F10 для возврата к меню регрессионного анализа. 19.5. ИНТЕРАКТИВНОЕ ОТКЛОНЕНИЕ РЕЗКООТКЛОНЯЮЩИХСЯ (ВЫБРОСОВ) ЗНАЧЕНИЙ Быстрый доступ: К4 ОПИСАНИЕ -------- Процедура интерактивного отклонения резко отклоняющихся значений реализует простую линейную регрессию аналогично первой опции (версии) в Процедуре простой регрессии (см. раздел 19.4). С помощью интерактивного отклонения выбросов можно построить график ограничений прогнозируемых величин и выборочно удалить точки из регрессии. После удаления выбранных выбросов новая уточненная линия строится вдоль исходной линии. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя зависимой Введите имя цифрового вектора,который переменной содержит зависимую переменную Введите имя независи- Введите имя цифрового вектора,который мой переменной содержит независимую переменную. Дан- ный вектор должен быть той же самой длины, что и зависимая переменная Введите необходимый Введите доверительный уровень,который доверительный уровень вы хотите использовать для вычисления для прогнозируемых ограничений прогонзируемых величин величин и нажмите ENTER для использования стандартного значения (95%) ПРИМЕР ------ В данном примере будут использоваться данный по стоимости и весу для 155 автомобилей. Когда появляется подсказка для зависимой переменной, введите price (стоимость, цена) Когда появляется подсказка для независимой переменной, введите weight (вес) Когда появляется подсказка для доверительного уровня, нажмите ENTER для использования стандартного значения (95%). На экране появится график. Дополнительно к линии регрессии, которая вычерчивается как сплошная линия, на графике изображены также две пары пунктирных линий, обозначающие 95% доверительные интервалы для среднего значения ответа при данном значении Х (более плотные границы) и для новых наблюдений. Отрезок (ВО) и склон (В1) даются в верхней части экрана, также как и среднеквадратические (квадратические) ошибки (SE), t - статистика, коэффициент корреляции, среднеквадратическая ошибка (MSE) и степени свободы (DF). Курсор, обозначенный знаком плюс (+), находится в середине экрана. Для перемещения курсора около крайних точек (значение), которые вы хотите удалить из модели, можно использовать ключ управления курсором. Указаны следующие операции: Ctrl R Удаляет точку, ближайшую к курсору.На цветном мони- (управление) торе цвет точки может изменяться Ctrl I Вводит точку, которая была ранее удалена.На цветном (управление) мониторе первоначальный цвет точки сохраняется Ctrl F Повторно строит модель.На цветном мониторе цвет за- ново построенной линии отличается от цвета исходной линии. Если выполняется несколько перепостроений, исходная линия будет сохраняться, но на экран будет выводиться только самый последний вариант линии Давайте вернемся к нашему примеру и удалим 2 точки в верхней части экрана. Переместите курсор по очереди к каждой из двух точек и нажмите Ctrl R затем нажмите Ctrl F для построения модели. На экран будет выведен график. Теперь на графике изображена исходная линия регрессии и модифицированная линия. Новая регрессионная статистика для модифицированной линии также изображена на графике и указаны удаленные точки. Для возврата к меню регрессионного анализа дважды нажмите F10. 19.6. ПЕРЕМЕННАЯ ТИПА -- УКАЗАТЕЛЬ Быстрый доступ: K5 ОПИСАНИЕ -------- Процедура переменных типа-указатель преобразует качественные факторы в переменных типа-указатель (которые также называются фиктивными переменными) таким образом, чтобы их можно было эффективно использовать в множественном регрессионном анализе. С помощью данной процедуры создается матрица, имеющая n строк и k-1 столбцов, где n - длина преобразуемой переменной, а k - число уникальных кодов фактора в переменной. Переменную типа-указатель можно сгенерировать при помощи процедуры множественной регрессии (см. раздел 19.8), если набрать на клавиатуре IND имя переменной в поле для указания независимых переменных. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя переменной, Введите имя цифрового вектора, со- содержащей факторные держащей факторные коды уровни Введите имя переменной, Введите имя переменной, которая ис- в которой должны хра- пользуется для хранения переменной ниться переменные типа типа указатель.Если вы нажмете ENTER указатель без имени переменной, то результаты не сохраняться ПРИМЕР ------ В данном примере будут использоваться данные по странам-изготовителям 155 автомобилей. Страны-изготовители закодированы следующим образом: США=1, Европейские=2 и Япония=3. Данные факторные коды храняться в переменной origin (страна-изготовитель). Когда появляется подсказка для факторных уровней, введите origin Когда появляется подсказка для переменной, в которой должны храниться результаты, нажмите indorigins Система будет хранить результаты в переменной оперативной памяти в рабочей области и выведет на экран сообщение, содержащее число сохраняемых значений. В нашем примере результатом является матрица в 155 строк (соответственно 155 автомобилям) и 2 столбца. Поскольку исходная переменная содержит три факторных кода, результирующая переменная типауказатель содержит два (3-1) столбца. Значения переменной типа-указатель показаны ниже: 0 0 для США 1 0 для Европы 0 1 для Японии Для возврата к меню регрессионного анализа нажмите ENTER 19.7. ЧАСТНАЯ КОРРЕЛЯЦИЯ Быстрый доступ: K6 ОПИСАНИЕ -------- Процедура частной корреляции выполняет вычисление (оценку) коэффициентов частной корреляции для набора цифровых векторов. С помощью коэффициента частной корреляции измеряется отношение (связь) между двумя переменными при управлении возможными воздействиями других переменных. Управление этими воздействиями осуществляется путем удаления линейного отношения с другими переменными до вычисления коэффициентов корреляции между двумя интересующими переменными. Частичную корреляцию целесообразно использовать для обнаружения скрытых (невидимых) отношений, обозначения вмешивающихся (чужеродных) переменных и обнаружения фиктивных отношений. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя первой Введите имя цифрового вектора, содержа- переменной щего первый набор данных Введите имя сле- Введите имя цифрового вектора, содержа- дующей переменной щего следующий набор данных. Данная под- сказка будет появляться до тех пор, пока вы не нажмете ENTER для обозначения окончания ввода данных. Все векторы дожны быть одинаковой длины ПРИМЕР ------- В данном примере будут использоваться данные по прогону автомобиля в милях, вес, мощность и объем цилиндров для 155 автомобилей. Когда появится подсказка для первой переменной, введите mpg по мере появления последующих подсказок, введите вес мощность объем цилиндров нажмите ENTER для останова подсказок. На экран будут выведены следующие результаты: Частная корреляция mpg вес мощность объем цилиндров mpg -1.00000 -.45412 -.39289 .13610 вес -.45412 -1.00000 .03443 .71952 мощность -.38289 .03443 -1.00000 .36523 .13610 .71952 .36523 -1.00000 объем Результаты показывают отрицательную корреляцию между mpg и весом и между mpg и мощностью. Сравните эти рез ультаты с коэффициентами корреляции тех же самых данных, которые были получены в разделе 19.2. Матрица корреляции mpg вес мощность объем цилиндров mpg 1.00000 -.82576 -.78875 -.75652 вес -.82576 1.00000 .81071 .91495 мощность -.78875 .81071 1.00000 .82260 объем цилиндров -.75652 .91495 .82260 1.00000 Отношения оказались слабее по сравнению с воздействиями других переменных, которые были удалены. Например, вес и мощность эффективно скоррелированные на высоком уровне. Поэтому корреляция веса с mpg, если не осуществляется контроь за мощностью, в действительности представляет собой комбинацию воздействий двух переменных на mpg. При частной корреляции каждая из частных корреляций зависит (обуславливается) от всех других переменных. Для возврата к меню регрессионного анализа нажмите ENTER 19.8. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ ВВОД ДАННЫХ Быстрый доступ: К7 ----------- Подсказка Ответ ОПИСАНИЕ ------------------------------------------------------------ -------- Введите имя зависи- Введите имя цифрового вектора, содер- Множественная регрессия дает возможность проверять мой переменной жащего зависимую переменную или любое отношение между одной зависимой переменной и одной или преобразование этой переменной несколькими независимыми переменными. Аналогично простой регрессии в множественной регрессии используется оценка по После ответа на данную подсказку табло описания модели будет методу наименьших квадратов для регрессионной модели. выведено на экран. Ниже дается описание полей модели: Вычисляются разнообразные статистики совместно с дисперсионным анализом. Строится несколько графиков. Поле Описание ------------------------------------------------------------ DEP. VARIABLE Содержит зависимую переменную,введенную в от- вет на первоначальную подсказку. Эту перемен- ную можно заменить или специфицировать ее преобразование путем печати в этом поле новых данных IND. VARIABLES Введите имена независимых переменных. Можно также ввести любые действительные выражения, которые создают вектор той же самой длины, что и зависимая переменная. Независимые пере- менные могут быть введены в матрице. В этом случае каждый столбец соответствует одной пе- ременной и матрица должна иметь число строк, равное длине зависимой переменной. Независимые переменные можно вводить в любой части поля с разделителем между каждым именем или выражением. Двоеточие (:) является разделителем, применя- емым для разделения независимых переменных, введенных в одну и ту же строку. Например: RAISE 2 интерпретируется как две переменные. Константа Если в модель нужно ввести терм (ин) констан- та введите YES. Веса Введите имя переменной или выражение,содержа- щее весовые коэффициенты, которые система должна использовать для остаточных величин при оценке коэффициентов модели. Весовая переменная должна быть вектором той же самой длины, что и зависимая переменная. Флажки Если система должна вычислить следующие зна- чения со статистикой остаточных величин,вве- дите YES: - leverage (использование кредита для биржевой игры) - расстояние Mahalanobis - внешне: остаточные величины по Стъюденту - статистика DFITS Данная статистика должна выводится на экран со сводной статистикой остаточных величин, получаемой при использовании функционального кюча процедуры F5. При вычислении эти значения хранятся в пере- менных оперативной памяти LEVERAGES, MAHALD, SRESIDUALS и DFITS. Значения leverage в два раза превосходящие p, деленные на n, и DFITS статистика в два раза превосходящая значение квадратного корня из p, деленного на n, снабжаются флажками на экране диагнос- тики остаточных величин, где p равно числу независимых переменных в модели и n равно числу полных случаев. Более подробная информация по этим статисти- кам приводится у Belsley,Kuh и Welsch(1980). Когда поле фложка устанавливается в YES,сис- тема вычисляет инверсию Х тринспозиции Х (где Х является матрицей независимых перемен- ных и матрицу ковариации для расчетных (оце- ниваемых) коэффициентов.Эти результаты хра- нятся в переменных оперативной памяти XTXINV и COVM, но не выводятся на экран. Заметим,что вычисление этих статистик требу- ет большого объема памяти и может вызвать ошибку WS FULL в случае крупных наборов данных. Пользователь может переключиться на любое поле на табло, вводя данные, соответствующие (подходящие) для данной модели. Если вводится недействительная переменная или преобразование, то в нижнем правом углу экрана появляется сообщение об ошибке. Каждый раз при изменении табло необходимо нажать клавишу ENTER, чтобы подобрать модель. В строке состояния табло описания модели определяются функциональные ключи процедуры для данной процедуры. F1 и F10 сохраняют свое обычное определение (HELP и QUIT). Действия других ключей описаны ниже Ключ Описание ------------------------------------------------------------ F2 Обеспечивает дисперсионный анализ статистики для (ANOVA) полной регрессии F3 Вычерчивает график прогнозируемых величин по срав- (PLTPRD) нению с измеренной величиной для зависимой перемен- ной.В график включается линия со склоном равным 1. Данный график используется для обнаружения случаев, в которых дисперсия не является постоянной или не- обходимо преобразование зависимой переменной F4 Создает дополнительную статистику ANOVA. Включает (COND) вклад в общую сумму регрессии квадратов, которая относилась к каждой переменной при вводе регрессии. В вычислениях используется тот же порядок перемен- ных, как и при их вводе на табло описания модели F5 Позволяет строить графики остаточных величин по (RESIDS) сравнению с прогнозируемыми величинами или по срав- нению с любыми независимыми переменными. Пользова- телю дается подсказка при выборе варианта. После вывода графика на экран нажмите ENTER для о тобра- жения сводной статистики остаточных величин. На эк- ран будет выводиться также статистика, описанная в поле FLAGS, если это поле установлено в YES F6 Создает график типа - компонент-плюс остаточные ве- (CMPEFF) личины вокруг линии, определенной выражением (тер- мом) _ By(Xiy - Xy), которое умножает центральные значения независимой переменной Х на связанное (присоединенное) значение ее коэффициента регрессии B. Данный график исполь- зуется для определения относительной величины оста- точных значений относительно поясняющая мощность переменной. График типа - компонетн-плюс остаточные величины может быть построен для любой независимой переменно Относительно выбора вариантов выдается подсказыва- ющее сообщение. После вывода графика на экран наж- мите ENTER для возврата к табло описания модели ПРИМЕР ------ В данном примере будут использоваться данные о пробеге автомобиля в милях, весе, мощности и стране-изготовителе 155 автомобилей. Когда появится подсказка для зависимой переменной, введите mpg Когда появится табло описания модели, введите следующие выражения в поле IND. VARIABLES: weight weight RAISE 2 horsepower weight TIMES horsepower IND origin Выражение weight RAISE 2 специфицирует квадратичный терм в уравнении модели. Выражение weight TIMES horsepower специфицирует терм взаимодействия. Выражение IND origin побуждает STATGRAPHICS генерировать матрицу переменных типа-указатель (фиктивных переменных) на основе классификационной переменной origin. (Более подробная информация по переменным типа-указатель приводится в разделе 19.6). Нажмите ENTER чтобы начать процесс подборки (построения) модели. На экране появятся следующие сообщения: FORMING DATA MATRIX (формирование матрицы даных) EXCLUDING MISSING VALUES (исключение пропущенных значений) ESTIMATING COEFFICIENTS AND SUMS OF SQUARES (оценка коэффициентов и сумм квадратов) CALCULATING T STATISTICS AND P-VALUES (вычисление Т- статистики Р-значений) CALCULATING F STATISTICS AND P-VALUES (вычисление F- статистики P-значений) Когда вычисления заканчиваются, результат выводится на экран. Результаты подборки (построения) модели включают в себя оценки коэффициентов модели для каждой независимой переменной, среднеквадратическую ошибку коэффициентов, t-значение (которое вычисляется путем деления коэффициента на его среднеквадратичускую ошибку) и вероятность того, что может быть получено более крупное t-значение, если не будет граничного вклада от этой переменной. Для оценки коэффициентов используется декомпозиция Gram-Schmidt. Заметим, что ни weight, ни weight RAISE 2 не демонстрируют значительного t-значения благодаря тому, что они являются высоко коррелируемыми. Как будет видно ниже, это не означает, что оба сообщения должны быть опущены, поскольку weight является важным показателем, а t-статистика измеряет граничный вклад каждой переменной,как если бы она была последним компонентом, вводимым в модель. ------------------------------------------------------------ Результаты построения модели ------------------------------------------------------------ Переменная Коэффици- Квадратичес- Вероят- ент кая ошибка ность (стандартная) ------------------------------------------------------------ CONSTANT 66.788207 6.652836 10.0291 .0000 weight -0.006111 0.00725 -.8429 .4006 weight RAISE 2-1.540864E-6 1.969822E-6 .8241 .4112 horsepower 0.398926 0.140234 -2.9447 .0051 weight TIMES 0.000098 0.000046 -2.1551 .0328 horsepower IND origin 2.217324 0.922025 2.4048 .0174 IND origin 1.477081 0.826146 1.7879 .0756 ----------------------------------------------------------- 5 случаев с пропущенными значениями были исключены. Остаточные величины, размещенные в переменной: RESIDUALS Значимость horsepower и продукта weight и horsepower на уровне 0.05. Поскольку IND origin является матричной переменной, отдельная t-статистика для последних двух коэффициентов является незначащей. Пять случаев с пропущенными значениями в одной или нескольких переменных были исключены из вычисления. Остаточные величины модели были помещены в переменной оперативной памяти RESIDUALS. Нажмите F10 для возврата к табло описания модели. Нажмите F2 и следующая статистика по дисперсионному анализу будет отображена на экране ------------------------------------------------------------ Дисперсионный анализ для полной регрессии ------------------------------------------------------------ Сумма DF Квадрат F-коэффи- Вероят- квадра- оценки циент ность тов среднего ------------------------------------------------------------ 6 .0000 143 18.7229 ------------------------------------------------------------ Итог 149 150 выполненных случаев дают высоко значимую регрессию с общим F-коэффициентом равным 74.4. Коэффициент детерминации () равен 75.7% с установленной (скорректированной) R-квадратурой 74.7%. Последняя статистика определяется для числа независимых переменных в данной регрессии. В отличие от R-квадратуры скорректированная R-квадратура может уменьшаться, если вводятся такие переменные, которые не влияют значительно на подборку. Квадратическая (стандартная) ошибка оценки равна квадратному корню ошибки квадрата оценки среднего и измеряет необъяснимую изменчивость в зависимой переменной. Нажмите ENTER для возврата к табло описания модели. Затем нажмите F3 для построения графика прогнозируемых величин по сравнению с наблюдаемыми значениями для независимой переменой. График будет выводиться на экран. В данном случае точки распре- делены около диагональной линии достаточно равномерно, что говорит о приемлемости данной модели Нажмите ENTER для возврата к табло описания модели. Затем нажмите F4 для отображения следующей дополнительной статистики ANOVA: ------------------------------------------------------------ Дальнейшая статистика ANOVA для переменных в порядке подборк ------------------------------------------------------------ SOURCE Сумма DF Квадрат F-коэф- Вероят- квадратов оценки фициент ность ------------------------------------------------------------ weight 5514.2345 1 5514.235 401.8275 .0000 weight RAISE 2 99.2754 1 99.275 7.2843 .0080 horsepower 356.8888 1 356.889 26.0068 .0000 weight TIMES 59.8726 1 59.873 4.3630 .0385 horsepower IND origin 94.1300 2 47.065 3.4297 .0351 ----------------------------------------------------------- MODEL 6124.4013 6 Заметим, что как weight, так и weight RAISE 2 осуществляют значительный вклад в подборку в то время, когда вводится регрессия. Заметим также, что две степени свободы для переменной типа-указатель IND origin были сгруппированы (агрегированы), что позволяет выпол- нить проверку их общего вклада. Нажмите ENTER для возврата к табло описания модели. Затем нажмите F5 для построения графика остаточных величин. Если появляется подсказывающее сообщение для фактора, график которого должен быть построен, введите 1 для построения графика остаточных величин по отношению к weight. График появится на экране. Горизонтальная линия представляет точку нуля. Графики такого типа используются для визуального обозначения резко отклоняющихся значений нелинейности или прочих структур в остаточных величинах. В этом случае остаточные величины произвольно разбрасываются вокруг линии. Нажмите ENTER и система отобразит сводную статистику остаточных величин: число остаточных величин = 150 выборочное среднее = -1.86262Е-14 выборочная дисперсия = 13.1703 выборочное стандартное отклонение = 3.62909 коэффициент ассимметрий = 0.443924 стандартное значение = 2.21962 коэффициент эксцесса = 3.76727 стандартное значение = 1.91818 статистика DURBIN-WATSON = 1.59839 Нажмите ENTER для возврата к табло описания модели. Затем нажмите F6 для построения графика типа компонент-плюс остаточные величины. Когда будет получена подсказка для фактора, который должен быть построен, введите 3 для построения графика эффектов компонента и остаточных величин для horsepower. Заметим, что остаточные величины относительно малы по сравнению с измерением в пробеге автомобиля в милях, прогнозируемым для автомобилей, мощность которых невелика. Это указывает на то, что мощность дает необходимую информацию в прогнозировании (пробега, расхода бензина на пробег). Нажмите ENTER для возврата к табло описания модели. Затем нажмите F10 для возврата к меню регрессионного анализа. 19.9. ПОШАГОВАЯ ВЫБОРКА РЕРЕМЕННОЙ Быстрый доступ: K8 ОПИСАНИЕ -------- Пошаговая выборка переменной выполняется также, как и множественная регрессия (см. раздел 19-8), за исключением того, что можно использовать выборку вперед или выборку назад для управления вводом переменных в модель. На каждом этапе процедуры переменные вводятся или удаляются с целью получения модели с небольшим набором значащих переменных. Данная процедура может использоваться при создании модели, когда имеется большое число возможно независимых переменных и нет уверенности относительно того какую из них использовать. Процедура выборки вперед начинается при отсутствии переменных в модели и добавляет по одной переменной в единицу времени до тех пор, пока переменная является значащей для данной модели. Кроме того на каждом этапе осуществляется проверка значимости ранее выбранных переменных; переменные, которые становятся незначащими, удаляются. Процедура выборки назад начинается с модели, содержащей все переменные и их оценки по одной в единицу времени. При такой выборке система может повторно вводить в модель переменные, которые были удалены ранее, но в даль- нейшем могут оказаться значащими для данной модели. ВВОД ДАННЫХ ----------- Ввод данных для пошаговой выборки переменной аналогичен вводу данных для множественной регрессии. Система выдает подсказывающее сообщение для имени зависимой переменной,а затем выводит на экран табло описания модели. Поля на табло описания модели рассматриваются в разделе 19.8. Табло для пошаговой выборки переменных имеет одно дополнительное поле STEPWISE Если вы хотите использовать пошаговую выборку переменных, введите YES в данное поле. В противном случае введите NO. После того, как вы завершите работу с табло описания модели, нажмите ENTER и будет выведено табло пошаговой выборки переменной. Ниже приводится описание полей данной модели. SELECTION Укажите какую процедуру выборки вы хотите использовать: FORWARD (вперед) или BACKWARD (назад).При выборке вперед в модель будут включены только переменные с коэффициентом F (показателем функции) сверх того, который указан в поле F-TO-ENTER. При выборке назад число переменных в модели сокращается по од- ной в соответствии с критерием F-TO-REMOVE. CONTROL Если вы хотите, чтобы была отображена только окончательная выборка модели введите AUTOMATIC. Если вы хотите, чтобы был отобра- жен каждый этап,введите MANUAL. Если использу- ется управление MANUAL, необходимо нажать ENTER после каждого этапа,чтобы система про- должала выборку. F-TO-ENTER Введите значение для коэффициента F,выше ко- торого переменные будут вводиться в модель. ------------------------------------------------------------ Пошаговая регрессия Выборка FORWARD F-TO-ENTER-4 Обновите необходимые версии и нажмите ENTER 1HELP 2LABEL INPUT ------------------------------------------------------------ F-TO-REMOVE Введите значение коэффициента F, ниже которого переменные будут выводиться из модели.Это зна- чение должно быть меньше или равно значению, которое вы введете в поле F-TO-ENTER MAX STEPS Введите максимальное число этапов, которые до- лжна выполнить система до прекращения процесса выборки Первоначально табло выборки переменных отображается со стандартными значениями в описанных выше полях. Вы можете перейти в любые поля производя необходимые для ваших данных изменения. После того, как все изменения будут выполнены, нажмите ENTER для подборки модели. Система выбирает окончательную модель на основе указанных критериев и отображает различные статистики для данной модели. Система отображает новое поле в нижней части экрана: SPECIFY FINISH, ENTERR K, OR REMOVE K: (специфицируйте конец, введите К или удалите К:) В это время (в этом месте) можно ввести или удалить переменные из модели специфицировав ENTER n или REMOVE n, где n - число необходимых переменных. Напечатайте FINISH в этом поле, обозначая тем самым, что вы закончили производить изменения переменных модели. Затем на экран будут выведены результаты подборки модели. Остаточные величины из последней модели хранятся в переменной RESIDUALS оперативной памяти. Для возврата к табло описания модели нажмите ENTER. В этот момент можно использовать функциональные ключи процедуры для отображения дополнительной статистики и графического представления результатов. Использование функциональных ключей процедуры описано в разделе 19.8. По окончанию работы с моделью нажмите F10 для возврата к меню регрессионного анализа. ПРИМЕР ------ В данном примере снова будут использоваться данные для 155 автомобилей. Когда появляется подсказка для зависимой переменной, введите mpg Когда появляется табло описания модели в поле IND. VARIABLES введите следующие переменные: cylinders (цилиндры) displace (грузоподъемность, перемещение) horsepower (мощность) accel (скорость) year (год) weight (вес) Нажмите ENTER и появится табло выборки переменных. Нажмите на табулятор и перейдите к полю CONTROL и замените AUTOMATIC на MANUAL, чтобы вы могли наблюдать изменения в модели при выполнении каждого этапа. Для других полей будут использоваться стандартные значения. Нажмите ENTER и будет вычисляться этап 0 процесса выборки, и выводиться на экран. ------------------------------------------------------------ Пошаговая регрессия Выборка FORWARD CONTROL: MANUAL F-TO-ENTER= 4.0 MAX STEPS = 50 F-TO-REMOVE = 4.0 STEPS F-SQUARED = 0 F-SQUARED CADJ. = 0 VSE = 54.2737 UITH 149 D.F. Переменные, находящиеся Переменные, ненаходящиеся в настоящее время в модели в настоящее время в модели Переменная 1.cylinders -.6841 139.1566 2.displaco -.7565 198.0564 3.horsepower -.7887 243.6591 4.acctl .2347 8.6298 5.year .4221 32.0793 6.weight -.8258 317.2377 ----------------------------------------------------------- На этапе 0 отображаются все первоначально введенные независимые переменные. Система вычисляет коэффициенты частичной корреляции и показатель F, который должна иметь каждая переменная, если она должна быть введена в модель на следующем этапе. Нажимайте ENTER после каждого этапа для продолжения процесса подборки модели. По мере завершения очередного этапа система будет отображать результаты. Заметим, что система вводит каждую переменную в модель в порядке значений F-ENTER в крайней правой части экрана. Переменная с независимым коэффициентом (показателем) F должна вводиться в модель следующей. По мере выполнения этапов, наблюдаются изменения в коэффициентах, MSE (среднекадратической ошибке), R-квадратуре (коэффициенте детерминации) и скорректированной R-квадратуре. Значения F-REMOVE, частной корреляции и F-ENTER каждый раз повторно вычисляются. После то го, как STATGRAPHICS завершит все этапы, немедленно появится следующее сообщение: FINAL MODEL SELECTED (выбрана окончательная модель) В данном примере первой вводится в модель переменная weight, поскольку она наиболее сильно коррелируется с mpg. Другие переменные вводятся в следующем порядке: horsepower, year и cylinders. Затем выборка останавливается, т.к. значения F-ENTER для displace и accel меньше 4.0. ------------------------------------------------------------ Описание пошаговой выборки переменных Выборка: Вперед Управление: MANUAL F-TO-ENTER =4.0 MAX STEPS = 50 F-TO-REMOVE = 4.0 STEP 4 Переменные, находящиеся Переменные, ненаходящиеся в настоящее время модели в настоящее время в модели Переменная COEFF. F-REMOVE Переменная COEFF. F-ENTER 1.cylinders .94698 4.9868 2.displace .0261 .0982 2.horsepower -.11085 24.0121 4.accel .1368 2.7444 3.year .80526 12.8216 4.weight -.00758 54.5651 ------------------------------------------------------------ Заметим, что окончательная модель имеет значение R-квадратуры, равное 0.75, тем самым поясняется, что 75% отклонений в расстоянии (пробеге) автомобиля в милях поясняются четырьмя переменными, включенными в модель. MSE равна 13.9. Теперь вы можете управлять регрес сионным анализом, вводя или удаляя переменные из выбранной модели. Для удаления cylinders введите remove 1 в поле в верхней части экрана. Нажмите ENTER и будет вычисляться новая модель> Заметим, что R-квадратура вычисляется повторно, также как и показатели (функции) F для всех переменных. Затем добавьте к модели displace путем ввода enter 2 в поле, находящееся в верхней части экрана. Нажмите ENTER и модель снова будет вычисляться. Прогнозируемая величина данной модели для displace (R-квадратура 75%) немного превосходит прогнозируемую величину для displace (R-квадратура 74.8%). Для окончания процесса построения модели наберите с клавиатуры finish в поле в верхней части экрана. Нажмите ENTER и система отобразит результаты подборки модели. Для возврата к табло описания модели снова нижмите ENTER и F10 для возврата к меню регрессионного анализа. 19.10. ГРЕБЕНЧАТАЯ РЕГРЕССИЯ Быстрый доступ:К9 ОПИСАНИЕ -------- Процедура гребенчатой регрессии дает возможность модифицировать процедуру оценки по методу наименьших квадратов, чтобы помочь избежать проблем, вызываемых высоко (сильно) коллиниарными независимыми переменными. Результирующие оценки параметра будут незначительно смещены, но более точные, чем при использовании обычных процедур оценки по методу наименьших квадратов. В случае коррелируемых независимых переменных оценки коэффициентов могут быть ближе к истинным значениям параметров, чем несмещенные оценки по методу наименьших квадратов. Данная процедура вводит новый параметр (theta)- называемый гребенчатым параметром, который управляет расширением вводимым смещением. Если Q рвно нулю,то результирующие оценки те же самые, что и в случае оценки по методу наименьших квадратов. Если величина Q возрастает, оставаясь меньше единицы, смещение возрастает, но коэффициенты могут стать более точными. Как правило, пользователь стремится под'искать небольшое значение Q, выше которого оценки изменяются медленно Процедура гребенчатого следа (см. раздел 19.11) вычерчивает гребенчатую кривую. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя зависимой Введите имя цифрового вектора, содер- переменной жащего зависимую переменную Введите имя первой не-Введите имя цифрового вектора, содер- зависимой переменной жащего первую независимую переменную, которую вы хотите включить. Вектор должен быть той же самой длины, что и зависимая переменная Введите имя следующей Введите имя цифрового вектора, содер- независимой перемен- жащего следующую независимую перемен- ной ную. Данная подсказка будет появляться до тех пор, пока вы не нажмете ENTER для обозначения окончания ввода данных. Все векторы должны быть одинаковой длины Введите значение для Введите значение равное или больше нул я. Q(QUIT): Нулевое значение Q представляет оценку по методу наименьших квадратов (несме- щенную). Данная подсказка снова поя- вится после отображения результатов на экране с тем, чтобы можно было вычис- лить результаты с различным значением ПРИМЕР ------ В данном примере будут использоваться данные по 155 автомомбилям. Когда появится подсказка для зависимой переменной, введите mpg Затем в ответ на подсказки для независимых переменных введите следующие переменные: weight horsepower cylinders затем нажмите ENTER для останова подсказок для независимых переменных. Когда появится подсказка для Q, введите 0 для несмещенной регрессии. На экран будут выведены следующие коэффициенты регрессии для трех независимых переменных: -0.622637 -0.389676 0.135888 Процедура гребенчатой регрессии автоматически приводит все переменные в стандартную форму и центрирует их, таким образом, результирующие оценки отличаются от тех, которые могли бы быть получены при использовании множественной регрессии. Теперь возьмем другое значение для Q и сравним результаты. В ответ на следующую подсказку для Q введите .5 и на экран будут выведены следующие коэффициенты регрессии: -0.326512 -0.282548 -0.128826 Заметим, что коэффициент для cylinders сменился с положительного на отрицательный. Знак коэффициента регрессии указывает на то, является ли отношение положительным или отрицательным. Перемена в знаке означает, что в то время как значение пробега автомобиля в милях оказывается лучше (выше) с увеличением числа цилиндров (положительное отношение), а при использовании незначительно смещенной модели отношение становится отрицательным. Это совпадает с предположением, что с увеличением числа цилиндров показатели пробега автомобиля в милях становятся хуже. Cylinders хорошо (сильно) коррелируется с weight и horsepower, что приводит к неточным результатам при оценке по методу наименьших квадратов. Нажмите ENTER для возврата к меню регрессионного анализа. 19-11. ГРЕБЕНЧАТАЯ КРИВАЯ Быстрый доступ:К10 ОПИСАНИЕ -------- Процедуры вычерчивания гребенчатой кривой автоматически создают гребенчатую регрессию (см. раздел 19-10) посредством диапазона значений для гребенчатого параметра Q. Для специфицирования диапазона значений Q будет выдано подсказывающее сообщение о вводе верхнего и нижнего пределов. Будет задан вопрос о специфицировании числа приращений для Q или о том, сколько раз будет выполняться регрессия. Процедура вычерчивания гребенчатой кривой создает графики результатов вычисления регрессии. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя зависимой Введите имя цифрового вектора,содер- переменной жащего эту зависимую переменную Введите имя первой не- Введите имя цифрового вектора, содер- зависимой переменной жащего первую независимую переменную, которую вы хотите ввести. Длина век- тора должна быть равна зависимой пе- ременной Введите имя следующей Введите имя цифрового вектора, содер- независимой перемен- жащего следующую независимую перемен- ной ную.Эта подсказка будет появляться до тех пор, пока вы не нажмете ENTER для обозначения окончания ввода. Все векторы должны быть одинаковой длины Введите наименьшее Введите значение равное или больше (низшее) значение для нуля,которое должно быть использовано в качестве нижнего предела для Q. Нажмите ENTER для использования нуля в качестве нижнего предела. Если Q равно нулю,то это означает использо- вание оценки по методу наименьших квадратов (несмещенной) Введите верхнее значе- Введите значение больше нуля, которое ние для Q должно но использоваться в качестве верхнего предела для Q. Данное значе- ние должно быть больше нижнего предел а. Для использования в качестве верхнего предела 1 нажмите ENTER Введите число прираще- Введите число, которое на единицу ме- ний (20) ньше числа регрессий, выполняемых для значений Q ПРИМЕР ------ В данном примере будут использоваться данные по 155 автомомбилям. Когда появится подсказка для зависимой переменной, введите mpg Затем в ответ на подсказку для независимых переменных, введите следущие переменные: weight horsepower cylinders Затем нажмите ENTER для останова подсказок для независимых переменных. Нажмите ENTER в ответ на следующие три подсказки по использованию стандартных значений для нижнего предела (0), верхнего предела (1) и числа приращений (20). STATGRAPHICS будет вычислять и выводить на экран коэффициенты регрессии для значений Q от 0 до 1. На экран будет выведен график. По мере небольшого возрастания значений Q от нуля все коэффициенты быстро меняются. Коэффициент для cylinders быстро становится отрицательным. По мере дальнейшего увеличения Q, коэффициенты начинают стабилизироваться. Это предполагает, что исходные оценки по методу наименьших квадратов давали вероятно неточное представление об истинных отношениях между mpg и независимыми переменными. Нажмите ENTER и система выведет на экран сообщение, уведомляющее, что коэффициенты сохраняются в переменной оперативной памяти, называемой RIDGECOEFS, по одному коэффициенту на столбец и, что значения Q хранятся в переменной оперативной памяти, называемой RIDGETHETA. Нажмите ENTER для возврата к меню регрессионного анализа. 19.12. НЕЛИНЕЙНАЯ РЕГРЕССИЯ Быстрый доступ:К11 ОПИСАНИЕ -------- Процедура нелинейной регрессии обеспечивает оценку параметров по методу наименьших квадратов в моделях нелинейной регрессии. Поскольку в данном случае аналитическое решение не используется, то процедура при определении оценок, которые сокращают сумму квадратов остаточных величин, использует алгоритм поиска. Используемый алгоритм был разработан Marguardt (1963) и является компромиссным решением между использованием метода прямой линейности и метода наиболее крупного спуска. Более подробной описание оценки по методу наименьших квадратов,обусловленное регрессией, приводится у Draper и Smith (1966). Для выполнения данной процедуры необходимо определить функцию, которую система попытается применить к данным. Кроме того необходимо обеспечить исходные (начальные) оценки для параметров. Поскольку алгоритм для процедуры линейной регрессии во многом зависит от этих начальных параметров, необходимо тщательно подобрать приемлемые начальные оценки. Процедура будет выполняться быстрее, если все переменные будут находиться в оперативной памяти.См. раздел 9.4 для получения информации по управлению определяемыми переменными и присвоения каждой переменной своего значения (имени) для ее размещения в оперативной памяти. ВВОД ДАННЫХ ----------- Подсказка Ответ ------------------------------------------------------------ Введите имя зависи- Введите имя цифрового вектора, содержа- мой переменной щего зависимую переменную или преобразо- вание этой переменной После ответа на подсказывающее сообщение появляется табло описания модели. ------------------------------------------------------------ Построение общей нелинейной модели - описание модели ------------------------------------------------------------ итерации: 25 исходный параметр: 0.01 обращения: 200 исходный коэффициент к функции: 1Е-4 масштабирования: 20 1У-3 максимальное значение параметра: 120 ------------------------------------------------------------ Поля на данном табло описаны ниже. Поле Описание ------------------------------------------------------------ Зависимая переменая Содержит зависимую переменную, введенную DEP. VARIABLE в ответ на подсказку. Переменную можно заменить путем печати с клавиатуры пре- образования или имени новой переменной в данном поле Вектор параметра Вводит начальные оценки для параметров PARAMETER VECTOR в функции или имя цифрового вектора, который содержит начальные оценки Функция Введите имя сшивального вектора, содер- FUNCTION жащего данную функцию, если эта функция хранилась в переменной. Функцию можно непосредственно ввести в данное поле при помощи операторов и формата, описанного в разделе 9.3 Максимальные итера- Введите общее число итераций, которые ции система должна выполнить при использова- MAXIMUM ITERATIONS нии функции. В каждой итерации может быть несколько обращений к функции Максимальное число Вводит максимальное число раз, сколько обращений к функции система должна оценить функцию при вы- MAXIMUM FUNCTION полнении поиска. Поскольку при каждой CALLS итерации происходит несколько обращений к функции,то это число должно быть больше, чем число, введенное в поле MAXIMUM ITERATIONS Остановка сходимос- Данная система предполагает, что сходи- ти на сумме квадра- мость имела место, когда дробное измене- тов остаточных ве- ние в суммах квадратов остаточных вели- личин STOPPING CON. чин меньше или равно введенному значению ON RES. SS Останавливает схо- Система предполагает, что сходимость димость оценок имела место,когда дробное изменение во STOPPING CON. всех оценках параметра меньшн или равно ON ESTIMATES значению,вводимому здесь Исходный (начальный)Вводит исходное значение параметра огра- параметр MARQUARDT ничения MARQUARDT INITIAL MARQUARDT PARAMETER Начальный показа- Вводит начальный показатель масштаби- тель масштабирова- рования ния INITIAL SCALING FACTOR Максимальное значе- Вводит максимальное значение, которое ние параметра система должна использовать для пара- MARQUARDT метра MARQUARDT, пока поиск не будет MAX. VALUE OF прекращен MARQUARDT PAR Когда табло первоначально выводится на экран, то в нескольких полях появляются стандартные значения. Вы можете нажать на табулятор и перейти к любому полю, вводя данные, подходящие для анализа. После того, как все изменения введены, нажмите ENTER и система подберет модель и результаты выведет на экран. Каждый раз при изменениях, проводимых на табло, обеспечьте нажатие клавиши ENTER для повторного подбора модели. В строке состояния табло можно видеть процедуру, которую функциональные ключи определили в качестве процедуры. F1 и F10 сохраняют свои обычные описания (HELP и QUIT). Описания прочих ключей приводятся ниже: Ключ Описание ------------------------------------------------------------ F2 Вычерчивает график наблюдаемых значений по сравне (OBSPRD) нию с прогнозируемыми значениями для зависимой пе ременной. В график включается линия со склоном равным 1 F3 Отображает статистику дисперсионного анализа для (ANOVA) полной регрессии.При вычислении статистики R-квад ратуры используется неправильная общая сумма квад ратов. В зависимости от получаемой функции эта су м- ма может либо подходить, либо нет F4 Отображает результты подбора первоначальной (ис- (REVIEW) ходной) модели F5 Вычерчивает график остаточных величин по сравне- (RESIDS) нию с прогонзируемыми величинами для зависимой переменной или остаточных величин по сравнению с любой другой переменной. Относительно исполь- зуемой переменной будет выдаваться подсказывающее сообщение. На графике имеется горизонтальная линия в нулевой точке. После вывода графика на экран нажмите ENTER и будет выведена статистика остаточных величин F6 Вычерчивает график подбираемой модели по сравнению (PREDCT) с любой переменной. Относительно используемой пере менной будет выдано подсказывающее сообщение ПРИМЕР ------ В данном примере будут использоваться данные по допустимой фракции хлора, остающихся после нескольких недель (Draper and Smith,1966). Всего было сделано 44 измерения. Мы будем использовать значения 0.3 и 0.2 в качестве оценок начальных параметров. Когда появится подсказка для зависимой переменной, введите chlorine Когда появится табло описания модели, введите 0.3 0.2 в поле PARAMETER VECTOR и f в поле FUNCTION. В переменную f входит следующее выражение: STATGRAPHECS PARM [1] PLUS (0.49 MINUS PARM [1]) TIMES EXP MINUS PARM[2] TIMES (weeks MINUS 8) Данное выражение представляет следующую функцию: Y = a + (0.49 - a) exp [ - B (x-8)] + э STATGRAPHICS вычисляет (оценивает) функцию справа налево без упорядочивания приоритетов операторов. Элементы PARM [1] и PARM [2] об- ращаются к двум неизвестным параметрам (альфа и бета) в функции, которая должна оцениваться. Они через систему вызывают либо первое [1], либо второе [2] значение из вектора параметра. Для обращения к этим значениям в уравнениях пользователя необходимо использовать имя PARM. Для других полей на табло используются стандартные значения. Нажмите ENTER для запуска процедуры построения модели. Система начинает работу с исходными оценками для альфа и бета (a и B) и пытается улучшить их при каждой итерации данной модели. После каждой итерации сумма квадратов остаточных величин выводится на экран. Итерации прекращаются, если имеет место одно из следующих событий: 1) достигнуто максимальное число итераций или оценок функции; 2) встречается одно из критериев останова или 3) параметр Marguardt достигает максимальной возможной величины. Во всех случаях кроме последнего предполагается сходимость и сводные результаты отображаются на экран. Результаты по данному примеру показаны на рисунке. Эти результаты включают в себя оценки параметров по методу наименьших квадратов, квадратические (стандартные) ошибки аппроксимации оценок и коэффициенты (показатели) оценок для их квадратических (стандартных) ошибок. Окончательная оценка параметра будет помещаться в переменную PARM. Матрица аппроксимации дисперсии - ковариации для оценок параметра хранится в переменной COVM в оперативной памяти. ------------------------------------------------------------ РЕЗУЛЬТАТЫ ПОДБОРА МОДЕЛИ ------------------------------------------------------------ переменная 4 коэффициент квадратическая ошиб- коэффициент ка (стандартная) (показатель) коэффициент 1 .38961679 .00482342 80.7760 коэффициент 2 .09944640 .01253870 7.9312 Общее число итераций = 4 Общее число оценок функции = 13 Вычисленная ковариационная матрица помещается в глобальной переменной: COVM Для продолжения нажмите ENTER ------------------------------------------------------------ Заметим, что максимальное число итераций было 25, но система выполнила только 4. Если бы система достигла максимального числа итераций, то вам бы пришлось возобновить поиск при помощи новой переменной PARM. Путем нажатия ENTER возвратитесь к табло описания модели. Затем нажмите F2 для построения графика прогнозируемых величин по сравнению с наблюдаемыми величинами для chlorine (хлор). На экран будет выведен график. Нажмите ENTER для возврата к табло описания модели. Затем нажмите F3 и на экран будет выведена следующая статистика по дисперсионному анализу ----------------------------------------------------------- Дисперсионный анализ для полной регрессии ----------------------------------------------------------- источник сумма квад- Df среднеквадрати- коэффициент ратов ческое значение модель 7.982 2 6.991 25314.988 ошибка .004760 42 .000115 ----------------------------------------------------------- Итог .997000 44 Итог коэфф. .039500 43 F-квадратура = 0.999404 Для продолжения нажмите ENTER ----------------------------------------------------------- Для возврата к табло описания модели нажмите ENTER Затем нажмите F6 для вычерчивания графика подобранной модели. Введите weeks (недели) в ответ на подсказку для переменной, по сравнению с которой строится график (в данном примере weeks является единственной используемой натуральной переменной). На экран будет выведен график. Для возврата к табло описания модели нажмите ENTER и F10 - для выхода из процедуры. Остаточные величины из окончательной модели хранятся в переменной RESIDUALS оперативной памяти; система выводит сообщение для этих значений до тех пор, пока не будет осуществлен выход из процедуры. Для возврата к меню регрессионного анализа нажмите ENTER. |