<<
>>

3.1. Подготовка первичной социологической информации к обработке на ЭВМ

 

Подготовка первичной социологической информации к обработке на ЭВМ начинается на стадии разработки методического инструментария. Заключается она в присвоении вариантам ответов на вопросы определенных числовых кодов.

Для закрытых и полузакрытых вопросов анкеты такая процедура осуществляется до начала исследования, для открытых вопросов анкеты и для бланка-интервью - после сбора первичной информации.

Отвечая на закрытый вопрос анкеты, респондент сам отмечает соответствующий числовой код, обводя его кружком. В случае устного опроса это делает анкетер. Записи в открытых вопросах предварительно группируются по заданным правилам, после чего кодируются при помощи специально составленного кодировочного бланка.

Принципы Закрытые вопросы кодируются, как правило, кодирования двумя способами: в линейной и табличной фор- закрытых мах. В первом случае вариантам ответа присва- вопросов              ивается порядковый числовой код в виде нату

рального числа. Например:

1.              «Примете ли Вы участие в голосовании?»

1              — Да

2              — Нет

3              — Еще не решил(а)

Респондент обводит кружком код варианта ответа, который совпадает с его личным мнением.

Табличные варианты обычно аккумулируют несколько линейных вопросов, они всегда кодируются в соответствии с расположением («вдоль») шкалы измерения.

В перечневых таблицах шкала измерения, как правило, располагается горизонтально, соответственно, и коды «выстраиваются» в горизонтальный ряд натуральных чисел. Например:

2.              «В работе каких общественных движений Вы готовы участвовать?»

Общественные движения

Установки

готов(ва)

участвовать

еще не решил(ла)

не собираюсь участвовать

1.

Экологическое

1

2

3

2. Благотворительное

1

2

3

3. Религиозное

1

2

3

В функциональных таблицах, измеряющих разные типы поведения респондента, коды, как правило, располагаются вертикально. Например:

3.              «С какими общественными движениями Вы знакомы, какие из них имеются в вузе и в работе каких Вы принимаете участие?»

Общественные движения

Характер отношения

Знаком(а) с движением (1)

Имеется в вузе(2)

Принимаю участие в его работе (3)

Экологическое

1

1

1

Благотворительное

2

2

2

Религиозное

3

3

3

Аналогично ставятся коды, если в вопросе табличной формы шкала измерения расположена вертикально. Например:

4.              «Как Вы оцениваете социально-психологический климат в вузе в целом, на факультете, в своей учебной группе?»

Социально-психологический

климат

В вузе в целом (1)

На факультете (2)

В своей учебной группе(3)

Очень благоприятный

1

1

1

В целом спокойный

2

2

2

Неопределенный

3

3

3

Напряженный

4

4

4

Состояние близкое к бунту

5

5

5

Каждое линейное сочетание объекта оценки и шкалы измерения обозначается отдельным числом (в вопросе 2 в виде нумерации общественных движений, в вопросах 3 и 4 — в виде чисел в скобках).

Такая нумерация необходима для формализации вопросов при их обработке на ЭВМ. В этом случае, например, табличный вопрос 4 как бы разбивается на три линейных: 4/1, 4/2 и 4/3. Если перечень оцениваемых объектов превышает девять и их нумерация происходит при помощи двухзначного числа, перед кодами, обозначенными одной цифрой, ставится ноль: 4/01, 4/02,...,4/10, 4/11,...

Приведенные правила кодирования необходимо соблюдать на стадии составления макета анкеты. На этой же стадии предусматривается размерность кодов числовых величин или балльной оценки, которые при обработке на ЭВМ используются в качестве условной интервальной шкалы.

Пример числовой «закрытой» шкалы.

5.              «Каков процент вероятности, что летом Вы поедете отдыхать за границу ? (Обведите соответствующий процент на шкале)»

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Пример балльной шкалы.

6. «В какой степени Вы удовлетворены работой телеканалов?» (Оцените по 5-балльной шкале: 1 - самая низкая,..., 5 - самая высокая оценка)

Телеканалы

Балльные оценки

1. Первый

1

2

3

4

5

2. Второй

1

2

3

4

5

3. Третий

1

2

3

4

5

Аналогично числовым и балльным строятся шкалы для графических тестов и семантического дифференциала.

Преимущество закрытых вопросов состоит в том, что, выбирая тот или иной вариант ответа, респондент одновременно кодирует его. Иная ситуация с открытыми вопросами.

Различают два вида открытых и полуоткрытых вопросов: перечневые и текстовые.

Перечневые открытые вопросы содержат многократно повторяющуюся и легко поддающуюся группировке информацию (фамилии, названия партий, национальность респондентов и т.д.). Такая информация легко вводится в компьютер, при помощи которого и осуществляется ее группировка.

Прежде чем кодировать открытые вопросы анкеты, необходимо проверить их на полноту и точность заполнения, поскольку от этого зависит качество первичной информации и, следовательно, достоверность выводов.

Полнота              Если ответы отсутствуют менее чем на 10% воп-

заполнения росов, то представляется возможным логичес- опросника ки восстановить (с той или иной степенью вероятности) ответы на них, опираясь на ответы респондента на остальные вопросы.

Если же респондент не ответил более чем на 20% вопросов, либо на два-три вопроса в социально-демографическом блоке, такие опросники исключаются из основного массива как некачественные, способные внести искажение в социологическую информацию.

Предпочтительней, чтобы задачу коррекции или восстановления пропущенных ответов осуществлял интервьюер (анкетер), в памяти которого сохраняются нюансы процедуры опроса.

Однозначно восстановить ответы на пропущенные вопросы не всегда легко, поскольку порой не известно, пропущен ли ответ случайно, намеренно или же пропуск связан с тем, что респондент затруднился ответить на вопрос.

Точность При контроле анкет целесообразно проверить их заполнения на предмет наличия противоречивых ответов. опросника Например, если в начале анкеты, посвященной исследованию инвестиционного поведения, респондент указал, что акции и ценные бумаги его вообще не интересуют, а в конце на вопрос о среднем количестве акций, которыми он обладает, назовет двадцать, противоречие налицо. Такого рода противоречие относительно легко снять, скоррек-тировав в первом вопросе ответ «не интересуюсь» на «интересуюсь иногда».

В более сложных ситуациях подобные вопросы из обработки на ЭВМ исключаются. В случае исключения более 20% вопросов анкета подлежит выбраковке.

Нередко, несмотря на имеющееся указание — выбрать один, два или три варианта ответа, респондент обводит на несколько кодов больше, что затрудняет коррекцию ответа. На практике иногда сохраняют первые обведенные (подчеркнутые) коды, однако это чревато существенными погрешностями. Лучше такие вопросы в компьютер не вводить.

После выбраковки непригодных для обработки на ЭВМ анкет составляется бланк кодировки ответов респондента на открытые вопросы.

Как уже отмечалось, после ввода текстовой информации в ЭВМ ответы «перечневого» характера подлежат автоматической группировке и обработке. Чтобы автоматическая группировка текстовой информации происходила без сбоя, все имеющиеся в перечне наименования необходимо унифицировать: писать единообразно (или полностью, или сокращая одни и те же наименования одинаково), единым шрифтом, не «разнообразя» пунктуацию и не вводя дополнительные интервалы между словами. Без соблюдения этих правил компьютер будет «сбиваться» и создавать из одних и тех же по смыслу, но морфологически и синтаксически разнопланово оформленных понятий дополнительные группы, которые вновь придется перекодировать и сводить в единую.

Ответы текстового характера, смысловое значение которых порой имеет широкий спектр, в принципе можно ввести в компьютер, после чего, классифицируя и унифицируя их по смыслу и форме, создать приемлемую для обработки группу индикаторов. Однако нередко их удобнее предварительно выписать (вручную или на компьютере), отмечая частоту повторяемости утверждений или оценочных суждений по смыслу. Такая процедура кодировки открытых вопросов, особенно, когда ответы по смыслу разноплановые, значительно ускоряет обработку.

После подсчета частоты (повторяемости) идентичных по смыслу суждений близкие по содержанию объединяются в одну группу. Тем самым многозначность суждений сводится к пяти-десяти укрупненным смысловым индикаторам, достаточным для поиска решения задач исследования. Далее каждой из полученных групп присваивается числовой код, который и вводится в ЭВМ.

Для выполнения полного цикла компьютерных работ социологу целесообразно знать по крайней мере три программы для персональных компьютеров:

SPSS (StatisticalPackageforSocialSciences) — наиболее широко используемый в прикладной социологии пакет программ, предназначенных для статистической обработки первичной информации. Эта программа обеспечивает преобразование данных, расчет базовых статистических показателей корреляций, построение двумерных и объемных графиков, многомерных таблиц сопряженности, осуществление дисперсионного, факторного, кластерного и регрессионного анализа. Программа применяется также для текстового оформления итогов исследования (отчетов). Дополнительные модули SPSS позволяют анализировать временные ряды, рассчитать выборку, кодировать текстовую информацию (например, открытые вопросы анкеты).

Exel — пакет программ для создания электронных таблиц, графиков и диаграмм, работы с географическими картами. Его богатые математические возможности позволяют осуществить расчет любых статистических функций, а также анализ рядов распределения и прогноз. Word — пакет программ для функциональной обработки текстов. Он позволяет форматировать и иллюстрировать любые документы. Тексты и иллюстрации различных форматов могут быть импортированы в нее из других программ и встроены в текст документа. Программа обеспечивает автоматическое построение таблиц, графиков и рисунков.

Все перечисленные программы совместимы друг с другом и гарантируют решение любых математических и графических (в том числе текстовых) задач, связанных с полным циклом социологического исследования.

Результаты обработки первичной социологической информации на ЭВМ — табуляграммы, содержащие сгруппированные данные в форме: линейного распределения ответов на вопросы в абсолютных числах и в процентах; парное, тройное и т. д. распределение информации при сочетании вариантов ответов на два, три и т. д. вопроса анкеты; взаимозависимое распределение некоторой группы ответов; средние значения, дисперсии, коэффициенты корреляции и другие статистические величины для информации, собранной на основе интервальной шкалы. Подробному анализу этих форм отображения информации посвящен один из последующих параграфов.

Ошибки возможны не только в процессе заполнения анкеты или бланка-интервью, но и при вводе в ЭВМ первичной социологической информации. Как правило, это случайные ошибки: в результате нажатия не той клавиши ввода, пропуска какого-либо кода, особенно в вопросах табличной формы. Поэтому после того, как информация введена, целесообразно проконтролировать ее на экране компьютера. Кроме того, в программе 8Р8Б предусмотрен контрольный ограничитель, «сигнализирующий» оператору о недопустимой операции (вводе отсутствующего в вопросе кода, либо числа, превышающего общую численность вариантов ответа на вопрос).

Относительно легко поддаются определению случайные ошибки в виде кодового числа, явно не фигурирующего в контролируемом вопросе анкеты. Например, если на вопрос «Читаете ли Вы газету «Известия»?» предусматриваются всего два альтернативных ответа: 1 — да, 2 — нет, то вполне понятно, что в колонке для кодов этого вопроса любое другое число ошибочно. В этом случае необходимо ошибочный код заменить правильным, идентифицировав его с отмеченным кодом по данному вопросу в соответствующей анкете.

Чтобы такая идентификация была возможной, анкеты перед вводом информации в ЭВМ нумеруют порядковыми числами, ввод которых предусматривается в начале табулированного макета анкеты или иного инструментария.

Число не ответивших на тот или иной вопрос следует в обязательном порядке ввести в компьютер в виде отдельного кода (в качестве такового можно выбрать код «0»).

Для альтернативных вопросов, общая сумма ответов на которые в обязательном порядке равна 100% (например, выбор из 10 политиков при условии голосования только за одного), дополнение до 100% (то есть учет не ответивших) компьютер может осуществлять автоматически. Следовательно, если в вопросе имеется позиция «затруднились ответить», предназначенная для селекции нефункциональных ответов, которые не будут использоваться при анализе информации, к ним можно присоединить и отсутствие ответов (компьютер это сделает автоматически, если не ответивших просто не кодировать).

Для ускорения ввода первичной информации в ЭВМ массивы анкет можно разбить на подмассивы в соответствии с числом операторов и вводить одновременно в несколько компьютеров. После окончания ввода информации файлы с данными в различных компьютерах объединяются в один. Затем необходимо посчитать линейное распределение данных с тем, чтобы по каждому вопросу проверить наличие ошибочных кодов, случайно введенных операторами при перфорировании анкет. После исправления ошибочных кодов массив информации может быть подвергнут полной компьютерной обработке.

Для решения ряда методических задач, например, отработки модели выборки, оценки вариации рядов распределения, устойчивости показателей, полный массив анкет может быть разбит на основании выбранных исследователем принципов на подмассивы, которые обрабатываются автономно. 

<< | >>
Источник: Горшков Михаил Константинович. Прикладная социология: Учебное пособие для вузов. — М. — 312 с.. 2003

Еще по теме 3.1. Подготовка первичной социологической информации к обработке на ЭВМ:

  1. Ошибка в первичном документе обнаружена на стадии его обработки
  2. НАРУШЕНИЕ ПРАВИЛ ЭКСПЛУАТАЦИИ ЭВМ, СИСТЕМЫ ЭВМ ИЛИ ИХ СЕТИ (ст. 274 УК РФ).
  3. Модус обработки информации
  4. ЗАНЯТИЕ 3 ПРИЕМЫ СБОРА И ОБРАБОТКИ ИНФОРМАЦИИ В БУХГАЛТЕРСКОМ УЧЕТЕ
  5. 8.2. Подготовка финансовой информации
  6. ОРГАНИЗАЦИЯ И ПРОГРАММА, МЕТОДЫ АНАЛИЗА И ПРОГНОЗА СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ, ПРОЕКТИРОВАНИЕ РЕШЕНИЙ ПРОБЛЕМ ФИЗИЧЕСКОЙ КУЛЬТУРЫ И СПОРТА
  7. ЧАСТЬ ПЕРВАЯ ПОДГОТОВКА СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ
  8. ЧАСТЬ ВТОРАЯ СБОР СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
  9. 3.3. Анализ и оценка полученной информации и подготовка меморандума о потенциальном клиенте
  10. 3. Защита прав на программы для ЭВМ и базы данных Регистрация программ для ЭВМ и баз данных
  11. СОЗДАНИЕ, ИСПОЛЬЗОВАНИЕ И РАСПРОСТРАНЕНИЕ ВРЕДОНОСНЫХ ПРОГРАММ ДЛЯ ЭВМ (ст. 273 УК РФ).
  12. 2.1.2. Особенности охраны программ для ЭВМ и баз данных