Library.Ru

главная библиотекам читателям мир библиотек infolook виртуальная справка читальный зал
новости библиоnet форум конкурсы биржа труда регистрация поиск по порталу


Библиотекам Страница социолога Электронное пособие

  СОЦИОЛОГ В БИБЛИОТЕКЕ

[Самохина М.М., канд. социолог. наук, зав. Социологической службой Межрегиональной ассоциации деловых библиотек]

Обработка и анализ информации

     Ручная и компьютерная обработка – некоторые общие подходы и правила

     Обработка и анализ информации, по мнению В.А. Ядова (выдающегося отечественного социолога, автора многих работ по методике и методологии исследований), – самый увлекательный этап исследования. Обрабатывая, преобразуя полученные данные, мы делаем из разрозненного, сырого материала некоторую схему, картину, выявляем связи и закономерности. Мы проверяем те предположения, которые были у нас при составлении программы, выдвижении гипотез, которые возникали при сборе данных.
     Итак, вы закончили сбор информации. У вас в руках заполненные исследовательские документы – анкеты, бланки. Или другой вариант: ваш исследовательский метод – анализ документов; тогда их обработка фактически и является сбором данных. Так или иначе, в каждом из заполненных документов – набор вопросов, на которые даны различные ответы. Это могут быть готовые формулировки (ответы на закрытые вопросы) или тексты в свободной форме (ответы на открытые вопросы).
     Обработка может быть ручной и компьютерной. Их принципы в общем одни. Каждый отдельный случай (отдельного респондента с его характеристиками) мы включаем в группу (чаще всего список, ряд таких групп уже определен в программе исследования), то есть создаем группировку по тому или иному признаку и определяем (подсчитываем, измеряем) значимость этого признака и связи его с другими характеристиками респондентов.
     Несмотря на рост значимости компьютерных технологий, я говорю здесь о ручной обработке и делаю это по двум причинам. Первая и главная в том, что далеко не во всех библиотеках, где занимаются исследовательской работой, есть компьютеры, тем более – специальные программы обработки. Вторая – иногда в маленьких локальных исследованиях, особенно качественных, ручная обработка проще и эффективней. В принципе же это достаточно трудоемкая (хотя, может быть, и не слишком сложная) работа.
     При использовании компьютерных программ трудоемкость снижается в разы. Программ таких много, каждая имеет свои плюсы и минусы. Мой опыт связан с ДА-системой. Эта программа разрабатывается и распространяется московской компанией «Контекст». Первый ее вариант был создан еще в 1989 году, а в дальнейшем она постоянно модифицировалась. Изменения были связаны как с прогрессом компьютерных технологий, так и с опытом, который накапливался создателями и клиентами в процессе работы с программой. Характерно, что Сергей Валерьянович Чесноков, научный директор «Контекста» и автор идеи, на которой построена ДА-система, – не только математик, специалист в области логики и статистики, но и музыкант, исполнитель бардовских песен, романсов, собственных песен и моноспектаклей, человек с достаточно необычной биографией. По его собственным словам, в течение многих лет он размышлял над проблемой соотнесения точных наук и гуманитарности, пытался разрешить конфликт между методами анализа данных и нормами естественного языка. Результатом таких размышлений и стала ДА-система. Она сравнительно проста для пользователя и имеет, как мне кажется, достаточно редкий плюс – действительно говорит на естественном, гуманитарном языке, близком библиотекарю
     ДА-система поддерживает все операции при работе с данными – ввод (с возможностью обработать альтернативные и неальтернативные, открытые и закрытые вопросы), различные варианты обсчета и вывода данных, подготовку таблиц и отчета. Чтобы убедиться в этом, вы можете обратиться к демоверсии программы.
     Однако, обработка данных в любом случае потребует от вас внимания и терпения. Снизить трудоемкость при ручной обработке, достичь большей содержательности труда можно, если предварительно сгруппировать собранные документы по одному или двум наиболее важным для данного исследования дифференцирующим признакам. Как показывает опыт, подобная предварительная группировка будет не лишней и в том случае, если вы работаете с компьютерной программой.
     Если исследование ведется в разных библиотеках, первым дифференцирующим признаком может стать конкретная библиотека, в которой опрошен респондент. Или – библиотечное подразделение (абонемент, читальный зал, отдел искусств). Разделив заполненные бланки или анкеты по этому признаку, необходимо выбрать следующий – например, возраст или пол респондента. По этому критерию разделим посетителей каждого подразделения. Если полученных исследовательских документов много, можно выделить и третий, и четвертый критерии (например, в научных библиотеках важным дифференцирующим признаком явится, очевидно, профиль образования или специальности). Опыт подсказывает, что оптимальная численность обсчитываемой группы – 30–60 человек. Но реально она будет зависеть как от объективных данных (контингента абонентов вашей библиотеки, метода исследования и способа его организации, количества полученных бланков или анкет), так и от поставленных задач, и от выбранных критериев группировки.
     Еще один практический совет – старайтесь, чтобы число полученных исследовательских документов было «круглым». Собственно, в программе исследования чаще всего и заявляется такое «круглое» число – 100, 300, 500, 1000. Но нередко часть анкет или бланков оказывается недозаполненными, заполненными неверно, их приходится отбраковывать. В этих случаях при возможности лучше добрать материал.
     Сформировав группы, надо пронумеровать (а чаще всего – заново перенумеровать) исследовательские документы..
     Например, вы провели анализ спроса 500 посетителей библиотеки. Номера с 1 до 280 присвоены посетителям абонемента, с 281 по 500 – посетителям читального зала.
 
     На абонементе:

с № 1 по № 97 – школьники (до № 32 – мальчики, остальные девочки);
с № 98 по № 174 – студенты (до № 126 – юноши, остальные девушки);
с № 175 по № 241 – работающие (до № 190 – мужчины, остальные женщины);
с № 191 до № 280 – пенсионеры (до № 224 – мужчины, остальные женщины).

     В читальном зале:

с № 281 по № 335 – школьники (до № 302 – мальчики, остальные девочки);
с № 336 по № 447 – студенты (до № 369 – юноши, остальные девушки);
с № 448 по № 461 – работающие (до № 450 – мужчины, остальные женщины);
с № 462 до № 500 – пенсионеры (до № 476 – мужчины, остальные женщины).

     Если вы обрабатываете результаты вручную, такая нумерация позволит вам, произведя подсчеты, при желании довольно легко «просматривать» и всю группу посетителей абонемента, читального зала, и всю группу, например, школьников, или мужчин; то есть вы сможете проследить значимость влияния того или иного признака на специфику библиотечного спроса. Компьютерная программа сделает это автоматически (конечно, если соответствующий признак будет закодирован).

     Словарь обработки данных: принципы составления, сложности и хитрости

     Словарем обработки часто называют список, набор позиций, по которым производится подсчет и анализ данных исследования. Здесь мы воспользуемся этим термином.
     При обработке анкет (и ручной, и компьютерной) основу словаря составляет список вопросов и вариантов ответов на них. Попробуем рассмотреть формирование словаря на конкретных примерах.
     Представьте, что вы провели анкетирование 300 посетителей библиотеки. В социально-демографическом блоке вопросов вы просили респондента отметить (в числе других характеристик) его пол и место учебы. Среди анкетных вопросов есть вопрос о библиотечном стаже.
 
     Как давно Вы пользуетесь нашей библиотекой?

• я пришел сюда впервые
• менее года
• от года до двух лет
• от двух до пяти лет
• более пяти лет
• мне трудно ответить на этот вопрос

     Это альтернативный закрытый вопрос, варианты ответов уже готовы для обработки. Можно предусмотреть дополнительную позицию для учета респондентов, вовсе не ответивших на вопрос, но можно объединить их с теми, кто выбрал последний вариант ответа.
     В социально-демографическом блоке есть также и вопрос о целях (мотивах) посещения библиотеки.
 
     С какой целью Вы обычно приходите в библиотеку?

• найти материалы по теме для учебы, работы
• найти конкретные материалы для учебы, работы
• за конкретными книгами, статьями «для себя»
• посмотреть выставки
• в надежде найти что-нибудь интересное
• на массовые мероприятия
• встретиться и пообщаться с друзьями, знакомыми
• другое________________________________
• мне трудно ответить на этот вопрос

     Это неальтернативный полузакрытый вопрос, варианты ответов также в основном готовы для обработки. Как и в предыдущем случае, можно предусмотреть дополнительную позицию для учета респондентов, вовсе не ответивших на вопрос, но можно объединить их с теми, кто выбрал последний вариант ответа.
     Однако давайте еще раз внимательно посмотрим на варианты ответов. Наш профессиональный опыт безусловно подскажет, что перечисленные цели (мотивы) посещения библиотеки явно распадаются на «деловые» и «свободные». А поскольку вопрос неальтернативный, то один респондент может, например, отметить и первый, и второй вариант; другой – и третий, и пятый, и седьмой. Сложить полученные цифры будет нельзя, поскольку неправильно учитывать дважды или трижды одного и того же человека, поэтому вы не сможете узнать, сколько у вас «деловых» посетителей, сколько читателей приходят к нам просто потому что любят читать и любят бывать в библиотеке.
     В этом и подобных случаях логично ввести в словарь некоторые дополнительные обобщающие позиции. Если вы решитесь приобрести ДА-систему, то в «Руководстве пользователя» прочтете, что такого рода проблемы решаются с помощью конструирования так называемых «вторичных переменных». Я же советую способ, который кажется мне более простым. Обобщающие позиции могут дополнить в словаре список вариантов ответов на любой вопрос, когда вы сочтете это необходимым. В данном случае они могут выглядеть, например, так: «респондент назвал деловые мотивы», «… назвал свободные мотивы», «… назвал и те, и другие мотивы»; из этих трех позиций могут быть отмечены либо одна (первая или вторая), либо все три.
     Представим себе также, что в вашей анкете есть вопрос-таблица, респондент должен отметить в ней, получил ли он в день анкетирования нужные материалы в том или ином подразделении библиотеки. Поскольку этот вопрос фактически заменяет три однотипных вопроса о трех подразделениях с одинаковым перечнем ответов, в словаре обработки должны, очевидно, появиться все эти три вопроса, каждый должен сопровождаться всем перечнем ответов плюс позиция «нет ответа».
     Похожим способом преобразуются в словаре и вопросы, построенные по методу семантического дифференциала. Ведь каждый из них тоже фактически заменяет несколько однотипных вопросов, в которых респонденту предлагается оценить какие-либо качества, характеристики чего-либо. Например, если вопрос касается библиотеки, – достаточно ли в фонде новой литературы, вежливы ли сотрудники, компетентны ли они, как обстоят дела с комфортом и уютом. Обычно оценка производится по пятибалльной или трехбалльной шкале; соответственно в словаре должны появиться все оцениваемые характеристики. Каждая должна быть введена в словарь как отдельный вопрос с пятью или тремя вариантами ответа-оценки – от «отлично» или «хорошо» через «средне» до «очень плохо» или «плохо» – плюс позиция «нет ответа».. Кроме этого я советовала бы и здесь ввести в словарь некоторые обобщающие позиции по всему вопросу. В данном случае они станут некоторой интегративной оценкой библиотеки и могут выглядеть, например, так: «респондент дал положительные оценки», «… дал отрицательные оценки», «… дал и положительные, и отрицательные оценки»; из этих трех позиций могут быть отмечены либо одна (первая или вторая), либо все три.
     В вашей анкете, вероятно, будут и открытые вопросы. С их кодированием для словаря могут возникнуть достаточно сложные проблемы. В той или иной степени необходимо использовать элементы контент-анализа, выделять темы, смысловые единицы, часто употребляемые слова и понятия и т.д. Далее я специально вернусь к этому.

     Технология первичной обработки данных

     Обработка данных на любой компьютерной программе есть последовательная, в соответствии с инструкциями к данной программе, «набивка» каждого заполненного документа (анкеты, бланка и т.д.) – набивка всех вариантов ответов на все вопросы и всех дополнительных позиций, введенных в словарь. Результатом является возможность получить данные (как в абсолютных числах, так и в процентах) по каждой позиции в каждой группе и по всему массиву (они обычно называются линейными распределениями); данные о связях тех или иных ответов на ту или иную (любую) пару или даже несколько вопросов (эти данные принято называть корреляциями); разного рода коэффициенты и т.п.
     До появления компьютерных программ ручная обработка нередко производилась подобным же образом – на больших листах миллиметровой бумаги чертилась так называемая матричная таблица. В каждой строке таблицы собирались все ответы на все вопросы по одному документу, а каждый столбец соответствовал одному варианту ответа на один вопрос. На самом деле эта работа (знаю по собственному опыту) была не только крайне трудоемкой, но и не очень эффективной.
     Если вы обрабатываете исследовательские документы вручную, особенно важно знать (и лучше подумать об этом еще на этапе составления программы исследования), хотите ли вы просто получить информацию о том, как ответят на тот или иной вопрос все ваши респонденты – или вас интересует специфика ответов представителей той или иной группы. Первая задача, конечно, гораздо проще, часто библиотечные исследователи ею и ограничиваются. Они просто подсчитывают, сколько респондентов назвали данный мотив посещения библиотеки; сколько удовлетворены работой библиотеки; сколько человек прочли ту или иную из списка книг и т.п.
     Но логика исследования нередко требует более тщательной проработки, установления связей между двумя или более характеристиками респондента. Речь в общем случае идет о том, от чего именно зависит появление или превалирование того или иного ответа на тот или иной вопрос. Практика показывает, что чаще всего определяющей, объясняющей характеристикой оказывается социально-демографическая – возраст, пол, образование, место работы или учебы.
     Если вы должны обработать документы вручную и поставили перед собой задачу выявления специфики различных групп респондентов, работа будет непростой. Как уже говорилось, логично уменьшить трудоемкость, предварительно сгруппировав документы по важным дифференцирующим признакам. Таблица же обработки составляется следующим образом: ее вертикаль – это словарь обработки, а горизонталь – список выделенных групп. Результаты обработки документов каждой группы отражаются в одном столбце. Вы последовательно просматриваете эти документы и отмечаете в соответствующей клетке этого столбца тот или иной ответ на тот или иной вопрос. В каждой из этих клеток собирается, таким образом, сумма соответствующих ответов, полученных от респондентов, отнесенных к данной группе. Проще всего при этом пользоваться принятой в библиотеках системой «домиков»-десяток – четыре точки, затем последовательное соединение их в квадрат (пять – восемь) и две диагонали. Получившиеся результаты лучше занести в чистую таблицу-копию. Она может выглядеть, например, таким образом (показана, конечно, только часть – примеры – обработанных данных анкетирования 300 респондентов).

     Таблица 1. Первоначальная обработка данных

Вопросы
(по номерам)
и ответы
Группы. (Массив - 300 респондентов)
Школьники
(112)
Студенты
(64)
Работающие
(47)
Пенсионеры
(77)
Позиции словаря М
(39)
Ж
(73)
М
(21)
Ж
(43)
М
(18)
Ж
(29)
М
(23)
Ж
(54)
1 …………                
  …………                
2 …………                
  …………                
3 Как давно Вы пользуетесь этой библиотекой?                
  пришел впервые 10 12 2 0 4 7 2 2
  менее года 14 16 7 13 2 0 5 4
  от года до двух лет 11 34 6 14 6 14 7 14
  от двух до пяти лет 0 9 3 10 3 4 6 20
  более пяти лет 0 2 1 6 2 4 3 13
  трудно ответить 1 0 0 0 1 0 0 1
  не ответил 3 0 2 0 0 0 0 0
4 …………                
5 …………                
6 …………                
                   
7 С какой целью Вы обычно приходите в эту библиотеку                
  найти материалы по теме для учебы, работы 24 70 14 41 8 11 2 3
  найти конкретные материалы для учебы, работы 15 62 10 36 6 6 2 2
  за конкретными книгами «для себя» 7 14 9 8 9 12 17 25
  посмотреть выставки 0 2 0 1 0 1 1 2
  в надежде найти что-нибудь интересное 18 22 10 21 11 16 19 41
  на массовые мероприятия 0 3 0 1 1 1 2 5
  встретиться и пообщаться с друзьями, знакомыми 4 7 3 12 0 4 3 8
  другое 1 4 0 2 0 3 2 5
  трудно ответить 2 0 0 0 3 2 0 2
  не ответил 4 0 1 0 2 3 1 0
  назвал деловые мотивы 30 73 17 43 10 15 3 5
  назвал свободные мотивы 20 29 12 27 12 22 23 50
  назвал и те, и другие мотивы 16 27 10 27 7 11 3 1
8 …………                
…………                
15 …………                
…………                

     Заполнив такую таблицу, вы можете считать, что выполнили самую трудоемкую, но отнюдь не самую сложную часть работы. Имеющиеся абсолютные числа безусловно надо перевести в проценты (компьютерная программа, как уже говорилось, делает все сама). Но я советую вам перед этим провести самый первоначальный их анализ. Больше того – работая с компьютерной программой, постоянно соотносите проценты с абсолютными числами, которым они соответствуют; если это единицы – будьте осторожны с выводами и сравнениями…

     Дальнейшая работа с данными

     Давайте попробуем провести первоначальный анализ и соответствующую дальнейшую обработку данных, приведенных в таблице 1.
     Логика подсказывает, что начинать надо с линейных распределений по массиву, затем переходить к данным по «большим» группам. Компьютерная программа позволяет обратиться к любым линейным распределениям и корреляциям сразу же после окончания или даже в процессе первичной обработки. Обрабатывая исследовательские документы вручную, придется сложить данные по всем выделенным и обработанным отдельно группам – чтобы потом, опираясь на суммарные данные, вернуться к групповым.
     Первый вопрос – «Как давно Вы пользуетесь этой библиотекой?» – альтернативный. Поэтому сумма ответов в каждом столбце равна количеству респондентов соответствующей группы. При этом небольшое количество ответов в последнихдвух строках логично ведет к решению сложить эти ответы.

     Таблица 2. Библиотечный стаж респондентов. (Абсолютные числа)

Позиции словаря Массив
(300)
Социально-возрастные группы Пол
Школьники
(112)
Студенты
(64)
Работающие
(47)
Пенсионеры
(77)
М
(101)
Ж
(199)
пришел впервые392221141821
менее года612820292833
от года до двух лет106452020213076
от двух до пяти лет559137261243
более пяти лет3127616625
трудно ответить, нет ответа8421171

     Линейные распределения (данные по массиву) показывают, что в выборке так или иначе представлены респонденты с различным библиотечным стажем, хотя в некоторых клетках таблицы числа очень небольшие. Поскольку здесь мы имеем разделение по двум критериям – социально-возрастному и гендерному, возникает вопрос, в какой степени каждая из характеристик влияет на этот стаж. Чтобы получить ответ, необходимо пересчитать абсолютные числа на проценты (при этом в каждом столбце за 100% принимается число респондентов, а поскольку вопрос альтернативный, сумма процентов должна быть равна 100).

     Таблица 3. Библиотечный стаж респондентов

Позиции словаря Массив
(300)
Социально-возрастные группы Пол
Школьники Студенты Работающие Пенсионеры М Ж
пришел впервые13,019,63,123,45,217,810,5
менее года20,326,831,34,311,727,716,6
от года до двух лет35,440,231,342,527,229,738,2
от двух до пяти лет18,38,020,314,933,811,921,6
более пяти лет10,31,710,912,820,86,012,6
трудно ответить, нет ответа2,73,53,12,11,36,90,5

     Внимательный взгляд на таблицу 3 зафиксирует, что у девочек, девушек и женщин библиотечный стаж солиднее, чем у мальчиков, юношей и мужчин. Однако такие факторы как возраст, с одной стороны, и учеба в вузе, с другой, судя по полученным данным, оказываются все-таки более значимыми факторами. В целом же видим, что более трети респондентов посещает библиотеку от года до двух лет; особенно характерен такой стаж для школьников и работающих. Среди пенсионеров каждый пятый посещает библиотеку более пяти лет, каждый третий – от двух до пяти лет. Анализируя таблицу, можно сделать и еще ряд выводов, результаты интересно будет также сравнить с данными вашей читательской картотеки, других библиотечных документов.
     При желании, однако, вы можете проанализировать имеющуюся ситуацию еще более подробно – вернувшись к предусмотрительно проведенному разделению респондентов на более мелкие группы. Правда, как уже говорилось выше, надо помнить, что здесь мы часто имеем дело с малыми абсолютными числами, поэтому выводы должны быть осторожными.

     Таблица 4. Библиотечный стаж (подробный анализ)

Позиции словаря Школьники
(112)
Студенты
(64)
Работающие
(47)
Пенсионеры
(77)
М
(39)
Ж
(73)
М
(21)
Ж
(43)
М
(18)
Ж
(29)
М
(23)
Ж
(54)
пришел впервые25,616,59,5022,224,18,73,7
менее года35,921,933,330,211,1021,87,4
от года до двух лет28,246,628,632,633,348,330,425,9
от двух до пяти лет012,314,323,316,713,826,137,0
более пяти лет02,74,813,911,113,813,024,1
трудно ответить, нет ответа10,309,505,6001,9

     Можно отметить, например, больший читательский стаж – по сравнению со сверстниками, мальчиками и юношами – у школьниц, у студенток (которые, вероятно, записались в библиотеку еще будучи школьницами), а также у работающих женщин по сравнению с мужчинами. Характерно также, что каждый четвертый респондент-школьник (мальчик) пришел в библиотеку впервые; логично понаблюдать в этом смысле за соответствующей группой читателей – может быть, этот первый раз оказывается для них и последним?.. Такой же процент впервые пришедших – в группе работающих (и мужчин, и женщин). Вы можете проследить – это текучесть, или представители данной группы стали к вам чаще записываться…
     Попробуем теперь обратиться ко второму примеру из таблицы 1. Вопрос «Как давно Вы пользуетесь этой библиотекой?» – неальтернативный. Поэтому сумма ответов в каждом столбце может оказаться больше количества респондентов соответствующей группы.
     Как и в предыдущий раз, начинаем с подсчета линейных распределений по массиву, затем переходим к данным по «большим» группам.

     Таблица 5. Цели посещения библиотеки. (Абсолютные числа)

Позиции словаря Массив
(300)
Социально-возрастные группы Пол
Школьники
(112)
Студенты
(64)
Работающие
(47)
Пенсионеры
(77)
М
(101)
Ж
(199)
найти материалы по теме для учебы, работы173945519548125
найти конкретные материалы для учебы, работы139774612433106
за конкретными книгами «для себя»101211721424259
посмотреть выставки7211316
в надежде найти что-нибудь интересное158403127608100
на массовые мероприятия133127310
встретиться и пообщаться с друзьями, знакомыми4111154111031
другое155237312
трудно ответить, не ответил2061103137
назвал деловые мотивы1961036025860136
назвал свободные мотивы1954939347367128
назвал и те, и другие мотивы10243371843666

     Данные по массиву и здесь доказывают, что в выборке представлены как «деловые», так и «свободные» посетители библиотеки, хотя в некоторых клетках таблицы числа очень небольшие. Теперь пересчитаем абсолютные числа на проценты; при этом в каждом столбце за 100% принимается число респондентов, а поскольку вопрос неальтернативный, сумма процентов безусловно будет превышать 100.

     Таблица 6. Цели посещения библиотеки

Позиции словаря Массив
(300)
Социально-возрастные группы Пол
Школьники
(112)
Студенты
(64)
Работающие
(47)
Пенсионеры
(77)
М
(101)
Ж
(199)
найти материалы по теме для учебы, работы57,783,985,940,46,547,562,8
найти конкретные материалы для учебы, работы46,368,871,925,55,232,753,3
за конкретными книгами «для себя»33,718,826,644,756,641,629,
посмотреть выставки2,31,81,62,13,91,03,0
в надежде найти что-нибудь интересное52,735,748,457,577,957,450,3
на массовые мероприятия4,32,71,64,39,13,05,0
встретиться и пообщаться с друзьями, знакомыми13,79,823,48,514,39,915,6
другое5,04,53,16,49,13,06,0
трудно ответить, не ответил6,75,41,621,33,912,93,5
назвал деловые мотивы65,392,093,853,210,459,463,3
назвал свободные мотивы65,043,860,972,394,866,364,3
назвал и те, и другие мотивы34,038,457,838,35,235,633,2

     В таблице 6 много разнообразных и интересных данных. Видно, что доля «деловых» и «свободных» посетителей по массиву фактически одинакова – две трети. Однако среди учащейся молодежи деловые мотивы характерны почти для каждого, а свободные встречаются (особенно у школьников) гораздо реже. У работающих же и пенсионеров, естественно, совсем другая картина. Можно отметить также, что «деловые» посетители чаще приходят с тематическими, а не с конкретными запросами; для «свободных» посетителей конкретный запрос тоже менее характерен, чем поиск «чего-нибудь интересного». Библиотечные выставки и массовые мероприятия непопулярны. Общение со знакомыми в библиотеке характернее всего для студентов, женщины говорят о таком общении чаще, чем мужчины. А может быть, в графе «другое» из 15 человек 5 или 10 написали – «пообщаться с библиотекарем»? Подобные факты (гораздо подробнее, чем это сделано здесь) вы опишете в отчете.
     У вас есть, например, возможность, просчитать, много ли среди респондентов вообще и в каждой группе «исключительно деловых» посетителей. Для этого из числа тех, кто назвал деловые мотивы, вычитаем число тех, кто назвал и деловые, и свободные, и тех, что не смогли ответить на вопрос. По массиву их в нашем примере будет почти четверть (24,4%), а в группе школьников – почти половина половины (48,2%). И среди женщин таких окажется больше, чем среди мужчин (16,6% против 10,9%).
     Вы можете провести и более подробный анализ – посмотреть гендерную специфику респондентов в различных группах (хотя, как и в случае с вопросом о библиотечном стаже, – не забывая о небольших абсолютных числах). При этом вы отметите, например, что если смотреть по массиву, «деловых» посетителей среди женщин лишь немногим более, чем среди мужчин, однако соответствующая разница в группах школьников и студентов составляет 20-25%…
     Представим себе также, что вас заинтересовала связь (корреляция) между ответами респондентов на вопрос о библиотечном стаже и на вопрос о целях посещения библиотеки. Компьютерная программа при запросе представит соответствующую информацию. Если же вы обрабатываете материал вручную, придется снова специально заняться группировкой. Теперь надо разложить все исследовательские документы исходя из ответов на вопросы о библиотечном стаже. Список этих ответов составит горизонталь таблицы обработки, а вертикалью будет список ответов на вопрос о целях посещения библиотеки. Результаты обработки документов каждой группы (то есть тех респондентов с тем или иным библиотечным стажем) отражаются в одном столбце. Вы снова последовательно просматриваете документы исследования и отмечаете в соответствующей клетке этого столбца тот или иной ответ. В каждой из этих клеток собирается сумма соответствующих ответов, полученных от респондентов, отнесенных к данной группе. Таким же образом можно вручную получить данные о корреляции ответов на любые два вопроса.
     Таблица первичной обработки по нашим двум вопросам может выглядеть, например, так. Необходимо учесть, что сумма в каждой строке должна соответствовать количеству выборов данного варианта ответов по массиву – поскольку по горизонтали мы разместили альтернативный вопрос о библиотечном стаже. А сумма ответов по вертикали может превышать количество респондентов в данной группе, поскольку вопрос о целях посещения библиотеки – неальтернативный, и каждый респондент мог дать на него несколько ответов.

     Таблица 7. Цели посещения библиотеки у респондентов с различным библиотечным стажем. (Абсолютные числа)

Цели посещения библиотеки Библиотечный стаж Массив
(300)
Пришел впервые
(39)
Менее года
(61)
От года до двух лет
(106)
От двух до пяти лет
(55)
Более пяти лет
(31)
Другие ответы
(8)
найти материалы по теме для учебы, работы13128745124173
найти конкретные материалы для учебы, работы10226431111139
за конкретными книгами «для себя»3163721222101
посмотреть выставки0104207
в надежде найти что-нибудь интересное7185839288158
на массовые мероприятия02218013
встретиться и пообщаться с друзьями, знакомыми6115109041
другое01824015
трудно ответить, не ответил163010020
назвал деловые мотивы13269347134196
назвал свободные мотивы7317246309195
назвал и те, и другие мотивы517432683102

     Таблицу 7 можно использовать для дальнейшего анализа лишь частично. Во-первых, и горизонталь, и вертикаль «другие ответы» нам не нужна содержательно, то же и с информацией о группе не сумевших ответить на вопрос о целях посещения. Во-вторых, хотя многие из впервые пришедших ответили на вопрос, зачем они обычно приходят в библиотеку (практика показывает, что именно так и происходит даже в том случае, если авторы анкеты предупреждают новичков, что делать этого не надо), – их ответы, в общем, не имеют смысла и также не пригодны для анализа. Придется забыть также об указаниях на библиотечные выставки и массовые мероприятия – слишком малы абсолютные числа. Оставшиеся данные пересчитываем на проценты. За 100% принимаем число респондентов в каждой группе.

     Таблица 8. Цели посещения библиотеки у респондентов с различным библиотечным стажем.

Цели посещения библиотеки Библиотечный стаж Массив
(300)
Менее года
(61)
От года до двух лет
(106)
От двух до пяти лет
(55)
Более пяти лет
(31)
найти материалы по теме для учебы, работы19,782,181,838,757,7
найти конкретные материалы для учебы, работы36,160,456,435,546,3
за конкретными книгами «для себя»26,234,938,271,033,7
в надежде найти что-нибудь интересное29,554,770,990,352,7
встретиться и пообщаться с друзьями, знакомыми1,614,218,229,013,7
назвал деловые мотивы42,687,785,541,965,3
назвал свободные мотивы50,867,983,696,865,0
назвал и те, и другие мотивы27,940,647,325,834,0

     Наша работа, как видим, была не напрасна – корреляция очень значима. Кстати, так бывает не всегда; порой приходится просматривать не одну пару вопросов в поисках значимых факторов.
     Итак, (судя по нашему примеру) деловые мотивы особенно характерны для респондентов с библиотечным стажем от года до пяти лет. Значимость свободных мотивов растет вместе с библиотечным стажем. Сравнив эти данные с полученными ранее по социально-возрастным группам, вы можете предположить, происходит ли это только за счет перемен в статусе респондентов или (кроме этого) они все с большим знанием оценивают ваш фонд для свободного чтения… Ваше внимание должно привлечь также соотношение тематических и конкретных (как деловых, так и свободных) запросов, с которыми, судя по их ответам, приходят к вам посетители с различным библиотечным стажем. В общем, здесь есть повод для размышлений.

     Правила чтения и описания таблиц

     К сожалению, мой опыт показывает, что многие библиотечные исследователи нередко путаются в словах и цифрах, когда – устно или письменно – приводят свои данные. Это касается анализа как закрытых, так и открытых вопросов, анализа отдельных таблиц и массива данных в целом.
     Чтобы адекватно анализировать и правильно описывать данные таблиц, вы прежде всего должны помнить, что именно в каждом случае было принято за 100%. А за 100% мы принимаем количество респондентов в группе (группах), те или иные признаки которой (которых) мы характеризуем. Именно по этим признакам мы сравниваем группы, и демонстрируем это в таблице. В статистике принято сравниваемые группы называть подлежащим таблицы, а признаки, характеризующие подлежащее, – сказуемым таблицы.
     В наших таблицах-примерах 3 и 4 подлежащим были социально-возрастные и гендерные группы респондентов, а сказуемым – библиотечный стаж, в таблице 6 при том же подлежащем сказуемым были цели посещения библиотеки. В таблицах 7 и 8 подлежащим стал библиотечный стаж респондентов, а сказуемым – цели посещения. Мы размещали подлежащее в столбцах таблиц, а сказуемое – в строках. Но можно делать и наоборот, если вам удобно – это чисто техническая проблема; просто нужно помнить, где в каждой конкретной таблице расположено подлежащее.
     Путаница часто происходит именно потому, что автор исследования не совсем точно понимает, где группа, а где ее признаки, неверно производит подсчет или просто неверно «читает» таблицу. А при одних и тех же данных, одних и тех же абсолютных числах можно по-разному произвести подсчет процентов и получить разные по содержанию результаты. Сейчас мы попробуем это сделать, взяв уже известные нам данные о библиотечном стаже. Для этого вернемся к таблице-примеру 2 и выделим ту ее часть, которая касается гендерного (полового) линейного распределения.

     Таблица 9 (фрагмент таблицы 2) Библиотечный стаж респондентов. Гендерное распределение. Абсолютные числа

Позиции словаря Массив
(300)
Пол
М
(101)
Ж
(199)
пришел впервые391821
менее года612833
от года до двух лет1063076
от двух до пяти лет551243
более пяти лет31625

      Теперь снова пересчитаем эту таблицу на проценты. Только за 100% на этот раз примем не количество респондентов в каждой социально-возрастной и гендерной группе (как в случае с таблицей 3), а количество респондентов с различным библиотечным стажем (подлежащее, таким образом, теперь будет расположено не встолбцах, а в строках таблицы). И сравним получившиеся данные.

Таблица 10 (фрагмент таблицы 3)
Библиотечный стаж респондентов: гендерное распределение
Таблица 11
Респонденты и респондентки: представленность в группах с различным библиотечным стажем
Позиции словаря
Пол
М (101)
Ж (199)
Позиции словаря
Пол
Массив
М
Ж

Пришел впервые

17,8
10,5

Пришел впервые (39)

46,1
53,9
100

Менее года

27,7
16,6

Менее года (61)

45,9
54,1
100

От года до двух лет

29,7
38,2

От года до двух лет (106)

28,3
71,7
100

От двух до пяти лет

11,9
21,6

От двух до пяти лет (55)

21,8
78,2
100

Более пяти лет

6,0
12,6

Более пяти лет (31)

19,5
80,7
100

Массив

100
100

 

     Цифры, как видим, совершенно различные, и читаются эти таблицы совершенно по разному. Таблица 10: «Среди респондентов-мужчин 17,8% пришли в библиотеку впервые; 27,7% посещают ее менее года…» – и так далее. Таблица 11: «Среди пришедших в библиотеку впервые – 46,1% мужчин, среди посетителей со стажем менее года – их 45,9%…» – и так далее.
     Такого же типа операцию мы можем проделать с таблицей примером 7.

     Таблица 12 (фрагмент таблицы 7) Деловые и свободные мотивы посещения библиотеки у респондентов с различным библиотечным стажем. Абсолютные числа

Цели посещения библиотеки Библиотечный стаж Массив
(300)
Менее года
(61)
От года до двух лет
(106)
От двух до пяти лет
(55)
Более пяти лет
(31)
Другие ответы
(47)
назвал деловые мотивы2693471317196
назвал свободные мотивы3172463616195
назвал и те, и другие мотивы17432688102

     Пересчитаем ее на проценты, принимая за 100% количество респондентов, заявивших о деловых мотивах посещения, о свободных или о тех и других (не забудем при этом, что внутри этих групп могли оказаться одни и те же посетители). И сравним получившиеся данные с представленными в таблице-примере 8.

     Таблица 12 (фрагмент таблицы 8) Деловые и свободные мотивы посещения библиотеки у респондентов с различным библиотечным стажем

Цели посещения библиотеки Библиотечный стаж
Менее года
(61)
От года до двух лет
(106)
От двух до пяти лет
(55)
Более пяти лет
(31)
назвал деловые мотивы42,687,785,541,9
назвал свободные мотивы50,867,983,696,8
назвал и те, и другие мотивы27,940,647,325,8

     Таблица 13 Библиотечный стаж респондентов «деловых» и «свободных» респондентов

Цели посещения библиотеки Библиотечный стаж Массив
(300)
Менее года От года до двух лет От двух до пяти лет Более пяти лет Другие ответы
назвал деловые мотивы (196)13,347,424,06,68,7100
назвал свободные мотивы (195)15,936,923,615,48,2100
назвал и те, и другие мотивы (102)16,742,225,57,87,8100

     Как видно, и здесь цифры различны. Обратите внимание, что в таблице 13, где подлежащим является характеристика респондента как «делового» или (и) «свободного», сумма по строке действительно равна 100%. Чтобы это было яснее, я специально добавила в эту таблицу столбец «другие ответы» (сюда присчитаны и те, кто пришел в библиотеку впервые), который, как мы решили раньше, содержательно ничего не дает. Это происходит потому, что вопрос о библиотечном стаже (сказуемом таблицы) был альтернативным, на него респондент мог дать только один ответ. В таблице же 12, где сказуемым являлся список дополнительных позиций словаря, в котором могла быть отмечена одна, две или три позиции, или не отмечена вообще ни одна (если, например, респондент не ответил на вопрос), – сумма по столбцу (где представлено сказуемое таблицы) не равна 100%.
     Таблица 12 может читаться следующим образом: «Среди респондентов, посещающих библиотеку менее года, 42,6% назвали обычными деловые мотивы посещений, 50,8% назвали свободные мотивы…» – и так далее. Таблица 13 читается следующим образом: «Среди тех, кто назвал обычными деловые мотивы посещения библиотеки, 13,3% посещают ее менее года, 47,4% – от года до двух лет…» – и так далее.
     Типичными для большинства отчетов об исследованиях являются таблицы, где в качестве подлежащего выступают социально-демографические характеристики респондентов. Однако могут использоваться и другие варианты, о которых мы здесь говорили. Внимательный просмотр полученных данных позволит вам увидеть, как выгодней, красивей их «повернуть». Конечно, компьютерные программы предоставляют в этом смысле несравненно большие возможности, чем ручная обработка данных.

     Графики и диаграммы

     Цифровые данные могут быть представлены не только в виде таблиц, на и в виде различного рода диаграмм. Сейчас это становится все более принятым среди библиотечных исследователей – прежде всего потому, что у них появились компьютеры.
     Пакет Microsoft Office предоставляет возможность создавать диаграммы различного типа в программах Word и Excel. Но рисовать их можно и вручную. Однако в любом случае следует помнить о своих возможностях в смысле представления диаграмм в цвете. Конечно, можно обойтись и сочетанием бело-серо-черных тонов с различным рисунком, но это создает сложности и в воспроизведении, и в восприятии.
     Чтобы получить нужную диаграмму с помощью программы Microsoft Word, надо произвести ряд операций. Выбираем в меню: «Вставка», затем «Объект», затем «Диаграмма Microsoft Graph». Получаем картинку, состоящую из таблицы и диаграммы. В таблицу надо вставить нужные данные, учтя при этом что ответы на вопрос-подлежащее должны располагаться по вертикали (каждый вариант – строка). Далее в появившемся меню «Диаграмма» выбираем предпочитаемый тип и форму диаграммы. Опция «Тип» определяет, какая именно диаграмма (круговая, столбиковая, гистограмма, график и т.д) будет отображена.
     Опция «Параметры» позволит сделать подписи, расположить цифровые данные и так называемую «легенду» – список условных знаков (цветов, линий и т.п.) с указанием, что или кого они обозначают. Например, сектор, столбик или линия определенного цвета может обозначать данные о той или иной группе респондентов.
     С помощью круговой диаграммы можно показать линейное распределение ответов на тот или иной вопрос. То есть эта диаграмма заменяет один столбец (или одну строку) таблицы. Например, вы можете представить линейное распределение по социально-возрастным группам наших прежних 300 респондентов: 112 школьников, 64 студентов, 47 работающих и 77 пенсионеров. Если вы работаете с программой Microsoft Word, в появившуюся после вышеперечисленных операций таблицу вы вставите соответствующие проценты. Выбрав тип «круговая», получим следующую диаграмму.

     Диаграмма 1. Социально-возрастные группы респондентов

     В гистограмме могут быть наглядно представлены данные небольшой таблицы (небольшой – поскольку большое количество ее строк или столбцов, переведенное в диаграмму, приведет к ослаблению наглядности). Например, можно показать на гистограмме библиотечный стаж респондентов из различных социально-возрастных групп (эти данные были представлены у нас в таблице-примере 3). Причем, из одной и той же таблицы (при одном и том же подлежащем) может получиться две гистограммы: в первом случае «собираются» данные по группе, во втором – по библиотечному стажу. Изменение происходит, если в меню выбрать «Данные», затем последовательно два предлагаемых варианта – «ряды образуют столбцы» и «ряды образуют строки». Вот как выглядят получившиеся диаграммы.

     Диаграмма 2. Социально-возрастные группы: библиотечный стаж респондентов

     Диаграмма 3. Библиотечный стаж респондентов: социально-возрастные группы

     Каждая из диаграмм достаточно наглядна, вы сможете выбрать любую, в зависимости от того, как строите материал в отчете.
     Эти же данные вы можете представить в виде графика (в программе Microsoft Word графики даны как один из видов диаграмм). Тогда они будут выглядеть следующим образом.

     График 1. Библиотечный стаж респондентов: социально-возрастные группы

     Если вы работаете вручную, или у вас проблемы с цветным изображением, графики легче строить, чем диаграммы.
     Microsoft Word и Microsoft Excel дают возможность строить и другие типы диаграмм. Делая свой выбор, ориентируйтесь на содержание вопроса, на полученные цифры; старайтесь «подать» свои результаты не только правильно, но наиболее понятно и наглядно.

     Обработка и анализ ответов на открытые вопросы

     Библиотечные исследователи любят задавать своим респондентам открытые вопросы. Но у них далеко не всегда хватает умения и терпения обработать полученную информацию. С богатого материала зачастую лишь «снимаются пенки», а порой его просто бросают необработанным. Просматривая анкеты или бланки, авторы порой даже радуются, что многие респонденты не ответили на такие вопросы.
     Обработка и анализ этих данных действительно сложны и трудоемки. При этом не всегда помогут даже компьютерные программы. Поэтому советую вам: при подготовке исследовательских документов рассчитывайте свои силы, не злоупотребляйте открытыми вопросами. Но если уж вы их задали и получили ответы – не теряйте эту информацию, не менее, а часто и более интересную, глубокую, чем информация из закрытых вопросов.
     Представим, что уже знакомым нам 300 респондентам вы предлагаете перечислить материалы, на которые они в вашей библиотеке получали отказы. Одни посетители называют темы, другие – разделы фонда, третьи – конкретные названия книг или журналов, четвертые – авторов. Все это очень ценная информация, обязательно соберите ее в какой-то отдельный список, она не только украсит ваш отчет об исследовании, но безусловно пригодится, например, отделу комплектования.
     Однако кроме этого (а может быть, и до этого) полезно преобразовать и сгруппировать полученные данные. Если вы пользуетесь компьютерной программой, имеет смысл поработать со словарем обработки (ДА-система, например, дает в этом плане много возможностей). Критерии группировки зависят, конечно, от цели и содержания исследования. Можно выделить, например, художественную и нехудожественную литературу, периодику. Внутри художественной – отечественную и зарубежную; классику, фантастику, детектив, любовный роман. Внутри нехудожественной – научную, учебную, популярную; гуманитарную, техническую, естественнонаучную (или более дробно). Но при дроблении советую вам всегда оставлять в словаре и более общие признаки – мы уже говорили об этом раньше. Например, наряду с позициями «назвал литературу по экономике», «… по истории», «… по литературоведению» – ввести позицию «назвал литературу гуманитарного профиля»; и еще более общие позиции – «назвал художественную…», «… нехудожественную». Если это сложно, лучше отказаться от дробных признаков, оставив только общие.
     Если же вы ведете обработку вручную, будет проще открытые вопросы обрабатывать отдельно. Например, представим, что тем же 300 респондентам был задан вопрос о последних прочитанных книгах и журналах (не обязательно библиотечных). Ответил на него только каждый второй – 150 человек. И только 100 назвали что-то конкретное. Остальные написали примерно так: «какой-то детектив», «любовный роман, названия не помню», «читал только учебники», «разные журналы», «вообще ничего не читал». Впрочем, некоторые из тех 100, кто дал конкретные ответы, тоже прибавили к ним нечто подобное.
     Как обработать этот массив? Действуйте тщательно и последовательно. Сначала выделите всех давших хоть какой-то ответ. Из них отберите тех, кто ответил, что ничего не читал (допустим, их было 10 человек).
     Далее проанализируйте, какие жанры, темы, типы литературы и периодики встречаются в ответах. Как часто они встречаются? У представителей каких социально-возрастных и гендерных групп? Можно ли предположить мотивы (деловые или свободные) по которым те или иные респонденты обращались к тем или иным материалам? Ваши заметки могут быть сведены во что-то подобное таблице и выглядеть, например, таким образом:

     Таблица 14. Последние прочитанные книги

Типы, жанры, темы и т.п. Количество и группы респондентов Авторы и названия
Художественная 63. Все группы  
Классика 40. В основном, учащиеся  
Детективы 36. Студенты, работающие Донцова (12 человек)
Фантастика, фэнтези 50. Школьники, студенты, работающие. Больше мужчин Гарри Поттер (10 человек, в основном, школьники)
Любовные романы 56. В основном, женщины  
…………    
Нехудожественная
(кроме учебной)
67 человек. Больше учащихся  
Экономика 13. Студенты  
Литературоведение 22. Школьники и студенты  
История 28. Все группы  
Мемуары 19. В основном, пенсионеры  
…………    
Учебники и пособия 52. В основном учащиеся  
…………    
Журналы 63. Все группы Чаще массовые иллюстрированные
…………    
Всего дали ответы этого типа 80 человек  

     Понятно, что один и тот же респондент мог читать и художественную, и нехудожественную литературу, и учебники, и журналы. Соответственно информация о нем попадет в разные клетки.
     Подлежащим в этой таблице являются люди (респонденты), а не книги. Поэтому описывать ее надо, например, так: «Почти половина респондентов, ответивших на это вопрос, заявили, что в последнее время читали детективы. Большинство среди них работают или учатся в вузах. Из авторов чаще всех звучало имя Дарьи Донцовой (ее романы назвали 12 человек)…». К сожалению, описывая такого рода данные, многие библиотекари делают ошибки, говоря «большинство прочитанных книг», «прочитано 36 детективов»…
     Вы можете составить эту таблицу по-другому, или вообще вести записи не в форме таблицы. Важно, чтобы реальная полученная вами информация была отражена в них как можно полнее.
     Что касается книг и журналов, то очень интересным для анализа будет список всех конкретных материалов, названных респондентами. Если какие-то из них вам неизвестны, постарайтесь установить (лучше, конечно, сделать это сразу – в процессе сбора данных), что это за издания.
     Анализ ответов на открытые вопросы может быть связан также с выделением тем, смысловых единиц, часто употребляемых слов и понятий, то есть с использованием элементов контент-анализа. Например, респондентам исследования «Современная библиотека и ее юношеские аудитории», которое велось социологами Российской государственной юношеской библиотеки в 2000–2001 гг., предлагалось продолжить фразу «Современная библиотека – это…». При обработке был выделен ряд слов и словосочетаний, которые (с одной стороны) мы сами считали важными для характеристики современной библиотеки и которые (с другой стороны) неоднократно встречались в ответах. Список выглядел следующим образом:

• Книги, литература
• Журналы, газеты
• Чтение, читатель
• Библиотекарь, сотрудник библиотеки
• Обслуживание
• Здание, помещение, зал
• Оборудование
• Удобство, комфорт, уют
• Информация
• Компьютер
• Интернет
• Интерес, интересное
• Новое, новинки
• Современное

     В каждом из полученных ответов отмечались слова и словосочетания из списка, далее подсчитывалась соответствующая сумма. Впоследствии, в соответствии с полученными результатами, список пришлось несколько уточнить, однако основа его сохранилась; были сделаны достаточно интересные выводы о представлениях школьников и студентов, юношей и девушек, жителей столицы и провинциального города – о современной библиотеке.
     Такого же типа работу вы можете проделать, если интересовались мнением респондентов о вашей библиотеке, библиотекарях, о будущем библиотечной профессии и т.п. (такие вопросы, насколько я знаю, сейчас довольно популярны среди библиотечных исследователей).



главная библиотекам читателям мир библиотек infolook виртуальная справка читальный зал
новости библиоnet форум конкурсы биржа труда регистрация поиск по порталу


О портале | Карта портала | Почта: info@library.ru

При полном или частичном использовании материалов
активная ссылка на портал LIBRARY.RU обязательна

 
  Rambler's Top100
© АНО «Институт информационных инициатив»
© Российская государственная библиотека для молодежи