Кодирование

КОДИРОВАНИЕ материалов переписи, обследования населения, присвоение условных обозначений (кодов) сведениям, полученным при переписи, обследовании населения или текущем учете демографических событий, а также другим индивидуальным или групповым данным для обеспечения их восприятия, переработки и хранения средствами вычислительной техники. Обычно условные обозначения представляют собой цифровой код в десятичной системе счисления, который присваивается каждому ответу, записанному словами в переписном листе, бланке обследования или др. документе первичного учета (например, пол: мужской - 1, национальность: якут - 35, занятие: зоотехник - 214 и т. д.). По месту и времени различают три способа кодирования: регистраторами (счетчиками переписи) в процессе опроса людей; специально подготовленными работниками по окончании переписи, обследования населения или по мере поступления документов для обработки; производное по отношению к первым двум, так называемое вторичное автоматическое кодирование при обработке информации на ЭВМ, которое производится на основании кодов, предварительно проставленных вручную в переписных листах, бланках обследования или других документах.

Первый способ кодирования обеспечивается наличием в переписных листах (бланках обследования, анкетах и других документах) заранее напечатанных вариантов ответов на вопросы и кодов каждого варианта. Счетчик переписи, подчеркивая в ходе опроса соответствующий ответ и его код, тем самым кодирует вариант ответа. Такой способ наиболее эффективен при ручном кодировании, так как не требует специальных затрат времени и средств на организацию кодирования. Однако так можно кодировать ответы лишь на те вопросы, число вариантов ответов на которые сравнительно невелико и их несложно предварительно разместить в соответствующей зоне переписного листа (бланка обследования), например, пол, состояние в браке, образование, общественная группа и т. п. Кодирование сведений счетчиком переписи в ходе опроса широко применяется при Всесоюзных переписях населения и переписях населения за рубежом. При этом кодирование производится путем подчеркивания одного из заранее отпечатанных вариантов ответа и его цифрового кода (Всесоюзная перепись населения 1970 года), проставления против соответствующего ответа цифры кода, заштрихованного кружка, прямоугольника или какого-либо другого знака, либо - чаще - проставления графической метки на машиночитаемых документах (Всесоюзная перепись населения 1979 года, переписи населения ГДР, Японии, ФРГ, Малайзии и др.).

Второй способ кодирования заключается в проставлении кодов в переписном листе (бланке обследования) на основании словесных записей, сделанных счетчиком переписи. Он применяется обычно в отношении более сложных вопросов, варианты ответов на которые из-за их разнообразия слишком многочисленны и не могут быть напечатаны на переписных листах (например, место работы, занятие), а само кодирование выполняется централизованно специально подготовленным персоналом. Этот способ наиболее трудоемкий, так как требует применения специальных пособий: инструкций, списков, справочников, алфавитных и систематических словарей. Трудоемкость, а следовательно, и качество ручного кодирования прямо зависят от значности (разрядности) кодов и легкости их запоминания. Поэтому коды с наименьшей значностью, а также легко запоминающиеся (1, 5, 10, 99, 222 и т. п.) присваиваются наиболее часто встречающимся значениям признаков. Коды в переписном листе (бланке обследования) проставляются либо рядом с записью ответа на соответствующий вопрос (Всесоюзная перепись населения 1970 года), либо, обычно на машиночитаемых документах, в специальной зоне документа (Всесоюзная перепись населения 1979 года). При вводе информации вручную с внешних устройств в ЭВМ может быть введена и словесная запись ответа, на основании которой машина автоматически подбирает нужный код (например, так называемый метод колибри, перепись населения Франции 1970 года).

Третий способ кодирования возможен только в случае применения ЭВМ для разработки материалов переписи, обследования населения. В соответствии со специальным алгоритмом машина, на основании проставленных вручную кодов или их сочетаний, автоматически формирует необходимые производные коды, например, код типа семьи на основании кодов отношения к главе семьи, пола, возраста, состояния в браке каждого члена семьи, а также числа членов семьи (Всесоюзная перепись населения 1979 года). Производное кодирование дает возможность группировать индивидуальные данные по любым сочетаниям признаков.

Если кодирование производится вручную, то его качество, как правило, контролируется вручную или на ЭВМ. При контроле вручную качество кодирования обычно проверяется визуально, часто даже выборочно (Всесоюзные переписи населения 1970 и 1979 годов). Контроль кодирования на ЭВМ производится путем выделения логически несовместимых сочетаний значений признаков и автоматического исправления ошибок (см. Разработка материалов переписи).

Н. Э. Шварцер.

Демографический энциклопедический словарь. — М.: Советская энциклопедия. Главный редактор Д.И. Валентей. 1985.

Понятие: