Поршнев С.В.,
кандидат технических наук,
Разинков С.Л. 
кандидат исторических наук

Опыт создания базы данных «Советские немцы — трудармейцы Тагиллага»

     Одним из динамично развивающихся направлений социальной истории являются просопографические исследования, заключающиеся в изучении определенных социальных групп на основе индивидуальных биографических данных их представителей. Хранящиеся в Муниципальном архиве социально-правовых документов (МАСПД) г. Нижнего Тагила документы персонального учета трудармейцев (учетные карточки и личные дела, взятые в комплексе с другими материалами, характеризующими жизненные пути бывших трудармейцев Тагиллага после 1946 г.[1] позволяют с максимальной достоверностью восстановить социальный портрет и судьбы мобилизованных советских немцев. Как первый шаг к этой цели в 2000 г. под руководством д-ра ист. наук В. М. Кириллова в Проблемной научно-исследовательской лаборатории «Банк данных: Нижнетагильский регион в XX веке» Нижнетагильского государственного педагогического института (НТГПИ) на основе учетных карточек трудармейцев была создана ранее упоминаемая электронная база данных «Советские немцы — трудармейцы Тагиллага».
     Карточки, заполненные в период существования трудармейских формирований из граждан СССР немецкой национальности (1942–1946), содержат данные по двум разделам (см. Приложение 1): в первом сосредоточены персональные биографические сведения и социодемографические характеристики трудармейца (ФИО, возраст, место рождения и жительства до мобилизации и т.д.); во втором — информация о его мобилизации и пребывании в рабочей колонне на объекте НКВД (Тагиллаге или Богословлаге).
      Необходимо отметить, что карточки персонального учета трудармейцев начали заводиться в соответствии с указаниями временной инструкции ГУЛАГа на формулярах учетных карточек заключенных только с 19 мая 1942 г., т. е. через три месяца после прибытия в Тагиллаг первого эшелона с мобилизованными немцами. Вследствие этого в части учетных карточек трудармейцев, уже выбывших из лагеря к этому времени (в результате побега или смерти), содержатся только их фамилии, имена и отчества, а также год рождения или возраст. Остальные поля карточки, очевидно, заполнялись со слов мобилизованного и не подтверждались соответствующими документами. Данный вывод подтверждается обнаруженными нами многочисленными разночтениями в географических названиях, фамилиях и даже в написании райвоенкоматов, проводивших мобилизацию.
В МАСПД в картотеках трудармейцев Тагиллага и Богословлага находится соответственно более 7,3 тыс. и около 20,5 тыс. карточек персонального учета, однако число карточек несколько превышает общее количество трудармейцев, прошедших через рабочие колонны того или иного лагеря. Например, при возвращении в рабочую колонну трудармейца, ранее выбывшего оттуда в результате осуждения, на него зачастую заполнялась новая карточка персонального учета, в которой номер личного дела, а иногда и фамилия отличались от зафиксированных в первоначальной карточке. Кроме того, в картотеке Тагиллага вместе с трудармейцами числились интернированные граждане Германии и «окруженцы» — военнослужащие Красной Армии, попавшие в плен к противнику и впоследствии репатриированные на территорию СССР.
     Особенности источника — стабильность по составу документов, преемственность в содержании и форме, высокая степень структурированности позволили поместить всю информацию учетной карточки в рамки стандартной реляционной базы данных (БД). Из большого количества систем управления базами данных (СУБД), представленных в настоящее время на российском рынке прикладных программных средств, нами был выбран пакет Access97, являющийся высокопроизводительной 32-разрядной системой управления реляционными БД. Пакет Access97 предназначен как для разработки локальных БД, так и для создания распределенных БД (архитектура клиент — сервер), работающих под управлением операционных систем WINDOWS 95–2000, WINDOWS NT. Наш выбор был определен тем, что пакет Access, с одной стороны, включает в себя сложные функции и является прекрасным инструментом для профессионального разработчика приложений, с другой, его использование не вызывает проблем у непрофессиональных пользователей, включая и тех, кто раньше не работал с СУБД.
     Структура базы данных представлена в Приложении 2. БД состоит из двух таблиц и 37 полей, содержащих основные персональные характеристики (ФИО, возраст, пол), а также информацию о месте рождения, роде занятий, уровне образования, социальном происхождении и социальном положении, сведения о перемещениях трудармейца и видах выполняемых им работ. Для уточнения и автоматической корректировки вводимой информации БД в дальнейшем предполагается связать с внешними справочными базами данных, из которых к настоящему времени авторами уже созданы справочники имен (БД «Имена») и географических названий (БД «Регион»).
     Принципы формирования описываемой БД, впрочем, как и большинства реляционных источнико-ориентированных баз данных (независимо от типа источника)[2], предусматривают точное воспроизведение содержания источника. При этом кодирование качественных признаков, дает возможность проводить агрегирование и корректировку вводимой информации, а также поиск и анализ данных.
      Работа с описываемой БД состояла из следующих этапов.
1. Ввод информации в БД
Ввод информации осуществляется с помощью специальной графической формы, представленной в Приложении 3. На данном этапе оказалось наиболее важным избежать ошибок ввода, а также определить и исправить некоторые неточности источника, чтобы облегчить обработку информации в дальнейшем. Для этого мы проводили корректировку написания имен, используя внешнюю БД «Имена», и географических названий, используя внешнюю БД «Регион», содержащую информацию до уровня названий районов, а для территории АССР немцев Поволжья — до уровня названий населенных пунктов.
2. Обработка и анализ результатов
      Математическое обеспечение базы данных и процедуры, внедренные в тело БД, поддерживают следующие возможности, облегчающие обработку и повторный анализ данных (к настоящему времени реализованные частично):
  1. группировка и выборка данных, отвечающих заданным условиям (расчленение генеральной совокупности по одному или нескольким признакам).
    Модуль, написанный на языке программирования Visual Basic с использованием языка SQL (язык управления реляционными базами данных), позволяет создавать разнообразные запросы и получать соответствующие выборки по 22 признакам и их комбинациям с последующим графическим представлением результатов выборки. Форма, позволяющая создавать запросы, представлена в Приложении 4.
    Например, автоматическая выборка позволила выделить записи, относящиеся к трудмобилизованным советским немцам. При этом оказалось, что из 7353 чел., числящихся в картотеке трудармейцев Тагиллага, большая часть являлась именно советскими немцами, но кроме них в картотеке и БД представлены интернированные немцы из Германии, репатриированные советские граждане, а также трудармейцы других национальностей. Следующий простейший алгоритм выборки позволил «отслоить» все остальные категории, кроме советских немцев:
    Национальность
    № личного дела
    Подданство
    Кем мобилизован
    = немец
    <> Null
    = СССР
    <> Null
  2. графическое отображение информации (в том числе результатов выборки) в виде диаграмм и графиков.
    В БД предусмотрена возможность графического отображения информации (в том числе результатов выборки) о поле, возрасте, социальном происхождении, партийности, национальности, образовании, профессии, дате мобилизации, объекте работы, причине и дате убытия трудармейцев. В Приложении 5 показаны формы графического представления результатов обработки БД.
    Необходимо отметить, что наибольшие сложности возникли с отображением сведений о профессиональной деятельности трудармейцев до их мобилизации, оказавшихся далеко не однозначными. В нашем случае за основу была взята классификация профессий по словарю переписи 1939 г., подвергнутая дополнительной группировке.
    3. Использование БД в составе более обширного банка данных по истории репрессий
    Дальнейшая перспектива использования БД «Советские немцы–трудармейцы Тагиллага» состоит во включении данной базы данных в состав более крупных банков данных (в первую очередь в рамках «Единого электронного банка данных жертв политических репрессий в СССР»[3]), что потребует определенной доработки БД.
    Кроме учетной карточки с достаточно ограниченным набором данных в различных государственных и ведомственных архивах существует большое количество массовых источников (личных дел, учетных карточек, анкет), содержащих более обширные сведения о различных аспектах жизни персоналии в тот или иной временной период: составе семьи, трудовой и общественно-политической деятельности, судимости и т. д. (см. Приложение 4). Для перевода сведений этих источников в машиночитаемый вид необходимо создание более обширной БД, к построению которой существует, как минимум, два подхода.
    Логичным и более простым с точки зрения технического воплощения является применение подхода «от человека» (назовем его «персонально-ориентированным подходом», так как структура БД в данном будет строиться вокруг проблем, ключевых мест в жизнедеятельности определенного человека — «семья», «осуждение», «образование» и т. д.). В то же время необходимо отметить, что существует ряд аргументов в пользу использования в БД и элементов подхода «от источника» (можно назвать его «источнико-ориентированным подходом»):
  3. в реальной практике ввод информации в БД будет происходить таким образом, что каждая категория пользователей будет иметь дело только с одним определенным типом источника, иллюстрирующим какой-либо один период в жизнедеятельности персоны и содержащим ограниченный набор признаков. Это делает ненужным (для этой категории пользователей) наличие в БД большого количества «проблемно-ориентированных форм». И наоборот, для таких пользователей оптимальным был бы ввод данных только в одну «источнико-ориентированную» форму, внешне повторяющую структуру источника;
  4. недостаточная квалификация пользователей, непосредственно осуществляющих ввод данных, при работе с комплексом источников (содержащих массу разночтений) и многочисленном наборе «проблемно-ориентированных» форм ввода может привести к неверному разнесению информации источника по полям БД;
  5. данные различных источников могут разниться, при этом оба расхождения должны быть зафиксированы с указанием источника;
  6. часть данных носит динамический характер, т. е. со временем может изменяться (семейное положение, количество и состав родственников, партийность, образование и т.д.), поэтому в различных по времени составления источниках может быть зафиксировано различное значение одного признака. При этом путь фиксации в поле одного, «верного» (например, последнего по времени) значения и отбрасывания остальных некорректен.
     С учетом вышеизложенного мы предлагаем следующий подход к построению БД. Придерживаясь «проблемно-ориентированной» структуры БД на уровне хранения данных (см. Приложение 5), придать ей «источнико-ориентированный» интерфейс: набор форм, повторяющих структуру наиболее распространенных источников (наряду с наличием обычных «проблемно-ориентированных» форм, не связанных с источником, — «Приговор», «Члены семьи», «Трудовая деятельность» и т.д.). Преимуществом предложенной схемы является возможность «эмулировать» один или несколько источников практически без потери содержащейся в них информации, в том числе и с учетом разночтений.
Таким образом, описываемая БД «Советские немцы-трудармейцы Тагиллага» может быть использована для характеристики социального портрета значительной по составу этносоциальной группы. Авторами также определены подходы, реализация которых позволит включить описанную БД в состав более обширных банков данных для изучения «жизненных путей» советских немцев.

[1]К таким документам можно отнести: личные дела спецпоселенцев, (хранятся в Информационном Центре ГУВД Свердловской области), личные дела немцев-работников Тагиллага и треста Тагилстрой и т.д.
[2]См., например: Аханчи П. Исторические базы данных как современное направление изучения массовых источников // Круг идей: Развитие исторической информатики. М., 1995. С.28.
[3]Проблемы создания единого электронного банка данных жертв политических репрессий в пределах бывшего СССР: Сборник докладов участников международной научно-практической конференции. Нижний Тагил, 18-21 мая 2000 г. Нижний Тагил: Пед. ин-т, 2001.


Приложение 1
Учетная карточка трудармейца
(на бланке учетной карточки заключенного)

А) лицевая сторона

лицевая сторона учетной карточки трудармейца

Б) оборотная сторона

оборотная сторона учетной карточки трудармейца

Источник: Муниципальный архив социально-правовых документов. Картотека трудармейцев Тагиллага.


Приложение 2
Структура БД «Советские немцы - трудармейцы Тагиллага»
Структура БД "Советские немцы - трудармейцы Тагиллага"

Примечание. К - в поле содержится код признака, значения которого находятся в отдельных таблицах (на схеме не показаны); Т- текстовое поле; Д - в поле содержится дата; Ч - числовое поле


Приложение 3
Графическая форма для ввода информации из учетной карточки в БД
Графическая форма для ввода информации из учетной карточки в БД

Приложение 4
Форма для получения выборок по определенным признакам
Форма для получения выборок по определенным признакам

Приложение 5
Примеры графического отображения информации БД
Распределение трудмобилизованных по социальному происхождению
Рис. 5.1. Распределение трудмобилизованных по социальному происхождению

Распределение трудмобилизованных по национальностям
Рис. 5.2. Распределение трудмобилизованных по национальностям

Распределение трудмобилизованных по профессиональному составу
Рис. 5.3. Распределение трудмобилизованных по профессиональному составу, группы профессий:

1- квалифицированные сельскохозяйственные профессии; 2 – прочие сельскохозяйственные профессии; 3 – занятия металлистов; 4 – занятия деревоотделочников; 5 – занятия текстильщиков, швейников, кожевников, обувщиков; 6 – занятия пищевиков; 7 – строительные специальности; 8 –чернорабочие; 9 – прочие занятия рабочих; 10 – инженерно-технический персонал; 11 – медицинские работники; 12 – культурно-политико-просветительский персонал и работники искусства; 13 – планово-контрольный и учетный персонал, работники торговли и складского хозяйства; 14 – по прочим видам занятий служащих; 15 – учащиеся;16 – не определены по группам;17 – нет данных)


Приложение 6
Источники, характеризующие судьбу граждан СССР немецкой национальности, мобилизованных в военизированные трудармейские формирования (1942-1955)
Источники, характеризующие судьбу граждан СССР немецкой национальности, мобилизованных в военизированные трудармейские формирования (1942-1955)

Приложение 7
Предполагаемая структура БД
Предполагаемая структура БД