УДК: история создания, структура и возможности
Писарик В.А., заведующий сектором отдела каталогизации документов РНТБ
Хорошо сделанная Наука – это Система, а система – это классификация. Обширная, нормальная, регулярная Деятельность – это осуществленный Порядок, а порядок – это классификация. Полноценная чувствительность – это Гармония впечатлений и чувств, а гармония – это классификация. Так в классификации как в интеллектуальном инструменте высшего синтеза должны встретиться и системы мысли, и порядок действий, и гармония чувствительности.
Поль Отле
Идея создания универсального языка занимала умы великих философов и ученых многие столетия. Можно ли придумать алфавит человеческих мыслей, затем на его основе отобрать и упорядочить наиболее ценные теоретические суждения и научные открытия и, как следствие, логически сконструировать такой всеобщий инструмент мышления, который сделал бы общение и понимание между людьми всего мира компактным, понятным и совершенным? Концепция представляется весьма воодушевляющей. Но насколько реально воплотить ее в жизнь?
Сложность изучения любого языка в целом всегда целесообразно рассматривать в двух измерениях: с точки зрения его функции как средства общения между людьми и с точки зрения его внутренней организации как части знаковой системы. Но в век информационных технологий имеет смысл очертить еще и третье измерение – компьютерную лингвистику, связанную прежде всего с обеспечением взаимодействия человека с ЭВМ, а также с теорией и практикой информационно-поисковых систем (ИПС). Данное междисциплинарное направление значительно расширяет границы исследования универсального языка, позволяет увидеть в новом давно забытое старое.
Рассмотрим историю создания и структуру известного информационно-поискового языка, наиболее известного нам как Универсальная десятичная классификация (УДК). В библиотечных информационно-поисковых системах данный язык используется для смысловой обработки документов и информационного поиска. В то же время не стоит забывать, что УДК является международной классификационной системой знаний.
Вспомним слова о назначении УДК, сказанные Полем Отле, одним из создателей классификационных таблиц: «Как классификационная схема УДК задает рамки, в которых идеи могут по-разному соподчиняться. Как система библиографической записи она может стать подлинной пасиграфией, способной отразить все нюансы идейно-библиографического анализа при помощи цифр, сгруппированных в числа, имеющие самостоятельное и постоянное значение» [6, с. 25].
Употребление слова «пасиграфия», или «пазиграфия», которое в переводе с древнегреческого означает «всеобщее письмо», в данном контексте не случайно. Бельгийский ученый возлагал огромные надежды на свое творение.
Пазиграфии, согласно российскому исследователю теории лингвоконструирования Николаю Сергеевичу Кузнецову, являлись первыми попытками создания логического, «философского» международного языка, неоценимый вклад в развитие которого внесли в свое время известные математики Рене Декарт (1596-1650) и Готфрид Вильгельм Лейбниц (1646-1716) [4].
В письме аббату Мерсенну от 20 ноября 1629 года Рене Декарт изложил радикальное предложение, послужившее впоследствии стимулом для развития новых логико-философских представлений о создании универсального языка в ту эпоху.
«Если бы кто-то дал правильное объяснение тому, как свести в систему и структурировать простейшие идеи, выделенные из общего массива человеческих мыслей, и если бы это объяснение было принято обществом, я рискнул бы допустить возможность появления универсального языка, который легко было бы выучить, на котором легко было бы говорить и писать и, главное, который помог бы человечеству в суждениях, предоставляя для этого настолько очевидные основания, что ошибиться было бы просто невозможно. Сравните с тем, что мы имеем сейчас: почти все наши слова обладают спутанными смыслами, и человеческие умы за длительное время настолько к ним привыкли, что сложно найти что-то, что они понимали бы в совершенстве. Я с уверенностью заявляю, что существование такого языка возможно, и что наука, которая от него зависит, будет открыта, таким образом, обыватели смогут рассуждать об истине более компетентно, чем современные философы» [7].
В языковой концепции Рене Декарта, как мы видим, была намечена настоящая программа реформирования естественного языка с целью установления математически точного порядка в человеческих понятиях и суждениях.
Другой видный ученый, Готфрид Вильгельм Лейбниц, высоко оценив теоретические выкладки Рене Декарта, предложил рассмотреть в качестве всеобщей науки, о которой мечтал его коллега, науку универсальной характеристики, служащую «самому возвышенному и самому экономичному употреблению человеческого разума с помощью символов и знаков» [5, с. 107].
Можно сказать, Лейбниц еще в конце XVII века заложил прочный научный фундамент для дальнейшего построения универсального языка классификационного типа.
На наш взгляд, Универсальная десятичная классификация полностью соответствуют философскому и математическому идеалу ученого как система «каталогизации человеческих мыслей и синтеза нового знания на основе комбинаторики простых элементов мышления» [5, с. 16]. В соответствии с комбинаторным методом Лейбница индекс УДК также создает новые сложные понятия на основе известных простых, что позволяет свести все научное знание к простому методу логико-числовых исчислений.
«После того как однажды будут установлены характеристические числа для большинства понятий, род человеческий обретет своего рода новый «органон», который значительно сильнее будет содействовать могуществу духа, чем оптические стекла содействовали силе глаз, и который будет настолько же превосходнее микроскопов и телескопов, насколько разум выше зрения. И никогда мореплавателям не приносила столько пользы магнитная стрелка, сколько принесет пользы эта Полярная звезда переплывающим море опытов. Все остальное, что отсюда будет следовать, находится в руках судеб, но оно не может не быть великим и благотворным» [5, с. 77].
Вернемся к истории создания Универсальной десятичной классификации. В 1895 году бельгийские ученые Поль Отле (1868-1944) и Анри Лафонтен (1854-1943) выдвинули новаторскую идею о необходимости разработки Универсального библиографического репертуара (УБР) – «каталога, включающего в себя информацию о всех документах, когда-либо напечатанных в мире» [2, с. 67–70]. Для реализации подобного проекта необходимо было организовать мировое сотрудничество ведущих ученых того времени в сфере научной коммуникации, а также детально продумать новый классификационный язык, который помог бы в систематизации всего научного знания. Цель казалось неосуществимой. Но в том же году Поль Отле случайно приобрел один экземпляр «Десятичной классификации» Мелвила Дьюи. Ее детальность поражала. Эта удивительная находка сменила порыв отчаянья надеждой. Поль Отле и Анри Лафонтен предположили, что если данную классификацию немного изменить и доработать, то ее коды могут стать новым универсальным языком, они будут отражать «связи, даже происхождение идей и предметов, их взаимозависимость и соподчинение, их сходство и различие…» [6, с. 25].
В 1895 году по инициативе Поля Отле и Анри Лафонтена и при поддержке бельгийского правительства была проведена первая Международная библиографическая конференция, на которой предложения ученых о создании Универсального библиографического репертуара и нового библиографического классификационного языка приняли с большим энтузиазмом. Для реализации намеченной программы был учрежден Международный библиографический институт, штаб-квартирой которого в Брюсселе стало Международное библиографическое бюро.
Институту поручалось разработать Универсальную десятичную классификацию. Эта классификация была создана, приобрела широкий размах и популярность и сыграла огромную роль в развитии мировой теории и практики информационного поиска.
Уорден Бойд Рэйворд, австралийский библиотекарь и ученый, биограф Поля Отле, писал: «На первый взгляд кажется странным обсуждать историю информатики в контексте создания международной организации, возникшей в Бельгии в 1895 г., организации, с которой англоязычный мир тогда почти не поддерживал связи. Тем более что термин информатика был впервые употреблен только в 50-е годы XX века. Однако даже беглое рассмотрение истории и деятельности Международного библиографического института и Библиографического бюро раскрывает их фундаментальное значение для развития того, что мы называем информатикой» [6, с. 17].
В 1920 году Международный библиографический институт «стал своего рода физическим и интеллектуальным ядром» для работы международного документального центра Mundaneum («Всемирного дворца знаний»), который, благодаря многим техническим и информационным новшествам, введенным Полем Отле, все чаще называют в настоящее время «бумажным интернетом» [1].
На русскоязычном веб-сайте «ХАБР», посвященном истории и развитию информационных технологий, один из пользователей описывает создание ученым устройства, предвосхитившего изобретение Вэниваром Бушем «мемекса» (прототипа гипертекстовой системы): «Поль Отле придумал новый вид рабочей станции ученого – движущийся стол в форме колеса, работающий с набором спиц на шарнирах, расположенных под несколькими движущимися поверхностями» [8]. Машина позволяла бы читателям искать, читать и вносить новые записи в особую механическую базу данных, хранящую сведения на индексных карточках. Система, таким образом, обеспечивала не только доступ к документам, но и помогала обозначать связи между ними.
Для визуализации поиска данных по десятичным кодам таблиц УДК Поль Отле использовал изображение круга, разделенного на 10 частей, каждая из которых в свою очередь делилась еще на 10 частей, подобно десятичным дробям, и так до бесконечности.
Как сказал французский математик Жюль Таннери (1848-1910), «несмотря на привычку пользоваться десятичной нумерацией, мы не можем не изумляться чудной простоте ее механизма» [3].
Остановимся подробнее на десятичной структуре информационно-поискового языка Универсальной десятичной классификации.
Согласно таблицам УДК вся сумма человеческих знаний сводится к следующим основным 10 разделам: 0 – Общий отдел. Наука и знание. Информационные технологии. Менеджмент. Документация. Библиотечное дело. Издания в целом; 1 – Философия. Психология; 2 – Религия. Богословие; 3 – Общественные науки; 4 – Резервный отдел; 5 – Математика. Естественные науки; 6 – Прикладные науки. Медицина. Технология; 7 – Искусство. Развлечения. Зрелища. Спорт; 8 – Язык. Языкознание. Лингвистика. Литература; 9 – География. Биографии. История.
Каждый из приведенных выше разделов делится на десять последующих равноправных частей, которые, в свою очередь, разбиваются еще на более мелкие деления и т.д.
По горизонтали индекс может укрупняться без всяких ограничений, но каждое движение по вертикали дает нам только 10 «шагов».
Теперь рассмотрим длину цифрового обозначения. Она обычно отражает иерархический уровень конкретного деления, при этом цифры разделены точками на группы по три знака для удобства восприятия. Так, индекс тематики «Асинхронные электродвигатели с фазным ротором» 621.313.333.1 складывается следующим образом:
6 Прикладные науки. Медицина. Технология
62 Инженерное дело. Техника в целом
621 Общее машиностроение. Ядерная техника. Электротехника. Технология машиностроения в целом
621.3 Электротехника
621.31 Электротехника. Производство, преобразование, передача, распределение и регулирование электроэнергии. Электроизмерительная техника. Техническое применение магнетизма и статического электричества
621.313 Электрические машины
621.313.3 Машины переменного тока
621.313.33 Асинхронные машины
621.313.333 Асинхронные электродвигатели
621.313.333.1 Асинхронные электродвигатели с фазным ротором
Индексы располагаются в таблице УДК в порядке возрастания и таким образом определяют место понятий в общей структуре научного знания.
Но ни в коем случае не следует рассматривать классификационную схему УДК как некий конечный перечень классификационных индексов. Десятичный принцип построения УДК позволяет расширять ее границы путем добавления новых цифр к уже имеющимся, при этом система сохраняет свою целостность. Кроме того, индексы УДК могут быть связаны друг с другом во всевозможных комбинациях.
Каждый информационно-поисковый язык имеет свою лексику и грамматику. Лексика представляет собой словарный состав информационно-поискового языка, а грамматика описывает правила и средства конструирования имеющимися элементами словарного состава поисковых образов и запросов. Грамматическую нагрузку в информационно-поисковом языке УДК несут в основном вспомогательные таблицы, которые позволяют модифицировать имена разделов практически для бесконечного числа научных интересов пользователей информационно-поисковой системы.
Процесс индексирования, т.е. выражение содержания документа или смысла информационного запроса с помощью классификационного индекса, является достаточно трудоемким. Помимо лавинообразного роста количества информации, с каждым годом значительно усложняется и тематика современных научных исследований. Поэтому, чтобы справиться с нарастающей информационной энтропией, многими странами мира поддерживается централизованная систематизация научно-технической литературы согласно таблицам УДК. Работа в этом направлении обеспечивает единообразие в организации справочно-информационных фондов в органах научно-технической информации и научно-технических библиотеках, а также способствует активному сотрудничеству в создании наиболее удобной интернациональной системы информационного поиска.
Первое издание полных таблиц УДК на русском языке вышло в 1963 году [9, с. 16]. С тех пор классификационная система претерпела немало изменений, но ее четкая и понятная структура, универсальность, многоаспектность, гибкость, мнемоничность, постоянное совершенствование с учетом новых достижений науки и техники сделали ее незаменимым средством для международного научного поиска и обмена информацией.
В настоящее время УДК является интеллектуальной собственностью специально организованного международного Консорциума УДК (Гаага, Нидерланды), объединяющего основных издателей таблиц УДК на разных языках. Исключительным правом распоряжения таблицами УДК на русском языке обладает Всероссийский институт научной и технической информации.
Многолетняя история международного сотрудничества по ведению и совершенствованию УДК позволяет не только подчеркнуть невероятную ценность данной классификационной системы для информационного поиска, но и очертить огромный потенциал ее развития как смыслового средства навигации в глобальных информационных сетях.
Любая классификация – это один из способов анализа сложных систем. В процессе познания окружающего мира человечество постоянно прибегает к моделированию и формализации, созданию обобщенной знаковой модели некоторой предметной области, позволяющей обнаружить ее структуру и закономерности протекающих в ней процессов путем оперирования со знаками. Допустим, оглавление книги – это формализация ее содержания, сам текст – формализация идей автора путем использования языковых конструкций, УДК – формализация научно-информационного поиска в целом, интеллектуальный инструмент, позволяющий взглянуть на искомый документ под новым углом зрения, получить более полную картину того, какое место он занимает в иерархической структуре похожих информационных запросов.
В современных информационных технологиях в последнее время все чаще применяется такое понятие, как предметная онтология. Сам термин заимствован из философии и означает, в новом его понимании, создание некоторой семантической сети взаимосвязанных понятий применительно к конкретной области профессиональных интересов пользователя.
УДК долго совершенствовалась и сейчас находится на новой стадии развития. Она не только оправдала те цели, для которых была создана, но в перспективе может использоваться для информационного моделирования в качестве готовой модели онтологии всего научного знания.
Список использованных источников
- Бумажный интернет с поисковыми запросами в 1910 году [Электронный ресурс]. – Режим доступа: https://habr.com/ru/company/sberbank/blog/647969/. – Дата доступа: 28.02.2022.
- Индексирование фундаментальных научных направлений кодами информационных классификаций: Универсальная десятичная классификация / О. А. Антошкова [и др.] ; под ред. Ю. М. Арского. – М., 2010. – 322 с.
- Крупнейшее математическое открытие в истории математики [Электронный ресурс]. – Режим доступа: https://studfile.net/preview/9811083/page:3/. – Дата доступа: 09.02.2022.
- Кузнецов, Н. С. Лингвопроектирование в Новое время [Электронный ресурс] / Н. С. Кузнецов. – Режим доступа: https://studfile.net/preview/4343132/. – Дата доступа: 15.02.2022.
- Лейбниц, Г. В. Труды по философии науки / Г. В. Лейбниц ; пер. с лат. Г. Г. Майорова. – М. : Кн. дом «ЛИБРОКОМ», 2010. – 178 с.
- Отле, П. Библиотека. Библиография. Документация : избр. тр. пионера информатики / П. Отле ; пер. с англ. и фр. Р. С. Гиляревского. – М. : ФАИР-ПРЕСС : Пашков дом, 2004. – 350 с.
- Письмо Рене Декарта аббату Мерсенну (20 ноября 1629 года) [Электронный ресурс] / пер. с англ. А. А. Гончаровой // Studia Humanitatis. – 2015. – № 1. – Режим доступа: http://st-hum.ru/content/goncharova-aa-pismo-rene-dekarta-abbatu-mersennu-20-noyabrya-1629-goda-perevod-c-angliyskogo. – Дата доступа: 09.02.2022.
- Поль Отле, забытый отец информационной архитектуры [Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/379957/. – Дата доступа: 28.02.2022.
- Сотникова, А. П. Структура, свойства и современное состояние универсальной десятичной классификации : метод. пособие / А. П. Сотникова, Р. И. Барушкова. – М., 1978. – 89 с.