УДК 004.65::111.5

Онтологии в эпоху цифровизации

Часть 1. Мост между мыслью и цифрой (путь к пониманию онтологий)

Аннотация: В первой статье из цикла «Онтологии в эпоху цифровизации» исследуется концепция онтологий в контексте информационных систем и взаимодействия между современными учеными. Статья начинается с объяснения роли и значения онтологий в структурировании и передаче знаний, подчеркивая их важность в различных отраслях. Затем обсуждаются проблемы, связанные с взаимодействием исследовательских групп, особенно в контексте создания и использования универсальных онтологий. Также в статье показаны ограничения и трудности, с которыми сталкиваются специалисты при применении онтологий к новым задачам, включая необходимость адаптации и потенциальные идеологические ограничения, а также подчеркивается, что каждая онтология несет в себе определенные предположения, которые могут влиять на ее гибкость и адаптивность.

Ключевые слова: онтологии, структурирование знаний, универсальные онтологии, адаптация онтологий, интеграция данных, искусственный интеллект в онтологиях.

В эпоху быстрого развития технологий и обмена информацией роль структурирования, хранения и обработки данных становится все более значимой. Онтологии, как средство представления знаний в систематизированной форме, занимают особое место в современных информационных системах. По моему мнению, главной идеей онтологии является преобразование мыслей в письменную форму, будь то слова или формулы. Если использовать более формализованное определение, то онтология — это иерархически связанное описание модельной области, составленное из дедуплицированных и унифицированных терминов.

Онтологии уже давно стали неотъемлемой частью многих отраслей и помогают специалистам эффективно работать с различными типами данных, делая их доступными и понятными.

Однако, как и любой мощный инструмент, онтологии имеют свои ограничения и специфические проблемы. Взаимодействие различных исследовательских групп, создание универсальных онтологий, интеграция человеческого фактора и новые риски в области информационной безопасности — все это делает вопросы разработки и применения онтологий актуальными.

В этом цикле статей мы рассмотрим ключевые аспекты использования онтологий в современных информационных системах, их возможности и ограничения, а также другие способы упорядочения информации и методы работы с ней.

Проблемы взаимодействия исследовательских групп в современных условиях

Для решения сложных и многоаспектных задач, которые требуют уникальных компетенций и знаний, в условиях глобализации и постоянного развития технологической среды исследовательские, разработческие и конструкторские группы должны решать проблему эффективного объединения своих усилий. Несмотря на обилие доступных технологических решений, многие группы сталкиваются сегодня с проблемой изолированности. Исторически так сложилось, что каждая из этих групп работала в собственном информационном пространстве, имея доступ только к определенной части общего массива данных, что породило ряд проблем. Даже при наличии современных инструментов коммуникации группы могут столкнуться с трудностями в понимании данных друг друга из-за отсутствия унификации и стандартизации, что снижает эффективность информационного обмена. Различные группы могут использовать свои методики, терминологию и стандарты, что затрудняет объединение и анализ информации и усложняет интеграцию данных. Каждая группа может фокусироваться на своем узком направлении, рискуя потерять ключевую информацию, которая могла бы быть выявлена при более глубокой интеграции данных.

Для решения этих проблем существует ряд подходов. Один из них известен как «создание универсальных онтологий» или, более просто, попытка соединить информацию из различных источников в единый «язык». Это довольно сложный процесс, и он имеет свои слабые стороны, о которых мы поговорим далее.

Как же решается проблема изолированности исследовательских и разработческих групп, которая заслуживает особого внимания, так как ее решение может повысить эффективность интеллектуального труда и сотрудничества на глобальном уровне. В последние годы было предложено и применено множество подходов для повышения эффективности информационного обмена:

  1. Создание групп специалистов из разных областей знаний, которые могут объединить свои компетенции для решения конкретной задачи. Такой подход позволяет учитывать различные аспекты проблемы, но требует значительных затрат на координацию деятельности и обучение участников (рисунок 1).
  2. Повышение квалификации специалистов, которое дает им возможность освоить знания в нескольких областях. Это может улучшить понимание и взаимодействие между группами, но также требует значительного времени и ресурсов.
  3. Создание общих репозиториев, или баз данных, куда все группы могут загружать и откуда извлекать информацию. Это улучшает доступ к данным, но может создать проблемы с безопасностью и управлением информацией.
  4. Структурированные модели данных, представляющие знания в определенной области. Они позволяют различным группам обмениваться информацией в стандартизированной форме. Однако создание универсальных онтологий может быть сложным и затратным процессом.
  5. Применение искусственного интеллекта для обработки и анализа больших объемов данных может помочь выявить скрытые связи между информацией из разных источников, снижая ошибки, связанные с человеческим фактором.
Рис. 1. Трудности организации взаимодействия Рис. 1. Трудности организации взаимодействия

Несмотря на разнообразие методов обработки данных, ни один из них не является универсальным. Выбор оптимального подхода зависит от конкретной задачи, доступных ресурсов и специфики исследовательской группы.

Ограничения и трудности в применении онтологий

Онтологии, как структурированные наборы знаний, играют важную роль в обеспечении коммуникации между исследовательскими группами. Однако применение конкретной онтологии, разработанной для определенной задачи или области, к новым задачам может столкнуться с рядом проблем и ограничений.

Прежде чем использовать существующую онтологию для новой задачи, необходимо ее изучить и понять. Это требует времени и может вызвать путаницу, особенно если оригинальная онтология сложна или охватывает широкий спектр понятий. Даже после усвоения онтологии ее придется адаптировать или верифицировать для решения текущей задачи. Этот процесс может быть сложным, поскольку требует глубокого понимания как оригинальной модели, так и текущей задачи. Многие допускают ошибку, думая, что онтологии легко масштабируются или модифицируются. На практике это может повысить сложность, особенно когда к онтологии добавляются новые модели или понятия. При попытке создать или модифицировать большие и сложные онтологии вероятность ошибок увеличивается. Эти ошибки могут возникнуть из-за недоразумений, предвзятости или просто недостатка опыта. Онтология порождена человеком или группой людей, то есть поделена на области его или их опыта. Таким образом, в том, что касается онтологии, есть люди, ее породившие, есть люди, имеющие сходный опыт, и есть люди, имеющие несовместимый опыт (рисунок 2).

Рис. 2. Ограничения применения онтологий: несоответствие формы и содержания Рис. 2. Ограничения применения онтологий: несоответствие формы и содержания

Несмотря на потенциальные преимущества использования онтологий, их применение в новых контекстах требует тщательного анализа и планирования. Отбор и адаптация онтологии для конкретной задачи часто являются не менее сложными проблемами, чем разработка новой онтологии с нуля.

Идеологические ограничения и расширяемость онтологий

При обсуждении онтологий часто пропускают один критически важный аспект: идеологические предпосылки, лежащие в основе любой созданной системы знаний. Эти идеологические основы могут значительно ограничить способность онтологии адаптироваться к новым и изменяющимся условияРассмотрим несколько примеров из реальной жизни, демонстрирующих это.

Когда две компании сливаются, объединение их информационных систем часто сталкивается с трудностями из-за различий в онтологиях. Каждая компания развивает уникальные системы, отражающие ее корпоративную культуру и бизнес-процессы. Это создает барьеры для слияния данных и знаний, требуя тщательной работы по их согласованию и интеграции.

В глобальных цепочках поставок участвуют компании с различными системами учета и отслеживания движения товаров. Разные онтологии этих систем создают сложности в обеспечении точности и прозрачности данных. Это объясняет, почему так важно согласовывать различные подходы для обеспечения эффективности в цепочке поставок.

Представители различных научных дисциплин часто используют свои уникальные онтологии для классификации и анализа данных. Интеграция этих данных для междисциплинарных исследований требует тщательной работы по сопоставлению и согласованию различных систем, что отражает сложности в обмене знаниями между различными областями .

Каждая онтология неизбежно несет в себе некоторую идеологию или представление о мире. Это представление может быть основано на определенных научных, культурных или философских установках. В результате, две разные онтологии, даже если они охватывают одну и ту же область, могут существенно отличаться по своей структуре и содержанию. Разные группы могут иметь разные представления о том, как должен быть устроен мир. Когда онтологии создаются с определенным идеологическим уклоном, они могут не подходить для групп с другим мировоззрением (рисунок 3).

Рис. 3. Попытка интеграции разных онтологий - современная Вавилонская башня Рис. 3. Попытка интеграции разных онтологий — современная Вавилонская башня

Многие предполагают, что онтологии могут быть легко расширены или модифицированы для охвата новых понятий. Однако в реальности добавление новых элементов может столкнуться с идеологическими ограничениями основной онтологии. Это может привести к несогласованности или даже противоречиям внутри онтологии. Если онтология считается «завершенной» или «абсолютной», это может привести к догматизму. В таком случае, любые попытки адаптации или модификации могут восприниматься как нарушение основных принципов.

В итоге можно сказать, что хотя онтологии предлагают структурированную рамку для представления знаний, их идеологическая природа может ограничивать их гибкость и адаптивность. Это объясняет необходимость критического подхода при выборе, применении и модификации онтологий для конкретных задач и контекстов.

В следующих статьях цикла мы рассмотрим альтернативные пути создания онтологий и вопросы информационной безопасности.