Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

3.1. Состав и структура онтологической модели для использования в семантическом портале



Место процесса создания онтологической модели в процессе создания семантического портала


Рис.
3.1. Место процесса создания онтологической модели в процессе создания семантического портала
Сначала необходимо решить вопрос об использовании онтологии верхнего уровня. Данный тип онтологий предназначен для обеспечения возможности взаимодействия семантического портала с другими информационными системами - обмена информацией вместе с ее семантическим описанием. На данном этапе принимается решение об использовании или не использовании онтологии верхнего уровня. Если такую онтологию планируется использовать, то необходимо выбрать ее из ряда существующих онтологий верхнего уровня. В идеале должна существовать одна онтология верхнего уровня, которая будет использоваться во всех ИС. В связи с наличием различных точек зрения на процесс ее разработки и на ее состав и структуру, сегодня сущест-
Процесс создания онтологической модели для ее использования в семантическом портале состоит из нескольких этапов (рис. 3.1).

вует ряд онтологий верхнего уровня. В качестве примера можно привести такие онтологии верхнего уровня как Sowa's KR Ontology [47], DOLCE [104], Generalized Upper Model [105], WordNet [48], Suggested Upper Merged Ontology [106] и др. Так как онтологии верхнего уровня создавались с использованием различных языков описания онтологий, то перед использованием выбранной онтологии верхнего уровня может потребоваться преобразование ее к языку, используемому в конкретном семантическом портале.
Онтология предметной области и онтология задач описывают соответственно сущности и процессы, которые имеют место в предметной области, и информация о которых обрабатывается семантическим порталом. Если используется онтология верхнего уровня, то описываемые сущности и процессы становятся подклассами сущностей и процессов, введенных в онтологии верхнего уровня, наследуя от них отношения и атрибуты. Если же онтология верхнего уровня не используется, то онтология предметной области и онтология задач разрабатываются целиком «с чистого листа».
Онтология приложения дополняет онтологию предметной области и онтологию задач, описывая те понятия, которые соответствуют объектам семантического портала. Например, в рамках данного диссертационного исследования в онтологию приложения вошли такие понятия как «документ», «ссылка», «рубрика», «область знаний» и «специалист».
Таким образом, онтологическая модель, используемая в семантическом портале, в общем случае состоит из четырех частей: онтологии верхнего уровня, онтологии предметной области, онтологии задач и онтологии приложения. Первые три части фокусируются на описании предметной области семантического портала (понятия и их взаимосвязи). Информация из этой предметной области обрабатывается порталом в виде объектов. Четвертая составная часть онтологической модели - онтология приложения - описывает отношения типов объектов с понятиями предметной области, то есть семантику типов объектов с точки зрения контекста.

Разделение используемой в семантическом портале онтологической модели на описание предметной области (онтологии верхнего уровня, онтологии предметной области, онтологии задач) и описание типов объектов (онтология приложения) является существенным.
Описание предметной области в рамках одного СП может меняться. Это означает, что СП, функционирующий в одной предметной области, может использоваться и в другой предметной области при наличии онтологического описания этой предметной области. В свою очередь описание типов объектов портала является неизменным. СП создается для обработки объектов определенного типа (документы, ссылки, и т.п.) и полагается на наличие в онтологической модели соответствующих понятий.
В связи с указанным разделением состава онтологической модели накладывается ограничение на ее структуру. Структура должна отражать явное разграничение между переменной (описание предметной области) и неизменной (описание типов объектов) частями онтологии. Для этого в онтологическую модель, созданную в рамках данного диссертационного исследования, было введено дополнительное понятие «Объект портала», подклассами которого являются понятия, соответствующие типам объектов портала (рис. 3.2).

Таксономия понятий в разработанной онтологической модели


Рис. 3.2. Таксономия понятий в разработанной онтологической модели

Эта онтологическая модель была разработана совместно с сотрудниками группы КСУЗ (лаб. ОСУ, ИКЦ ТПУ) для части предметной области «Автоматизация технологических процессов». В нее вошло 7 понятий верхнего уровня. Общее количество понятий составило 578, количество отношений - 15, максимальная вложенность понятий - 12.
Пример части онтологической модели приведен на рисунке 3.3.

Пример части онтологической модели


Рис. 3.3. Пример части онтологической модели
Онтологическая модель была описана на языке OWL DL, и количество строк составило 3210, а размер файла - 184 Кбайта. Описание неизменной части онтологической модели приведено в таблице 3.1.
Таблица 3.1. Элементы неизменной части онтологической модели

Элементы неизменной части онтологической модели


№ Тип Название Описание 1 Понятие Объект портала Объект, являющийся носителем информации, относящейся к предметной области, описанной в онтологической модели 2 Понятие Документ Файл, хранящийся в базе данных портала 3 Понятие Ссылка Указание на файл, хранящийся вне базы данных портала 4 Понятие Рубрика Раздел каталога документов и ссылок портала 5 Понятие Специалист Сотрудник компании, обладающий знаниями в предметной области, описанной в онтологической модели 6 Понятие Область знаний Совокупность знаний, являющаяся частью предметной области, описанной в онтологической модели 7 Отношение Связанность Принадлежность элемента онтологической модели к семантическим метаданным объекта 8 Атрибут Номер объекта Идентификация объекта портала
предыдущий следующий
= К содержанию =


3.1. Состав и структура онтологической модели для использования в семантическом портале - релевантная информация:

  1. ВВЕДЕНИЕ
    составляющие основное содержание диссертации, получены автором самостоятельно. В опубликованных работах лично автором обоснованы варианты использования семантических технологий в информационных системах в общем [22] и в частности в Web-порталах [20, 23, 24], пояснены разработанные методы описания семантики объектов Web-портала и вычисления их семантической близости [21, 25], описано разработанное
  2. 2.1. Анализ вариантов использования онтологии
    структурированными (базы данных) [80], так и слабо структурированными (документы, Web-страницы и т.п.) [81]. Также возможно описание разнородных информационных источников в терминах одной онтологии, что упрощает процесс интеграции информации [15, 16]. Обмен информацией между программными агентами. В мультиа- гентной среде (http://www.fipa.org/) агенты могут быть использованы как носители
  3. 2.2. Место и функции семантического ядра портала
    состав семантических технологий входят: формальные способы представления знаний; языки описания онтологий; языки описания семантических метаданных; инструментальные средства по работе с онтологиями и семантическими метаданными (создание, хранение, обработка); протоколы взаимодействия и обмена данными между программными системами, использующими семантические технологии. Инфраструктура
  4. ЗАКЛЮЧЕНИЕ
    состав и структура семантического ядра портала. Ядро состоит из сервера онтологий и сервера семантических метаданных. Функциональность семантического ядра портала основывается на логическом формализме представления знаний — дескриптивной логике. В соответствии с указанным формализмом выбраны языки записи онтологии и семантических метаданных для использования в семантическом ядре портала.
  5. 2.5. Тендерная характеристика рекламного текста
    состав потребительской аудитории для чистоты эксперимента, хотя в её состав входило не слишком много специалистов - профессионалов. Полученные результаты, касающиеся выявления предпочтительных моделей для женской и мужской аудитории, представлены в следующей таблице: {foto8} Х. Тип модели Пол реципиентам^^ Дескриптивная модель Синтетическая модель мужская аудитория (145) 130 15 женская
  6. Библиографический список
    структуре предложения и вопросы синтаксиса русского языка. Ростов н/Д., 1971. С. 36-44. Гальперин И.Р. Текст как объект лингвистического исследования. М., 1981. С. 139. Герасименко И.О. О некоторых средствах реализации коммуникативных интенций рекламного текста // Диалог культур в аспекте проблем обучения в высшей школе. Луганск, 2001. Гиляревский Р.С. Введение в интеллектуальную коммуникацию.
  7. 1.3. Анализ существующих применений семантических технологий в порталах
    составления семантических метаданных. Семантические технологии также используются для реализации функций просмотра и поиска. Просмотр основан на тематической карте и возможен как в текстовом, так и в графическом режиме. Инструмент составления поисковых запросов позволяет детально описать искомый объект с точки зрения его атрибутов (название, тип и т.п.) и контента. Он использует как онтологию,
  8. 2.5. Использование семантического ядра портала
    структуре новой важной подсистемы - семантического ядра. Основными компонентами семантического ядра являются сервер онтологий и сервер семантических метаданных. Поиск понятий, экземпляров и отношений, а также логический вывод, реализуемые сервером онтологий, основываются на использовании дескриптивной логики класса SHIO и языка описания онтологий OWL DL. Формирование, хранение, предоставление и
  9. 3.5. Метод фильтрации множества кандидатов
    составить на основании семантических метаданных объекта-эталона комплексное понятие в терминах дескриптивной логики, для которого с помощью СЛВ определяется множество экземпляров, удовлетворяющих этому комплексному понятию. Найденные таким способом экземпляры соответствуют тем объектам СП, семантическая близость которых объекту-эталону больше нуля. Процедура составления комплексного понятия
  10. Выводы по главе
    структуру, в которой выделена неизменная часть — онтология приложения, и переменная часть, которая включает онтологии верхнего уровня, предметных областей и задач. Предложенные методы вычисления близости элементов онтологии основываются на использовании сотипности (cotopy) элементов онтологии, которая определяется положением сравниваемых элементов в заданной иерархии. Для выполнения процедур