Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

2.2. Место и функции семантического ядра портала



Обобщая мировой опыт создания семантических порталов, можно говорить об определенной иерархии шагов построения семантического портала [92]. Данная иерархия может быть графически представлена в виде пирамиды (рис.
2.1), уровни которой отражают шаги по созданию семантического портала. Реализация любого из представленных уровней возможна только после реализации нижележащих уровней.

Шаги построения семантического портала


Рис. 2.1. Шаги построения семантического портала
1. Семантические технологии являются основой для развития современных информационных систем, и в частности для создания семантических
порталов, использующих модель знаний предметной области для реализации интеллектуальных функций и предоставления разнообразных сервисов. В состав семантических технологий входят:
формальные способы представления знаний;
языки описания онтологий;
языки описания семантических метаданных;
инструментальные средства по работе с онтологиями и семантическими метаданными (создание, хранение, обработка);
протоколы взаимодействия и обмена данными между программными системами, использующими семантические технологии.
Инфраструктура семантического портала расширена по сравнению с инфраструктурой традиционного портала (рис. 1.2) за счет использования следующих элементов:
протоколов, языков и инструментальных средства, выбранных из множества доступных семантических технологий, и необходимых для решения поставленных задач;
программных средств интеграции семантических технологий для удобства их использования в семантическом портале;
методов и алгоритмов использования семантических технологий для реализации общесистемных функций семантического портала (описание объектов, поиск, категоризация и т.д.).
Онтологии верхнего уровня являются необходимым условием для обеспечения возможности интеграции создаваемого семантического портала в среду Semantic Web, то есть для взаимодействия с другими информационными системами, использующими семантические технологии.
Онтологии приложения [45] описывают знания о предметной области, в которой функционирует приложение, а также об объектах, которыми управляет приложение, и о процессах, автоматизируемых приложением. Если в портале используются онтологии верхнего уровня, то онтологии приложе-
ния должна дополнять и уточнять понятия, введенные в онтологиях верхнего уровня.
5. Семантический портал разрабатывается с использованием семантических и прикладных (программных, системных) технологий и реализует функции для решения поставленных задач.
Следует отметить, что исследования в области семантических технологий и создания онтологий верхнего уровня проводятся в большом числе стран и организаций и имеют значительные (в некоторой части даже стандартизованные) результаты. Результаты исследований в области инфраструктуры семантических порталов и онтологий приложения гораздо скромнее. Исследования в этих областях редки, слабо проанализированы и обобщены. Поэтому эти исследования являются актуальными и необходимыми.
Разработанное в данном диссертационном исследовании семантическое ядро портала (СЯП) можно отнести к уровню инфраструктуры семантического портала, потому что реализуемые в нем методы использования семантических технологий могут быть задействованы различными функциональными модулями портала для учета семантики обрабатываемой информации (рис 2.2). СЯП объединяет элементы семантических технологий (методы, протоколы, языки и инструментальные средства), расширяющие инфраструктуру портала (рис. 1.2) до инфраструктуры семантического портала.
При разработке СЯП учитывались два возможных сценария создания и внедрения семантического портала:
Семантический портал может разрабатываться на базе ранее внедренного традиционного портала. Тогда СЯП должно предоставлять возможность интеграции с существующим порталом с целью его развития до уровня работы с семантикой.
Семантический портал создается «с чистого листа». В этом случае требования к СЯП менее жесткие — оно должно решать поставленные задачи, а разработчики должны сами решать вопросы его интеграции.

Инфраструктура и функциональные модули семантического портала


Рис.
2.2. Инфраструктура и функциональные модули семантического портала
Семантическое ядро
Инфраструктура портала

Место семантического ядра в семантическом портале


Рис. 2.3. Место семантического ядра в семантическом портале
Из приведенных сценариев внедрения следует, что СЯП не должно зависеть от платформы, на которой реализуется семантический портал. Поэтому семантическое ядро разрабатываться в виде набора необходимых серверов, доступ к которым осуществляется по открытым стандартным протоколам (рис. 2.3).
Как уже отмечалось, СЯП должно предоставить функции, позволяющие реализовать в портале информационные процессы, учитывающие семантику информации. В данном исследовании учет семантики информации не подразумевает детального семантического анализа текста. Переход на семантический уровень осуществляется за счет устранения синтаксической многозначности и учета связей между понятиями. То есть СЯП предоставляет следующие возможности:
Учет в процессе обработки информации наличия омонимии и полисемии в естественном языке. Это достигается за счет моделирования знаний предметной области в виде онтологии, которая содержит понятия, которые в свою очередь имеют множественные лексические представления. В результате появляется возможность выявления омонимов и многозначных слов в предметной области и возможность устранения неоднозначности текстового содержания информационного ресурса.
Учет в процессе обработки информации наличия эквивалентных лексических конструкций (синонимов) в естественном языке. Это достигается за счет закрепления за понятиями онтологии множественных лексических представлений - синонимов. В результате появляется возможность сравнения синтаксически различной, но семантически похожей информации.
Учет в процессе обработки информации иерархической природы понятий, выражающейся в виде отношения «понятие - более узкое понятие» («класс - подкласс»).
Это достигается за счет использования таксономии понятий.

Эти возможности СЯП используются для структуризации и поиска информации в портале и предоставления се пользователям. То есть в данном диссертационном исследовании развиваются существующие подходы к созданию семантических порталов, в которых семантические технологии используются на этапе функционирования портала. Разработанное семантическое ядро портала поддерживает следующие ранее выявленные варианты использования онтологии:
описание объектов портала;
семантический поиск;
формирование списка объектов, связанных с исходным объектом;
формирование списка объектов, похожих на исходный объект.
На перечисленных вариантах использования онтологии основываются
разработанные методы обработки описаний объектов портала, позволяющие учитывать семантику контента. Предлагаемые методы подробно описаны в третьей главе. Для реализации этих методов СЯП предоставляет возможность:
описывать предметные области в виде онтологии для выявления синонимов, омонимов, многозначных терминов и построения таксономии терминов;
описывать объекты портала с использованием семантических метаданных разработанной автором структуры.
Функционально семантическое ядро портала разделено на два модуля:
модуль по работе с онтологиями;
модуль по работе с семантическими метаданными.
Функциональность семантического ядра по работе с онтологиями сосредоточена в сервере онтологий, а функциональность по работе с семантическими метаданными — в сервере семантических метаданных (рис. 2.4).

Интеграция портала с семантическим ядром


Рис. 2.4. Интеграция портала с семантическим ядром
предыдущий следующий
= К содержанию =


2.2. Место и функции семантического ядра портала - релевантная информация:

  1. Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006
    функций на семантическом
  2. ВВЕДЕНИЕ
    функционирование поисковых Web-порталов в сети Интернет. Обычно они предоставляют услуги двух типов: поиск по рубрикатору и полнотекстовый поиск. Если необходимая пользователю информация сосредоточена в какой-либо рубрике, то ему лучше воспользоваться возможностью просмотра этой рубрики, так как точность категоризации информации в рубрикаторе находится на очень высоком уровне. Это объясняется
  3. 2.1. Анализ вариантов использования онтологии
    место как минимум обратная полиномиальная зависимость между производительностью ПО и количеством логических высказываний в онтологии. Необходимо искать компромисс между детальностью онтологии и производительностью ПО. В настоящее время такой компромисс чаще всего достигается экспериментальным путем. В связи с указанными проблемами разработка семантических порталов ведется с соблюдением
  4. 2.3.4. Функции и структура сервера онтологий
    функции: 71 хранение онтологий; предоставление онтологий; логический вывод; поиск в онтологии запрашиваемых понятий и отношений. Функции СО могут быть сгруппированы по этапам жизненного цикла онтологии (таблица 2.5). Таблица 2.5. Функции сервера онтологий на этапах жизненного цикла онтологии {foto36} Создание Оценка Использование Изменение • Логический вывод Хранение онтологий Предоставление
  5. 2.5. Использование семантического ядра портала
    функций семантического ядра онтологии предметных областей и семантические метаданные объектов СП используются при обработке объектов. Как уже говорилось, семантическое ядро предоставляет функции: описания объектов портала; семантического поиска; формирования списка объектов, связанных с исходным объектом; формирования списка объектов, похожих на исходный объект. Семантическое описание объекта
  6. 4.1.4. Степень программной реализации семантического ядра портала
    функции 1 973
  7. 4.2. Тестирование семантического ядра портала
    функции: аннотирование объектов; семантический поиск; формирование списка объектов, связанных с исходным объектом; формирование списка объектов, похожих на исходный объект. Функция аннотирования упрощает процесс формирования семантических метаданных для объектов портала. Семантический поиск позволяет искать объекты портала с учетом их семантики. Формирование списка объектов, связанных с исходным
  8. 4.3. Применение семантического ядра в порталах
    месторождений [26, 27, 28]. {foto226} Рис. 4.22. Стартовая страница портала «Petroleum Engineers Virtual Network» Система предоставляет следующие функции, обеспечивающие управление неявными знаниями: доступ к информации о специалистах в системе; поиск специалистов владеющих знаниями по искомой проблеме; взаимодействие специалистов посредством электронной почты; взаимодействие специалистов
  9. 4.3.2. Портал «Корпоративная система управления знаниями»
    функциональность которого основывается на использовании разработанного семантического ядра. В качестве наиболее существенных функциональных подсистем портала реализуются: подсистема электронной библиотеки; подсистема профилей компетенции ведущих сотрудников компании; подсистема поиска; подсистема для работы экспертов компании. Разработанная для системы управления знаниями онтология части
  10. ЗАКЛЮЧЕНИЕ
    функциях семантического поиска, категоризации и формирования рекомендаций. Выполнена программная реализация разработанного семантического ядра портала, составившая в общей сложности более 16 тысяч строк кода. Осуществлено тестирование программного кода на сгенерированном множестве семантических метаданных. Разработанные структуры, методы и алгоритмы построения семантических Web-порталов, а также