Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

1.3. Анализ существующих применений семантических технологий в порталах



На сегодняшний день выполнены или выполняются исследовательские и коммерческие проекты, в рамках которых разрабатываются порталы, использующие семантические технологии. Данные порталы получили название семантических порталов (СП).
В таких порталах семантические технологии применяются для реализации различных функций. Далее рассматривается ряд наиболее широко опубликованных проектов внедрения семантических технологий в порталы. Некоторые дополнительные характеристики данных проектов приведены в приложении 2.
1. В проекте OntoPortal [17] разработан метод использования семантических технологий для тематических порталов в сфере образования. Портал такого рода должен содержать ссылки на ресурсы в сети Интернет, из которых обучаемый может почерпнуть информацию по определенной тематике. Для создания портала необходимо:
описать онтологию требуемой предметной области;
описать с использованием онтологии ресурсы в сети Интернет, которые содержат информацию по требуемой тематике.
На основании онтологии предметной области автоматически генерируются страницы портала. Сгенерированный портал содержит страницы для редактирования онтологии, страницы навигации по онтологии, т.е. для просмотра понятий и описаний ресурсов, а также для перехода между ними. При добавлении описаний ресурсов в онтологию повторной генерации страниц портала не требуется.

В данном проекте основной решаемой задачей является создание удобной для пользователя навигационной структуры портала. Плюсом предложенного в проекте подхода является то, что обучаемому вся необходимая информация предоставляется в одном месте и в удобном виде, и он не тратит время на поиск и структуризацию информации. Минусом является необходимость ручного поиска подходящих ресурсов в сети Интернет, а также использование собственного, не стандартизованного языка описания онтологии, основанного на XML.
2. В рамках проекта Semantic Community Web Portal [15] разработан подход к созданию портала для сообщества пользователей. Такой портал обеспечивает пользователю возможность размещать информацию в виде различных объектов (документов, сообщений и т.п.) и предоставлять другим пользователям доступ к ней. С помощью семантических технологий в портале реализуются основные функции портала — интеграция разнородных источников информации, структуризация информации и поиск. В качестве языка описания онтологии используется язык F-Logic, основанный на логическом формализме. Он позволяет описывать в онтологии экземпляры понятий. На основании описания онтологии автоматически генерируются страницы портала.
Плюсом предложенного подхода является комплексность решения основных задач портала с помощью семантических технологий. Кроме этого в ходе проекта была выполнена практическая реализация предлагаемого подхода, основным компонентом которой является программная среда по работе с онтологиями - KAON.
В качестве основного недостатка подхода необходимо отметить отсутствие возможности семантического описания объектов портала с точки зрения контента. В данном подходе под семантическими метаданными объекта понимается экземпляр понятия в совокупности с его отношениями с другими экземплярами предметной области. Это соответствует описанию объекта с
точки зрения контекста. Кроме этого недостатком является необходимость повторной генерации страниц портала при добавлении понятий в онтологию.
Последнего недостатка лишен подход к созданию семантического портала, разработанный в рамках проекта ODESeW [18]. Однако в отличие от предыдущего проекта в нем не рассматриваются вопросы интеграции информационных источников с помощью семантических технологий.
9
Для создания семантических порталов в проекте ODESeW реализована среда WebODE, которая предназначена для организации работы с онтоло- гиями. Онтологии описываются на специально разработанном языке, но этот недостаток компенсируется возможностью импорта описаний онтологий на распространенных языках, таких как OWL, DAML+OIL, RDF(S). Под семантическими метаданными объекта также понимается экземпляр понятия в совокупности с его отношениями с другими экземплярами предметной области.
Наиболее успешное практическое внедрение получил семантический портал (http://museosuomi.cs.helsinki.fi), разработанный в рамках проекта Оп- toViews [65]. Семантические технологии используются в проекте для решения уже упоминавшихся задач интеграции, структуризации и поиска информации в порталах. Подход отличается используемыми семантическими технологиями: язык RDF(S) для описания онтологий, язык RDF для описания семантических метаданных, Prolog для выполнения логического вывода.
Семантические метаданные в виде экземпляров онтологии используются не только для стандартного поиска по шаблону, но и предложена новая концепция многоаспектного поиска. Кроме этого новым является использование семантических технологий для реализации функции формирования рекомендаций пользователю портала.
Задачей проекта Onto Weaver [66] является разработка методологии по созданию порталов, настраиваемых под потребности пользователей. В основе методологии лежит моделирование различных аспектов портала с использованием набора разработанных онтологий. Этап проектирования порта-
ла поддерживается разработанным в рамках проекта программным комплексом.
Онтологии (метамодели) описывают понятия и отношения, которые используются при спецификации аспектов портала (модели).
Разделение процесса моделирования на ряд независимых процессов - моделирование структуры данных, моделирование структуры портала, моделирование представления портала, моделирование пользователя - позволяет достичь возможности настройки портала под потребности пользователя на этапе проектирования с возможностью последующей перенастройки.
В данном проекте семантические технологии используются на этапе проектирования портала. Вопросы описания семантики объектов портала затронуты не были.
6. Проект SPortS [67] посвящен проблеме интеграции Web-сервисов в порталы. В частности авторами рассматриваются следующие вопросы:
использование порталом сторонних Web-сервисов, как источников информации;
рекомендация пользователю сервисов на основании анализа действий пользователя в рамках портала;
предоставление функциональность портала в виде Web-сервисов.
В рамках проекта разработан подход к автоматической генерации портала на основании декларативного описания портала и интегрируемых сервисов. Процесс создания портала состоит из двух этапов: наполнение онтологий и генерация портала, В целях обеспечения функциональности портала в рамках проекта разработано четыре онтологии:
онтология предметной области предназначена для описания информации, доступной в рамках портала;
онтология сервисов описывает на языке OWL-S те сервисы, которые будут интегрированы в портал;
онтология портала предназначена для моделирования аспектов портала;

• метаонтология предоставляет примитивы для описания трех предыдущих онтологий.
Объектами описания в портале являются доступные Web-сервисы. В качестве описывающих их семантических метаданных выступают экземпляры понятий онтологии OWL-S. Подход к поиску необходимых сервисов аналогичен рассмотренным ранее и является поиском по шаблону.
7. Примером коммерческого проекта по созданию портала, использующего семантические технологии, является Mondeca ITM [68]. Созданный в рамках проекта семантический портал является порталом управления знаниями и расширяет функциональность традиционных систем управления содержанием на основе онтологии и тематической карты.
Центральным элементом портала является репозитарий, хранящий модели знаний и структуру информационного содержания. Онтология, описанная на языке OWL, моделирует понятия и отношения (тема, связь, роль), используемые при построении тематической карты. Такое описание создается для явного разделения элементов тематической карты на классы, так как в самой карте такой возможности нет [69].
Тематическая карта описывается на языке ХТМ и используется для описания документов и баз данных.
Значимым отличием от уже рассмотренных проектов является наличие подсистемы автоматического анализа текста для составления семантических метаданных.
Семантические технологии также используются для реализации функций просмотра и поиска. Просмотр основан на тематической карте и возможен как в текстовом, так и в графическом режиме. Инструмент составления поисковых запросов позволяет детально описать искомый объект с точки зрения его атрибутов (название, тип и т.п.) и контента. Он использует как онтологию, так и тематическую карту.
Рассмотренный перечень проектов не является полным в силу того, что исследования по данной тематике активно ведутся. Кроме указанных суще-
ствуют и другие проекты ([16, 70-73] и пр.), однако они схожи по решаемым задачам и полученным результатам с рассмотренными проектами.
В результате анализа существующих подходов к использованию семантических технологий в порталах необходимо констатировать следующее:
исследования в области семантических технологий и их внедрения в порталы в настоящее время активно ведутся;
подходы к использованию семантических технологий в порталах варьируются, что, с одной стороны говорит об их большом потенциале, а с другой стороны, об отсутствии единого взгляда на проблему;
в области семантических технологий наработано множество различных программных инструментов, и стандартов.
В большинстве подходов для описания онтологии используется язык RDF(S), а для описания семантических метаданных — язык RDF. Онтология чаще всего используется для целей структуризации и поиска информации. Причем поиск реализуется на основании просмотра экземпляров онтологии с возможность фильтрации по шаблону. То есть под составлением семантических метаданных понимается описание контекста объектов портала (отношений с другими объектами), выражающееся в наполнении онтологии экземплярами и отношениями между экземплярами. Как следствие, результатом поиска является список экземпляров, а не список документов (и прочих объектов). Если же экземпляры имеют ссылки на документы, то семантические описания контента таких документов отсутствуют, а, следовательно, невозможен и семантический поиск по текстовому содержанию документов. Исключением является подход в проекте Mondeca ITM (описывается контент документов), но используемая в качестве модели знаний тематическая карта ограничивает выразительность описания объектов.

предыдущий следующий
= К содержанию =


1.3. Анализ существующих применений семантических технологий в порталах - релевантная информация:

  1. ВВЕДЕНИЕ
    анализа выполненных исследований необходимо отметить их недостаточность в области использования семантических технологий для описания семантики контента объектов Web-порталов. В соответствии с [19] объект может быть рассмотрен в трех разных аспектах — структура, контекст и контент. В большинстве исследований семантические технологии применяются для описания контекста объекта, в то время как в
  2. Выводы по главе
    анализа отечественных и зарубежных научных и коммерческих проектов выявлена недостаточность исследований в области использования семантических технологий для создания порталов нового поколения - семантических порталов. Поэтому целью диссертационного исследования является разработка методов, позволяющих использовать семантические технологии в порталах для реализации информационных процессов в них
  3. 2.1. Анализ вариантов использования онтологии
    анализ, выполненный в параграфе 1.3, в существующих подходах к созданию семантических порталов предлагаются различные варианты использования онтологии. Помимо этих подходов к созданию порталов существуют и отдельные исследования в области использования онтологий в рамках информационных систем (ИС). В связи с этим, в дополнение к анализу порталов, был проведен анализ вариантов использования
  4. ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА
    анализа понятий, определяющих искусство живописи и цвета. Мастера искусства об искусстве. М., 1970.- 192 с. 35-Вежбицкая, А. Язык. Культура. Познание. М.,1997. - 256 с. Зб.Величковский, Б.М., Зинченко, В.П., Лурия, А.Р. Психология Восприятия. М.: Педагогика, 1973, - 245 с. 37.Величковский, Б.М, Современная когпетивная психология. М.: Изд-во Моск.гос.ун-та,1982. - 336 с. 38.Верегин, АЛ. Русская
  5. 1.1.3. Архитектура портала
    анализе, использовании модели векторного пространства (vector space model) или статистических методах. В целях профилирования создаются описания пользователей с необходимым набором атрибутов для возможности их интерпретации. Оповещение пользователей выполняется по заранее определенным событиям с использованием таких push-технологий как рассылка электронной почты, RSS-рассылка и т.д. Формирование
  6. 2.2. Место и функции семантического ядра портала
    анализированы и обобщены. Поэтому эти исследования являются актуальными и необходимыми. Разработанное в данном диссертационном исследовании семантическое ядро портала (СЯП) можно отнести к уровню инфраструктуры семантического портала, потому что реализуемые в нем методы использования семантических технологий могут быть задействованы различными функциональными модулями портала для учета семантики
  7. 2.5. Использование семантического ядра портала
    существляется на основании сравнения семантических метаданных объектов. {foto50} Рис. 2.11. Использование алгоритма оценки семантической близости Для предоставления функций поиска, категоризации и формирования рекомендаций с учетом семантики объектов разработанное семантическое ядро реализует методы оценки близости семантических метаданных (рис. 2.11). Метод вычисления близости семантических
  8. СПИСОК ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ
    анализа русских слов // Вопросы информационной теории и практики. - 1985. - №53.-С. 62-93. Madche A., Staab S., Stojanovic N. et al. SEAL - A framework for developing SEmantic portALs // Proc. of the 18th British national conference on databases. - Oxford: Springer, 2001. - P. 1-22. Levenshtein I. V. Binary codes capable of correcting deletions, insertions, and reversals // Cybernetics and
  9. 1.2 Структура и классификация электронной коммерции Электронная коммерция включает в себя:
    анализ этих комплиментарных связей между различными уровнями электронной коммерции. Необходимо также подчеркнуть, что Интернет является технологией развивающихся возможностей, которая несет в себе так называемое свойство всеобщего проникновения, присущее технологиям общего назначения . Технологии развивающихся возможностей представляют собой некие технические и технологические достижения,
  10. Заключение
    анализ этих комплиментарных связей между различными уровнями электронной коммерции. Необходимо также подчеркнуть, что Интернет является технологией развивающихся возможностей, которая несет в себе так называемое свойство всеобщего проникновения, присущее технологиям общего назначения. Технологии развивающихся возможностей представляют собой некие технические и технологические достижения,