Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

3.3. Метод вычисления семантической близости элементов онтологии



Метод вычисления семантической близости элементов онтологии основан на определении 2.2 онтологии 0DL (параграф 2.3.2). Он развивает подход к оценке близости объектов, основанный на использовании сотипиости

(cotopy).
Сотипность объектов — это оценка схожести положения сравниваемых объектов в некоторой иерархии [108].
Для оценки близости семантических метаданных в целом необходим метод оценки семантической близости следующих элементов онтологии [25]:
понятия (множество С);
экземпляры понятий (множество I);
отношения (множество R);
атрибуты (множество А);
конкретные значения (множество V).
Пара сравниваемых элементов рассматривается как упорядоченная в том смысле, что первый элемент пары является эталоном, с которым сравнивается второй элемент пары - кандидат. Из этого следует, что в общем случае показатель семантической близости упорядоченной пары элементов (0\, Ог) может быть не равным показателю семантической близости упорядоченной пары элементов (02, Oi).
3.3.1. Вычисление семантической близости двух понятии
В онтологии 0DL на множестве понятий С задано отношение нестрогого частичного порядка означает, что ск предшествует сп или что
Не каждый указанный элемент онтологии может быть сравнен с любым другим элементом онтологии. Ниже приведена таблица допустимых сравнений.
Таблица 3.4. Допустимые сравнения между элементами онтологии

Допустимые сравнения между элементами онтологии



С[ следует за ск. Причем Рс задано так, что среди элементов множества С существует единственный минимальный элемент

среди элементов множества С существует единственный минимальный элемент


Иерархия понятий с единственной вершиной (таксономия понятий), заданная отношением Рс, используется для определения семантической близости понятий.
Для каждого понятия с, е С существует множество СЛМС(с;), являющееся подмножеством С и содержащее понятия, предшествующие понятию , а также само понятие С;.

Для каждого понятия с, е С существует множество СЛМС(с;), являющееся подмножеством С и содержащее понятия, предшествующие понятию , а также само понятие С


Для оценки семантической близости двух понятий вводятся два показателя, основанные на сравнении множеств

Для оценки семантической близости двух понятий вводятся два показателя, основанные на сравнении множеств

:
а) семантическая близость двух понятий без учета наследования

семантическая близость двух понятий без учета наследования


б) семантическая близость двух понятий с учетом наследования

семантическая близость двух понятий с учетом наследования


предыдущий следующий
= К содержанию =


3.3. Метод вычисления семантической близости элементов онтологии - релевантная информация:

  1. ВВЕДЕНИЕ
    методов к обработке информации имеет высокую практическую значимость, а исследование подходов и разработка методов построения Web- портала на основе семантических технологий являются актуальными. В настоящее время исследования в области развития и внедрения семантических и портальных технологий ведутся как в России, так и за рубежом. Тем не менее, необходимо, констатировать значительный разрыв по
  2. 2.5. Использование семантического ядра портала
    методы оценки близости семантических метаданных (рис. 2.11). Метод вычисления близости семантических метаданных учитывает особенности поиска, категоризации и формирования рекомендаций. Он осно- ван на методе вычисления семантической близости элементов онтологии. Подробно указанные методы рассматриваются в третьей главе. Выводы но главе Анализ онтологического подхода к построению семантических
  3. 3.4. Метод вычисления близости семантических метаданных
    метод вычисления близости семантических метаданных основан на определении 2.2 онтологии {foto106} (параграф 2.3.2), определении 2.3 семантических метаданных {foto109} (параграф 2.4,1) и использует описанный выше метод вычисления семантической близости элементов онтологии. При вычислении близости пары семантических метаданных {foto110} и {foto111} учитывается характер отношений как между
  4. 3.6. Применение методов вычисления семантической близости и фильтрации множества кандидатов
    методом вычисления семантической-близости элементов онтологии и методом фильтрации для реализации в СП функций семантического поиска, категоризации и формирования рекомендаций. Общие шаги по использованию указанных методов приведены на рисунке 3.5. {foto164} Рис. 3.5. Использование метода вычисления близости семантических метаданных Семантический поиск: Объектом-эталоном при семантическом поиске
  5. 4.2.4. Тестирование функции выработки рекомендации
    методе вычисления семантической близости элементов онтологии (выражения 3.24, 3.28). Значения коэффициентов, вычисленные методом усреднения, приведены в таблице 4.9. Таблица 4.9. Коэффициенты для категоризации {foto206} Указанные значения коэффициентов были использованы для автоматического расчета схожести документов, выбранных тестерами, с остальными документами (рис. 4.18). Показателем схожести
  6. ЗАКЛЮЧЕНИЕ
    методов и инструментальных средств для создания семантических Web-порталов. Разработанное по результатам исследований семантическое ядро портала, реализующее предложенные методы формирования и обработки семантических метаданных объектов портала, может служить основой для создания семантических порталов в различных предметных областях. В ходе диссертационного исследования получены следующие
  7. Вычисление семантической близости экземпляра понятию
    метод Левенштейна [109], метод Q-грамм [110], алгоритм Soundex [111], алгоритм MetaPhone [112] и т.д. Любой из перечисленных алгоритмов может быть использован также и для сравнения чисел, рассматриваемых в качестве строковых
  8. 3.5. Метод фильтрации множества кандидатов
    метод вычисления близости семантических метаданных можно рассматривать как средство ранжирования объектов-кандидатов на основании объекта-эталона. После ранжирования те кандидаты, семантическая близость которых эталону меньше некоторого порогового значения, исключаются из результирующего множества объектов. Очевидно, что чем больше множество кандидатов, тем дольше выполняется ранжирование.
  9. Выводы по главе
    методы вычисления близости элементов онтологии основываются на использовании сотипности (cotopy) элементов онтологии, которая определяется положением сравниваемых элементов в заданной иерархии. Для выполнения процедур поиска, категоризации и предоставления рекомендаций необходимы разные методы вычисления близости семантических метаданных, учитывающие специфику каждой из процедур.
  10. 4.1.2. Проектирование и программная реализация сервера семантических метаданных
    метода (параграф 3.4). {foto181} Рис. 4.8. Модули, составляющие программную реализацию ССМ Указанная структура ССМ реализована в виде набора классов, перечисленных на следующей UML-диаграмме (рис. 4.9). Объектная модель семантических метаданных включает классы- сущности для элементов языка RDF, сам класс семантических метаданных, классы семантических выражений, входящих в состав семантических