Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

3.4. Метод вычисления близости семантических метаданных



Разработанный метод вычисления близости семантических метаданных основан на определении 2.2 онтологии

онтология

(параграф 2.3.2), определении 2.3 семантических метаданных

определении семантических метаданных

(параграф 2.4,1) и использует описанный
выше метод вычисления семантической близости элементов онтологии.
При вычислении близости пары семантических метаданных

пары семантических метаданных

и

пары семантических метаданных

учитывается характер отношений как между элементами двух метаданных, так и между метаданными целиком.
Всего было рассмотрено четыре возможных способа сравнения семантических метаданных (табл. 3.5).
Таблица 3.5. Показатели близости семантических метаданных

Показатели близости семантических метаданных


Для описания методов расчета указанных показателей введены понятия «пересекающихся» и «перекрывающихся» семантических метаданных.
Определение 3.1. Семантические метаданные

Семантические метаданные

являются
пересекающимися, если хотя бы для одного элемента из

существует
близкий элемент (показатель близости больше нуля) из


Для пересекающихся семантических метаданных расчет близости без учета и с учетом наследования выполняется следующим образом.

Для пересекающихся семантических метаданных расчет близости без учета и с учетом наследования выполняется следующим образом


Для пересекающихся семантических метаданных расчет близости без учета и с учетом наследования выполняется следующим образом


Для пересекающихся семантических метаданных расчет близости без учета и с учетом наследования выполняется следующим образом


Определение 3.2. Семантические метаданные являются
перекрывающимися, если для каждого элемента из

элемент cемантических метаданных

существует
близкий элемент (показатель близости больше нуля) из

элемент семантических метаданных


Семантические метаданные являются
перекрывающимися, если для каждого элемента из существует
близкий элемент (показатель близости больше нуля)



Определение 2.3 семантических метаданных (параграф 2.4.1) допускает в качестве их элементов, как триплеты, так и отдельные элементы онтологии. Следовательно, при сравнении элементов семантических метаданных необходима возможность сравнения триплетов и отдельных элементов онтологии. Предлагается считать важность показателей семантической близости отдельных элементов онтологии одинаковой.
На основании сказанного показатели близости элементов метаданных без учета наследования и с учетом наследования
Для перекрывающихся семантических метаданных расчет близости без учета и с учетом наследования выполняется следующим образом.

, используемые в формулах 3.44 - 3.47, предлагается вычислять по следующей схеме.
Если эталонный элемент сравниваемых метаданных является триплетом, то в знаменателе результата будет 3.

Если эталонный элемент сравниваемых метаданных является трипле¬том, то в знаменателе результата будет 3


Если эталонный элемент сравниваемых метаданных является отдельным элементом онтологии, то в знаменателе результата будет 1.

Если эталонный элемент сравниваемых метаданных является отдельным элементом онтологии, то в знаменателе результата будет 1.


Если в элементе метаданных, являющимся кандидатом, нет частей для сравнения с эталонными частями, то в результат подставляется 0.

Если в элементе метаданных, являющимся кандидатом, нет частей для срав¬нения с эталонными частями, то в результат подставляется 0.




Если в эталонном элементе метаданных меньше частей, чем в элементе- кандидате, то подставляем в результат 0.


Для сравнения элементов семантических метаданных с учетом наследования используются показатели близости элементов онтологии также с учетом наследования.

А если элементы семантических метаданных необходимо сравнить без учета наследования, то и показатели близости элементов онтологии также используются без учета наследования.

А если элементы семантических метаданных необходимо сравнить без учета наследования, то и показатели близости элементов онтологии также используются без учета наследования


Полный перечень операций сравнения элементов семантических метаданных приведен в приложении 3.
В результате анализа областей значений у показателей семантической близости элементов онтологии было установлено, что

В результате анализа областей значений у показателей семантической близости элементов онтологии было установлено, что


Это равенство вытекает из выполнимости условия


Также были определены области значений показателей близости семантических метаданных.

Также были определены области значений показателей близости семантических метаданных


Таким образом, функциональность для сравнения семантических метаданных, предоставляемая семантическим ядром, может применяться тремя разными способами:
I.
для сравнения пересекающихся семантических метаданных без учета наследования;
для сравнения пересекающихся семантических метаданных с учетом наследования;
для сравнения перекрывающихся семантических метаданных с учетом наследования.
При этом следует отметить, что указанные способы оценки семантической близости могут быть применены для решения различных задач.
Например, в данном диссертационном исследовании первый способ применялся для реализации функции формирования рекомендаций, второй - для реализации функции категоризации, а третий — функции семантического поиска.
предыдущий следующий
= К содержанию =


3.4. Метод вычисления близости семантических метаданных - релевантная информация:

  1. ВВЕДЕНИЕ
    методов к обработке информации имеет высокую практическую значимость, а исследование подходов и разработка методов построения Web- портала на основе семантических технологий являются актуальными. В настоящее время исследования в области развития и внедрения семантических и портальных технологий ведутся как в России, так и за рубежом. Тем не менее, необходимо, констатировать значительный разрыв по
  2. 2.5. Использование семантического ядра портала
    методы оценки близости семантических метаданных (рис. 2.11). Метод вычисления близости семантических метаданных учитывает особенности поиска, категоризации и формирования рекомендаций. Он осно- ван на методе вычисления семантической близости элементов онтологии. Подробно указанные методы рассматриваются в третьей главе. Выводы но главе Анализ онтологического подхода к построению семантических
  3. 3.5. Метод фильтрации множества кандидатов
    метод вычисления близости семантических метаданных можно рассматривать как средство ранжирования объектов-кандидатов на основании объекта-эталона. После ранжирования те кандидаты, семантическая близость которых эталону меньше некоторого порогового значения, исключаются из результирующего множества объектов. Очевидно, что чем больше множество кандидатов, тем дольше выполняется ранжирование.
  4. 3.6. Применение методов вычисления семантической близости и фильтрации множества кандидатов
    методом вычисления семантической-близости элементов онтологии и методом фильтрации для реализации в СП функций семантического поиска, категоризации и формирования рекомендаций. Общие шаги по использованию указанных методов приведены на рисунке 3.5. {foto164} Рис. 3.5. Использование метода вычисления близости семантических метаданных Семантический поиск: Объектом-эталоном при семантическом поиске
  5. Выводы по главе
    методы вычисления близости элементов онтологии основываются на использовании сотипности (cotopy) элементов онтологии, которая определяется положением сравниваемых элементов в заданной иерархии. Для выполнения процедур поиска, категоризации и предоставления рекомендаций необходимы разные методы вычисления близости семантических метаданных, учитывающие специфику каждой из процедур.
  6. 4.1.2. Проектирование и программная реализация сервера семантических метаданных
    метода (параграф 3.4). {foto181} Рис. 4.8. Модули, составляющие программную реализацию ССМ Указанная структура ССМ реализована в виде набора классов, перечисленных на следующей UML-диаграмме (рис. 4.9). Объектная модель семантических метаданных включает классы- сущности для элементов языка RDF, сам класс семантических метаданных, классы семантических выражений, входящих в состав семантических
  7. 4.2.2. Тестирование функции семантического поиска
    методы расчета формальной релевантности имеют высокий показатель качества. В ИПС с ограниченным сло- варем понятий (тезаурус или онтология) повышается качество формирования ПОЗ и ПОД (за счет участия человека). Поэтому при сохранении качества расчета формальной релевантности в этих ИПС показатели полноты и точности поиска могут быть улучшены. Для проверки качества расчета формальной релевантности
  8. 3.3. Метод вычисления семантической близости элементов онтологии
    метод оценки семантической близости следующих элементов онтологии [25]: понятия (множество С); экземпляры понятий (множество I); отношения (множество R); атрибуты (множество А); конкретные значения (множество V). Пара сравниваемых элементов рассматривается как упорядоченная в том смысле, что первый элемент пары является эталоном, с которым сравнивается второй элемент пары - кандидат. Из этого
  9. Вычисление семантической близости экземпляра понятию
    метод Левенштейна [109], метод Q-грамм [110], алгоритм Soundex [111], алгоритм MetaPhone [112] и т.д. Любой из перечисленных алгоритмов может быть использован также и для сравнения чисел, рассматриваемых в качестве строковых
  10. 4.2.4. Тестирование функции выработки рекомендации
    методе вычисления семантической близости элементов онтологии (выражения 3.24, 3.28). Значения коэффициентов, вычисленные методом усреднения, приведены в таблице 4.9. Таблица 4.9. Коэффициенты для категоризации {foto206} Указанные значения коэффициентов были использованы для автоматического расчета схожести документов, выбранных тестерами, с остальными документами (рис. 4.18). Показателем схожести