Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

3.5. Метод фильтрации множества кандидатов



Метод вычисления близости семантических метаданных позволяет количественно оценить схожесть между двумя объектами. На практике оценка близости обычно выполняется между объектом-эталоном и множеством объектов-кандидатов. Например, поисковый запрос (эталон) сравнивается с описаниями документов (множество кандидатов), хранящихся в портале, в результате чего формируется множество релевантных запросу документов.
То есть метод вычисления близости семантических метаданных можно рассматривать как средство ранжирования объектов-кандидатов на основании объекта-эталона. После ранжирования те кандидаты, семантическая близость которых эталону меньше некоторого порогового значения, исключаются из результирующего множества объектов.
Очевидно, что чем больше множество кандидатов, тем дольше выполняется ранжирование. Поэтому уменьшение множества кандидатов за счет исключения из него объектов с заведомо низким показателем семантической близости способно увеличить вычислительную эффективность операции семантического сравнения. С этой целью разработан метод фильтрации множества кандидатов.
Метод фильтрации основан на использовании системы логического вывода для дескриптивной логики (ДЛ). Он позволяет отфильтровать из
103

множества кандидатов те объекты, семантическая близость которых объекту- эталону равна нулю. Следовательно, он применим только при вычислении близости семантических метаданных с учетом наследования, потому что только у этих показателей значение может быть равно нулю.
Метод фильтрации определяет:
способ представления семантических метаданных объектов СП в онтологии;
способ формирования запроса к системе логического вывода на основании семантических метаданных объекта-эталона.
Способ представления семантических метаданных в онтологии заключается в использовании специального отношения для связывания экземпляров, представляющих объекты СП, с их семантическими метаданными. Указанное отношение относится к неизменной (параграф 3.1) части онтологии и введено потому, что язык OWL DL в отличие от языка RDF не обладает свойством воплощения (reification). Таким образом, в онтологии, основанной на ДЛ, невозможно отразить используемую структуру семантических метаданных, то есть невозможно связать триплет с объектом с помощью отношения. Поэтому в онтологии семантические метаданные представляются лишь частично, но этого достаточно для фильтрации множества объектов- кандидатов.
Определение 3.3. В онтологии фиктивным является тот экземпляр некоторого понятия, который не соответствует никакой сущности из предметной области, а предназначен для представления этого понятия в виде экземпляра. Такие экземпляры нужны для представления семантических метаданных MDdl в онтологии ONL.
Далее описан способ представления семантических метаданных в онтологии.

Пусть - конечное множество объектов СП. В онтологии
0I:iL определено множество понятий

множество понятий

, обозначающих типы объектов
СП. Определено отношение

отношение для связывания объектов СП с их семантическими метаданными

для связывания объектов СП с их семантическими метаданными. Для каждого объекта

Для каждого объекта в онтологии создается
экземпляр

в онтологии создается
экземпляр ioj соответствующего понятия. Множество всех таких экземпляров обозначим через

Множество всех таких экземпляров обозначим через

Для каждого понятия

понятия в онтологии

в онтологии создается фиктивный экземпляр

фиктивный экземпляр

Множество всех фиктивных экземпляров в онтологии обозначим через

Множество всех фиктивных экземпляров в онтологии


Для каждого элемента smdj из семантических метаданных

семантические метаданные

объекта

объект в онтологии

в онтологии задается отношение между экземплярами в соответствии со следующими правилами (табл. 3.6), в которых экземпляр

экземпляр онтологии

соответствует объекту

объект онтологии

для которого в онтологию вносятся семантические метаданные.
Таблица 3.6. Правила представления элементов семантических метаданных объекта в онтологии

Правила представления элементов семантических метаданных объекта в онтологии



Модифицированная указанным способом онтология содержит семантические метаданные всех объектов СП, Онтология в таком виде загружается в систему логического вывода для дескриптивной логики. После этого возможно формирование запросов к СЛВ, которые бы позволяли выполнять фильтрацию множества объектов-кандидатов.
Предлагаемый способ формирования запроса позволяет составить на основании семантических метаданных объекта-эталона комплексное понятие в терминах дескриптивной логики, для которого с помощью СЛВ определяется множество экземпляров, удовлетворяющих этому комплексному понятию.
Найденные таким способом экземпляры соответствуют тем объектам СП, семантическая близость которых объекту-эталону больше нуля.
Процедура составления комплексного понятия варьируется в зависимости от используемого показателя близости семантических метаданных.
Для показателя

показатель в онтологии

комплексное понятие

комплексное понятие онтологии

формируется следующим образом.
Пусть заданы семантические метаданные

семантические метаданные в онтологии

для объекта-
эталона

объект -
эталона в онтологии онтологии

. В онтологии определено отношение

В онтологии определено отношение

, соответствующее
отношению

. Для каждого экземпляра понятия

экземпляр понятия в онтологии

существует непустое множество

непустое множество в онтологии

, включающее понятия, к которым относится экземпляр

экземпляр в онтологии


множество, включающее понятия, к которым относится экземпляр в онтологии


Тогда на основании множества элементов

множество элементов семантических метаданных объекта-эталона

семантических метаданных объекта-эталона формируется множество промежуточных
комплексных понятий С1мс в терминах дескриптивной логики по следующим правилам (табл. 3.7).
Таблица 3.7. Правила преобразования элементов семантических метаданных в понятия дескриптивной логики

Правила преобразования элементов семантических метаданных в понятия дескриптивной логики


Каждый элемент семантических метаданных преобразуется в комплексное понятие, которое включается в множество

множество в онтологии



Элементы полученного множества

множество в онтологии

входят
в состав требуемого комплексного понятия

комплексное понятие в онтологии

в виде комплексного понятия

комплексное понятие в онтологии

Понятие

комплексное понятие в онтологии

является объединением понятий из множества (выражение 3.59).

объединение понятий из множества в онтологии


комплексное понятие, описывающее требуемый тип объекта, и фор¬мируемое на основании понятий из неизменной части онтологии

- комплексное понятие, описывающее требуемый тип объекта, и формируемое на основании понятий из неизменной части онтологии.
Для показателя

показатель в онтологии

описание комплексного понятия

комплексное понятие, описывающее требуемый тип объекта, и фор¬мируемое на основании понятий из неизменной части онтологии

формируется аналогично предыдущему алгоритму за тем лишь исключением, что элементы множества промежуточных понятий С1мс используются для формирования комплексного понятия

комплексное понятие, описывающее требуемый тип объекта, и фор¬мируемое на основании понятий из неизменной части онтологии

с помощью операции пересечения (выражение 3,61).

элементы множества промежуточных понятий С1мс используются для формирования комплексного понятия с помощью операции пересечения


предыдущий следующий
= К содержанию =


3.5. Метод фильтрации множества кандидатов - релевантная информация:

  1. Выводы по главе
    методы вычисления близости элементов онтологии основываются на использовании сотипности (cotopy) элементов онтологии, которая определяется положением сравниваемых элементов в заданной иерархии. Для выполнения процедур поиска, категоризации и предоставления рекомендаций необходимы разные методы вычисления близости семантических метаданных, учитывающие специфику каждой из процедур.
  2. 3.6. Применение методов вычисления семантической близости и фильтрации множества кандидатов
    методом вычисления семантической-близости элементов онтологии и методом фильтрации для реализации в СП функций семантического поиска, категоризации и формирования рекомендаций. Общие шаги по использованию указанных методов приведены на рисунке 3.5. {foto164} Рис. 3.5. Использование метода вычисления близости семантических метаданных Семантический поиск: Объектом-эталоном при семантическом поиске
  3. 4.1.3. Вспомогательные функции
    методе формирования семантических метаданных (параграф 3.2). Загрузка метаданных в онтологию. Данная функция реализует предложенный способ представления семантических метаданных в онтологии для реализации функции фильтрации, Фильтрация множества кандидатов перед расчетом показателя {foto188} (выражение 3.60). Фильтрация множества кандидатов перед расчетом показателя {foto189} (выражение
  4. СПИСОК ИСПОЛЬЗОВАННЫХ источников
    методах в экономике». - СПб, 2004. - С. 220 .а 1 I • Мержанова М. Уроки Web-мастерства. УрокЗ // Мир ПК, № 04.2003. Нильсен Я. Постоянные посетители вашего Web-сайта // WebmasterPro_com_ua - оптимизация сайтов в поисковых системах_ Маркетинг' и реклама в интернет.Ыт/2005/. Мержанова М. Уроки Wcb-мастсрства. Урок 6 // Мир ПК, № 06.2004. Спул Дж. Образцы дизайна: эволюционный шаг в управлении
  5. 3.2.2. Виртуальная реальность компьютерных сетей
    методов построения сетей, способных продолжать нормальное функционирование при наличии частичных повреждений. Основное новшество данной сети заключалось в том, что информационные данные должны были быть помещены не в одном месте, а рассредоточены и продублированы на перекрестно соединенных друг с другом удаленных компьютерах. Последние подключены таким образом, что обмен информацией между ними
  6. 1.3. Анализ существующих применений семантических технологий в порталах
    метод использования семантических технологий для тематических порталов в сфере образования. Портал такого рода должен содержать ссылки на ресурсы в сети Интернет, из которых обучаемый может почерпнуть информацию по определенной тематике. Для создания портала необходимо: описать онтологию требуемой предметной области; описать с использованием онтологии ресурсы в сети Интернет, которые содержат
  7. 3.3. Метод вычисления семантической близости элементов онтологии
    метод оценки семантической близости следующих элементов онтологии [25]: понятия (множество С); экземпляры понятий (множество I); отношения (множество R); атрибуты (множество А); конкретные значения (множество V). Пара сравниваемых элементов рассматривается как упорядоченная в том смысле, что первый элемент пары является эталоном, с которым сравнивается второй элемент пары - кандидат. Из этого
  8. §1. Основные инструменты РR в Интернете
    методов популяризации товаров и услуг в Сети и не отражает всего спектра технологий, которыми располагает специалист PR в Интернете. Итак, рассмотрение механизмов и инструментов PR в Интернете мы начнем с явления, уже упоминавшегося в данной работе — адресного имени проекта. Доменное имя Доменное имя или URL (Uniform Resource Locator - унифицированный указатель информационного ресурса) —
  9. При использовании комплексного метода оценки эффективности…
    метода оценки эффективности рекламной деятельности в сети Интернет необходим единый инструмент для сбора всех данных, иначе не будет возможности сопоставлять и охваченную рекламой аудиторию с аудитории веб-сайта рекламодателя.Единым инструментом может стать централизованная система размещения рекламы. Централизованные системы размещения рекламы обычно используются крупными рекламными агентствами.
  10. Дейнекин Тихон Викторович. Оценка эффективности предпринимательской деятельности в сфере интернет-рекламы, 2003
    методов оценки коммуникативной и экономической эффективности рекламной деятельности субъектов предпринимательства в сети Интернет. Автором разработан комплексный метод, способный объективно оценить результаты в соответствии с возможными целями и задачами проводимых рекламных кампаний. В диссертационной работе решены следующие задачи теоретического и прикладного характера: проанализирована