Содержание пункта источника
|
Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006 |
3.5. Метод фильтрации множества кандидатов |
Метод вычисления близости семантических метаданных позволяет количественно оценить схожесть между двумя объектами. На практике оценка близости обычно выполняется между объектом-эталоном и множеством объектов-кандидатов. Например, поисковый запрос (эталон) сравнивается с описаниями документов (множество кандидатов), хранящихся в портале, в результате чего формируется множество релевантных запросу документов. То есть метод вычисления близости семантических метаданных можно рассматривать как средство ранжирования объектов-кандидатов на основании объекта-эталона. После ранжирования те кандидаты, семантическая близость которых эталону меньше некоторого порогового значения, исключаются из результирующего множества объектов. Очевидно, что чем больше множество кандидатов, тем дольше выполняется ранжирование. Поэтому уменьшение множества кандидатов за счет исключения из него объектов с заведомо низким показателем семантической близости способно увеличить вычислительную эффективность операции семантического сравнения. С этой целью разработан метод фильтрации множества кандидатов. Метод фильтрации основан на использовании системы логического вывода для дескриптивной логики (ДЛ). Он позволяет отфильтровать из 103
множества кандидатов те объекты, семантическая близость которых объекту- эталону равна нулю. Следовательно, он применим только при вычислении близости семантических метаданных с учетом наследования, потому что только у этих показателей значение может быть равно нулю. Метод фильтрации определяет: способ представления семантических метаданных объектов СП в онтологии; способ формирования запроса к системе логического вывода на основании семантических метаданных объекта-эталона. Способ представления семантических метаданных в онтологии заключается в использовании специального отношения для связывания экземпляров, представляющих объекты СП, с их семантическими метаданными. Указанное отношение относится к неизменной (параграф 3.1) части онтологии и введено потому, что язык OWL DL в отличие от языка RDF не обладает свойством воплощения (reification). Таким образом, в онтологии, основанной на ДЛ, невозможно отразить используемую структуру семантических метаданных, то есть невозможно связать триплет с объектом с помощью отношения. Поэтому в онтологии семантические метаданные представляются лишь частично, но этого достаточно для фильтрации множества объектов- кандидатов. Определение 3.3. В онтологии фиктивным является тот экземпляр некоторого понятия, который не соответствует никакой сущности из предметной области, а предназначен для представления этого понятия в виде экземпляра. Такие экземпляры нужны для представления семантических метаданных MDdl в онтологии ONL. Далее описан способ представления семантических метаданных в онтологии.
Пусть - конечное множество объектов СП. В онтологии 0I:iL определено множество понятий , обозначающих типы объектов СП. Определено отношение для связывания объектов СП с их семантическими метаданными. Для каждого объекта в онтологии создается экземпляр ioj соответствующего понятия. Множество всех таких экземпляров обозначим через Для каждого понятия в онтологии создается фиктивный экземпляр Множество всех фиктивных экземпляров в онтологии обозначим через Для каждого элемента smdj из семантических метаданных объектав онтологии задается отношение между экземплярами в соответствии со следующими правилами (табл. 3.6), в которых экземпляр соответствует объекту для которого в онтологию вносятся семантические метаданные. Таблица 3.6. Правила представления элементов семантических метаданных объекта в онтологии
Модифицированная указанным способом онтология содержит семантические метаданные всех объектов СП, Онтология в таком виде загружается в систему логического вывода для дескриптивной логики. После этого возможно формирование запросов к СЛВ, которые бы позволяли выполнять фильтрацию множества объектов-кандидатов. Предлагаемый способ формирования запроса позволяет составить на основании семантических метаданных объекта-эталона комплексное понятие в терминах дескриптивной логики, для которого с помощью СЛВ определяется множество экземпляров, удовлетворяющих этому комплексному понятию. Найденные таким способом экземпляры соответствуют тем объектам СП, семантическая близость которых объекту-эталону больше нуля. Процедура составления комплексного понятия варьируется в зависимости от используемого показателя близости семантических метаданных. Для показателя комплексное понятие формируется следующим образом. Пусть заданы семантические метаданные для объекта- эталона . В онтологии определено отношение , соответствующее отношению . Для каждого экземпляра понятия существует непустое множество , включающее понятия, к которым относится экземпляр
Тогда на основании множества элементов семантических метаданных объекта-эталона формируется множество промежуточных комплексных понятий С1мс в терминах дескриптивной логики по следующим правилам (табл. 3.7). Таблица 3.7. Правила преобразования элементов семантических метаданных в понятия дескриптивной логики
Каждый элемент семантических метаданных преобразуется в комплексное понятие, которое включается в множество Элементы полученного множествавходят в состав требуемого комплексного понятия в виде комплексного понятия Понятие является объединением понятий из множества (выражение 3.59).
- комплексное понятие, описывающее требуемый тип объекта, и формируемое на основании понятий из неизменной части онтологии. Для показателяописание комплексного понятия формируется аналогично предыдущему алгоритму за тем лишь исключением, что элементы множества промежуточных понятий С1мс используются для формирования комплексного понятия с помощью операции пересечения (выражение 3,61).
|
|
|
|
|
= К содержанию =
|
|
|
|
|
3.5. Метод фильтрации множества кандидатов - релевантная информация: |
- Выводы по главе
методы вычисления близости элементов онтологии основываются на использовании сотипности (cotopy) элементов онтологии, которая определяется положением сравниваемых элементов в заданной иерархии. Для выполнения процедур поиска, категоризации и предоставления рекомендаций необходимы разные методы вычисления близости семантических метаданных, учитывающие специфику каждой из процедур.
- 3.6. Применение методов вычисления семантической близости и фильтрации множества кандидатов
методом вычисления семантической-близости элементов онтологии и методом фильтрации для реализации в СП функций семантического поиска, категоризации и формирования рекомендаций. Общие шаги по использованию указанных методов приведены на рисунке 3.5. {foto164} Рис. 3.5. Использование метода вычисления близости семантических метаданных Семантический поиск: Объектом-эталоном при семантическом поиске
- 4.1.3. Вспомогательные функции
методе формирования семантических метаданных (параграф 3.2). Загрузка метаданных в онтологию. Данная функция реализует предложенный способ представления семантических метаданных в онтологии для реализации функции фильтрации, Фильтрация множества кандидатов перед расчетом показателя {foto188} (выражение 3.60). Фильтрация множества кандидатов перед расчетом показателя {foto189} (выражение
- СПИСОК ИСПОЛЬЗОВАННЫХ источников
методах в экономике». - СПб, 2004. - С. 220 .а 1 I • Мержанова М. Уроки Web-мастерства. УрокЗ // Мир ПК, № 04.2003. Нильсен Я. Постоянные посетители вашего Web-сайта // WebmasterPro_com_ua - оптимизация сайтов в поисковых системах_ Маркетинг' и реклама в интернет.Ыт/2005/. Мержанова М. Уроки Wcb-мастсрства. Урок 6 // Мир ПК, № 06.2004. Спул Дж. Образцы дизайна: эволюционный шаг в управлении
- 3.2.2. Виртуальная реальность компьютерных сетей
методов построения сетей, способных продолжать нормальное функционирование при наличии частичных повреждений. Основное новшество данной сети заключалось в том, что информационные данные должны были быть помещены не в одном месте, а рассредоточены и продублированы на перекрестно соединенных друг с другом удаленных компьютерах. Последние подключены таким образом, что обмен информацией между ними
- 1.3. Анализ существующих применений семантических технологий в порталах
метод использования семантических технологий для тематических порталов в сфере образования. Портал такого рода должен содержать ссылки на ресурсы в сети Интернет, из которых обучаемый может почерпнуть информацию по определенной тематике. Для создания портала необходимо: описать онтологию требуемой предметной области; описать с использованием онтологии ресурсы в сети Интернет, которые содержат
- 3.3. Метод вычисления семантической близости элементов онтологии
метод оценки семантической близости следующих элементов онтологии [25]: понятия (множество С); экземпляры понятий (множество I); отношения (множество R); атрибуты (множество А); конкретные значения (множество V). Пара сравниваемых элементов рассматривается как упорядоченная в том смысле, что первый элемент пары является эталоном, с которым сравнивается второй элемент пары - кандидат. Из этого
- §1. Основные инструменты РR в Интернете
методов популяризации товаров и услуг в Сети и не отражает всего спектра технологий, которыми располагает специалист PR в Интернете. Итак, рассмотрение механизмов и инструментов PR в Интернете мы начнем с явления, уже упоминавшегося в данной работе — адресного имени проекта. Доменное имя Доменное имя или URL (Uniform Resource Locator - унифицированный указатель информационного ресурса) —
- При использовании комплексного метода оценки эффективности…
метода оценки эффективности рекламной деятельности в сети Интернет необходим единый инструмент для сбора всех данных, иначе не будет возможности сопоставлять и охваченную рекламой аудиторию с аудитории веб-сайта рекламодателя.Единым инструментом может стать централизованная система размещения рекламы. Централизованные системы размещения рекламы обычно используются крупными рекламными агентствами.
- Дейнекин Тихон Викторович. Оценка эффективности предпринимательской деятельности в сфере интернет-рекламы, 2003
методов оценки коммуникативной и экономической эффективности рекламной деятельности субъектов предпринимательства в сети Интернет. Автором разработан комплексный метод, способный объективно оценить результаты в соответствии с возможными целями и задачами проводимых рекламных кампаний. В диссертационной работе решены следующие задачи теоретического и прикладного характера: проанализирована
|
|
|