Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

1.2.2.1. Понятие семантических метаданных



Понятие метаданных давно используется в области информационных систем. В качестве определения чаще всего используется следующее: «метаданные - это данные о данных». Метаданные призваны улучшить управляемость и доступность данных, так как предоставляют дополнительную информацию, которая нужна для выполнения этих задач.
Метаданные описывают объекты информационной системы.
Метаданные обычно состоят из набора предопределенных элементов (свойств или атрибутов), которые описывают различные аспекты объекта. Структура метаданных может варьироваться, но всегда имеет следующие характеристики:
конечный набор атрибутов;
наличие названий у атрибутов;
закрепленный смысл каждого атрибута (трактовка значения атрибута);
возможность присвоить одному атрибуту несколько значений.
Структура метаданных, обладающая данными характеристиками, достаточна для описания свойств объекта, существенных с точки зрения решаемой задачи. Любой объект описания может быть рассмотрен в трех разных аспектах [19]:

Структура. Объект характеризуется как внутренней структурой, так и внешней структурой — отношениями с другими объектами в информационной системе. Чем больше объект структурирован — внутренне и внешне, - тем объект проще находить, проще им манипулировать и определять соответствие другим объектам.
Контекст. Контекст является внешним по отношению к объекту свойством и определяется тем, кто, зачем, когда и как создал этот объект. Контекст позволяет идентифицировать объект среди множества других объектов.
Контент. Объект создается в информационной системе для предоставления пользователям необходимой информации, и эта информация передается через информационное содержание объекта - контент.
Метаданные могут описывать один или более аспектов объекта из трех приведенных выше. В рамках семантических технологий наибольшее внимание уделяется исследованию таких метаданных, которые описывают контекст и контент объекта.
В данном диссертационном исследовании используется следующее определение семантических метаданных.
Определение 1.2.
Семантические метаданные - метаданные, описывающие контекст и/или контент объекта в информационной системе с помощью понятий предметной области, определенных на некотором языке описания онтологии.
Пусть Q = (q,qk} - конечное множество объектов ИС. Тогда, используя определение 1.1 онтологии О (параграф 1.2.1.1), определим семантические метаданные для объекта q,eQ как конечное множество MD(q(), содержащее упорядоченные пары (с^Ц).
MD(qf) = {(ci(, k1( ),...,(€,„,kin)}, где (1.2)
сиеС- понятия из онтологии, относящиеся к объекту описания q;,
kine(0;l]~ коэффициент, обозначающий релевантность понятия с1П объекту
я,-
Семантические метаданные, как и классические метаданные, логически неразрывно связаны с описываемым информационным объектом.
Кроме этого, семантические метаданные не могут быть созданы без существующего описания знаний предметной области на каком-либо языке представления знаний. Семантические метаданные позволяют:
устранить лексическую многозначность терминов, используемых для описания информационных объектов;
определять соответствие между различными информационными объектами, используя онтологию.
предыдущий следующий
= К содержанию =


1.2.2.1. Понятие семантических метаданных - релевантная информация:

  1. 4.2.3. Тестирование функции категоризации
    понятий в семантических метаданных. Автоматическая категоризация выполнялась также с учетом указанного выше ограничения. Решение об отнесении документа к рубрике принималось на основании значения показателя близости SMC0 (выражение 3.45) между семантическими метаданными рубрики и документа. Выполнение автоматической категоризации с использованием ранее заданных коэффициентов показало полное
  2. ВВЕДЕНИЕ
    понятий) предметной области через связи между ними; модель отражает различные точки зрения на предметную область. Рассматриваемые в данном диссертационном исследовании Web- порталы являются многопользовательскими ИС, которые предоставляют унифицированный доступ к различным информационным источникам и программным приложениям. Web-порталы, как правило, обрабатывают большой объем информации. С
  3. 1.2.2. Семантические метаданные
    понятий, заключающих знания предметной области, определяется через описание отношений между понятиями. В информационной системе, основанной на онтологии, семантика объектов должна описываться в терминах онтологии, и, следовательно, необходимы подходы к описанию семантики объектов ИС. Одним из подходов является создание семантических
  4. 1.3. Анализ существующих применений семантических технологий в порталах
    понятий и описаний ресурсов, а также для перехода между ними. При добавлении описаний ресурсов в онтологию повторной генерации страниц портала не требуется. В данном проекте основной решаемой задачей является создание удобной для пользователя навигационной структуры портала. Плюсом предложенного в проекте подхода является то, что обучаемому вся необходимая информация предоставляется в одном
  5. 2.1. Анализ вариантов использования онтологии
    понятия из одной онтологии противоречит описанию понятия из другой онтологии. Решение этой проблемы возможно на основе использования «эпистемологического сдвига» [75], реализации которого для онтологического подхода пока не предложено [76]. Проблема 3. При использовании языка описания онтологий, основанного на логическом формализме, возникает проблема производительности программного обеспечения
  6. 2.2. Место и функции семантического ядра портала
    понятия, введенные в онтологиях верхнего уровня. 5. Семантический портал разрабатывается с использованием семантических и прикладных (программных, системных) технологий и реализует функции для решения поставленных задач. Следует отметить, что исследования в области семантических технологий и создания онтологий верхнего уровня проводятся в большом числе стран и организаций и имеют значительные (в
  7. 2.3.2. Определение онтологии, основанной на дескриптивной логике
    понятия (одноместные предикаты), атомарные отношения (двухместные предикаты) и экземпляры (константы). К ним могут применяться конструкторы языка для создания комплексных понятий и комплексных отношений. Дескриптивным языком с минимальной выразительностью является атрибутивный язык (AL), синтаксис и семантика которого представлены в таблице 2.3. Семантика языка определяется с помощью
  8. 2.4.1. Структура семантических метаданных
    понятия, отношения и др.), то субъекты, предикаты и объекты в содержании семантического атрибута могут принимать различные значения. {foto39} Рис. 2.9. Возможные значения семантического атрибута В соответствии с определением 2.2 в онтологии содержатся: понятия (множество С); экземпляры понятий (множество I); конкретные значения (множество V); отношения (множество R); атрибуты (множество А).
  9. 2.5. Использование семантического ядра портала
    понятий предметной области. Функция формирования списка объектов, связанных с исходным объектом в семантическом портале может иметь различное применение. В разработанном семантическом портале эта функция СЯП использовалась для выполнения категоризации — проверки соответствия объекта заданным категориям. Для выполнения категоризации объектов с учетом их семантики необходимо наличие семантических
  10. 3.1. Состав и структура онтологической модели для использования в семантическом портале
    понятия, которые соответствуют объектам семантического портала. Например, в рамках данного диссертационного исследования в онтологию приложения вошли такие понятия как «документ», «ссылка», «рубрика», «область знаний» и «специалист». Таким образом, онтологическая модель, используемая в семантическом портале, в общем случае состоит из четырех частей: онтологии верхнего уровня, онтологии предметной