Искусство в IT-технологиях...

Васильев Иван Анатольевич. Методы и инструментальные средства построения семантических WEB-порталов, 2006

4.2.1. Тестирование функции аннотирования объектов



Функция формирования семантических метаданных (аннотирования) является основополагающей в информационных системах, учитывающих се-
мантику информации при реализации информационных процессов.
В разработанном семантическом ядре остальные функции основываются на обработке семантических метаданных объектов портала.
Однако автоматический переход от синтаксиса к семантике является нетривиальной задачей, и разработанный метод аннотирования не исключает участия человека при составлении семантических метаданных объектов портала. Поэтому основной целью тестирования была проверка простоты использования методов и программных средств составления семантических метаданных.
Для этого в онтологию было помещено 1227 экземпляров различных понятий предметной области. Из них 112 экземпляров были выявлены в результате анализа документов, относящихся к выбранной предметной области. Эти экземпляры содержали от 1 до 3 лексических меток. Остальные 1115 экземпляров были автоматически сгенерированны специально созданной программой. Для таких экземпляров использовались лексические метки родительских понятий.

Результат поиска понятий и экземпляров из онтологии в тексте документа


Рис. 4.14. Результат поиска понятий и экземпляров из онтологии в тексте документа
Наполненная экземплярами онтология использовалась для аннотирования 27 рубрик каталога и 160 документов, относящихся к выбранной предметной области. Аннотирование выполнялось в соответствии с методом формирования семантических метаданных (параграф 3.2).
Для 16 документов при формировании семантических метаданных использовался алгоритм поиска понятий и экземпляров в тексте документа (рис. 4.14).
Найденные в документах понятия и экземпляры использовались для формирования триплетов семантических метаданных документов (рис. 4.15).

Экранная форма для создания элемента семантических метаданных


Рис. 4.15. Экранная форма для создания элемента семантических метаданных
Хотя алгоритм поиска понятий и экземпляров в тексте документов ускоряет процесс формирования семантических метаданных, но, тем не менее, процесс формирования семантических метаданных является трудоемким и требует хорошего знания структуры и состава используемой онтологии. В связи с этим возникла необходимость развития средств визуального представления онтологии и текста документа при составлении семантических метаданных.

Аннотации для остальных 144 документов были сгенерированны специально созданной программой в соответствии с методом формирования семантических метаданных без использования алгоритма поиска понятий и экземпляров в тексте.
Для каждого документа генерировалось от 5 до 10 элементов семантических метаданных. Созданные таким образом семантические метаданные не отражают текстовое содержание документов, но позволяют протестировать программную реализацию метода формирования семантических метаданных, а также сформировать множество объектов портала, достаточное для тестирования остальных функций СЯП.
Для проверки корректности программной реализации правил формирования триплетов (параграф 3.2), сгенерированные аннотации, содержащие 1059 триплетов и отдельных элементов, были загружены в систему логического вывода вместе с целевой онтологией, В СЛВ был выполнен логический вывод для поиска противоречий элементов семантических метаданных ограничениям онтологии. Поиск дал отрицательный результат, что можно считать показателем корректной работы протестированных программных алгоритмов.
Тестовая иерархия из 27 рубрик (приложение 5) также была проаннотирована с использованием метода формирования семантических метаданных.
При составлении семантических метаданных необходимо указывать значение коэффициента релевантности элементов метаданных объекту описания (определение 2.3).
В случае с документами и рубриками значение этого коэффициента устанавливалось равным 1. Для документов это оправдано потому, что их семантические метаданные отражают наличие понятий и экземпляров в тексте документов. Для рубрик это оправдано потому, что они группируют объекты портала и, следовательно, их семантические метаданные описывают максимально возможную семантику группируемых объектов. Каждый отдельный объект, относящийся к рубрике, содержит в своих семантических метаданных соответствующие коэффициенты. Например, у документа все коэффициенты равны 1, а у специалиста эти коэффициенты могут отличаться от 1, так как в каких-то частях предметной области он обладает меньшими знаниями, а в каких-то - большими.
предыдущий следующий
= К содержанию =


4.2.1. Тестирование функции аннотирования объектов - релевантная информация:

  1. 4.2. Тестирование семантического ядра портала
    функции: аннотирование объектов; семантический поиск; формирование списка объектов, связанных с исходным объектом; формирование списка объектов, похожих на исходный объект. Функция аннотирования упрощает процесс формирования семантических метаданных для объектов портала. Семантический поиск позволяет искать объекты портала с учетом их семантики. Формирование списка объектов, связанных с исходным
  2. 3.8.2. Требования к объекту тестирования
    функционирование программы во времени; корректное выполнение всех функций меню программы; корректное завершение работы
  3. ВВЕДЕНИЕ
    тестированы в процессе практической реализации Web-порталов. Результаты исследования использовались при разработке и реализации Web-портала для «Центра профессиональной подготовки специалистов нефтегазового дела» ТПУ и Web-портала системы управления знаниями компании «ЭлеСи». Диссертационное исследование выполнялось в соответствии с проектом «Создание информационно-программной среды научно-
  4. 2.5. Использование семантического ядра портала
    функций семантического ядра онтологии предметных областей и семантические метаданные объектов СП используются при обработке объектов. Как уже говорилось, семантическое ядро предоставляет функции: описания объектов портала; семантического поиска; формирования списка объектов, связанных с исходным объектом; формирования списка объектов, похожих на исходный объект. Семантическое описание объекта
  5. 4.2.2. Тестирование функции семантического поиска
    тестировании удовлетворенность не была оценена потому, что сехмантические метаданные документов были сгенерированы произвольным образом и не отражали текстового содержания документов. Тем не менее, при достижении высокой степени соответствия семантических метаданных текстовому содержанию документов можно ожидать высоких показателей полноты и точности поиска с помощью предложенных алгоритмов. В
  6. 4.2.4. Тестирование функции выработки рекомендации
    тестирования трем тестерам было предложено 3 произвольных документа из 160-ти проаннотированных. Семантические метаданные каждого из трех предложенных документов сравнивались тестером с семантическими метаданными оставшихся 159-ти документов. При этом тестер указывал близость элементов семантических метаданных в диапазоне (0;1], а также указывал, считает ли он семантические метаданные схожими
  7. 4.3.2. Портал «Корпоративная система управления знаниями»
    тестирования были зафиксированы высокие показатели качества выполнения алгоритмических процедур поиска, категоризации и предоставления рекомендаций. Результаты исследований современного уровня развития семантических технологий, разработка функциональной структуры и программная реализация компонентов семантического ядра способствуют практическому решению задачи создания семантического
  8. ЗАКЛЮЧЕНИЕ
    тестирование программного кода на сгенерированном множестве семантических метаданных. Разработанные структуры, методы и алгоритмы построения семантических Web-порталов, а также соответствующее программное обеспечение, внедрены в двух организациях (ЗЛО «ЭлеСи», Центр профессиональной переподготовки специалистов нефтегазового дела ТПУ) при создании для них семантических порталов различного
  9. 2.5. Характеристика Web - сайта коммерческого банка как нового вида обслуживания в системе Интернет - банкинга
    тестирования, Web-cepBep может быть размещен в Интернете. После этого требуется решить вопро^ привлечения на него пользователей — текущих и потенциальных клиентов банка. Поэтому следующим этапом является проведения комплекса мероприятий по привлечению посетителей на сервер. Указанные три этапа завершает четвертый — подведение итогов на основе сравнения полученных результатов с запланированными в
  10. Исходя из концепции Шефтсбери , ощущение — это всеобъемлющая функция, представляющая собой магическую связь, которая создает условия для вибрации настроенной души в унисон божественной гармонии.
    объекта . Что касается цвета, притушенные краски, подчиненные общему замыслу являются лучшим применением цвета, поскольку естественное Локк Дж. Сочинения. - с.9 2 См. там же: с.446. Шефтсбери Э. Эстетические опыты. — М.:Искусство, 1975. - 542 с. 4 См там же: с. 482. наслаждение от произведения искусства пробуждает сюжет и мастерство художника, а не пестрота красок. Таким образом, «хотя