Искусство в IT-технологиях...

Коршунов Андрей Александрович. Система управления содержанием WEB сайта, 2004

11.1 Проблемы управления содержанием в среде WEB

По мере развития Интернет и его использования для решения реальных задач в образовании. науке, бизнесе, промышленности и других сферах деятельности, растет количество людей, в прямые служебные обязанности которых входит публикация информации в сети.
Известной системой «Yandcx», предоставляющей поисковый сервис по русскоязычной части WEB. на середину 2002 года проидексировано более 58 миллионов документов общим объемом более I Тб, размещенных на 480 тысячах серверах (18]. Таким образом, люди активно (по служебной необходимости или инициативно) вовлекаются в процесс управления содержанием в среде WEB, где публикация материалов является только одним из этапов этого процесса
1. Прежде чем обсуждать проблемы управления содержанием, необходимо, насколько это возможно, определить значение данного термина Под содержанием будем понимать информационное (смысловое) наполнение документа, ту информа\(ию. которую несет в себе документ некоторая уменьиюст степень неопределенности знания [19]. Обычно в докумеїпге выделяют три составляющие: содержание, структура (части документа и связи между ними) и внешнее представление (способ отображения). Однако термин содержание далее также будет употребляться в более широком смысле, особенно^когда речь идет об управлении им. В этом случае содержанием является весь документ, как совокупность трех его составляющих и, зачастую, все множество документов как единое целое, особенно, когда употребляется словосочетание управление содержанием. Употребление термина содержание в том или ином смысле будет понятно из контекста обсуждения. Термины документ и материал будем считать синонимами.
В силу' значительного объема и сложности правил управления информацией в различных сферах человеческой деятельности невозможно определить универсальную и полную схему процесса управления содержащем. В то же время, можно выдел иг ь его наиболее общие структурные составляющие. К ним можно отнести следующие основные этапы.
Подготовка материалов. На этом этапе происходит определение источников информации, ее сбор, систематизация и анализ Далее, отобранные для публикации материалы помещаются в некоторое хранилище. Действия по сбору и анализу информации являются очень специфичными для различігьіх задач и зависят от внешних условий, в которых они выполняются. Данный этап является начальным в процессе управления содержанием и во многом определяет успешное прохождение всего цикла управления.
Хранение материалов. Хранилище материалов, кроме своей основной задачи -хранения и извлечения материалов для их редактирования или публикации, должно предоставлять гибкие средства поиска необходимой информации, разграничение прав доступа к содержанию и т.п.
Публикация материалов. Этот этап можно назвать конечным этапом пню а управления информацией. Здесь организуется доступ к информации конечных
пользователей - тех людей (или процессов), кому оиз предназначена. Данный этап состоит в извлечении материалов из хранилища, приведении их к виду, понятному конечным пользователям, а также в решении технических и организационных проблем доступа к информации.
В указанных выше основных этапах процесса управления содержанием не отражено такое важное действие, как редактирование содержания. Редактирование содержания подразумевает целенаправленный перевод (преобразование) человеком информации в, заранее определенную форму, а также изменение (включая актуализацию) информации. Говоря об управлении содержанием в среде WEB, естественно полагать, «по такой формой является электронное представление информации. В процессе управления содержанием редактирование информации может производиться как на этапе подготовки, так и на этапе хранения информации. Кроме того, редактирование информации может являться переходным действием между различными этапами (подготовка-хранение, хранение-публикация). С другой стороны, можно найти такие процессы, в которых редактирование информации вообще может отсутствовать.
Таким образом, редактирование информации можно рассматривать как отдельный процесс, не связанный напрямую с циклом управления содержанием, но, возможно, применяемый в нем. Редактирование может состоять из нескольких этапов, в зависимости от поставленных целей. К таким этапам могут относиться первоначальный ввод информации и ее изменение автором, редакторская правка, возврат материалов автору на редактирование. Если же учитывать возможность многопользовательского режима редактирования документа, то количество этапов и взаимосвязей между ними растет и еще более усложняется. Технологии редактирования содержания должны соответствовать конкретной задаче. От выбора инструментов для редактирования информации зависит эффективность этого процесса и его применение в различных сферах, в частности, для управления содержанием.
В зависимости от задач, в которых применяется процесс управления содержанием, информационные потоки имеют более сложные формы, чем изображенные на следующей схеме.

Tax как мы рассматриваем системы управления содержанием WEB, естественно считать, что для публикации информации будет использоваться среда WWW. Следует отметить, что публикация материалов в Интернет понимается как размещение информации в сети и использование для доступа к ней того или иного сервиса (FTP, TELNET. GOPHER. WAIS, WWW). При этом значительная доля публикуемой в настоящее время информации помещается на WEB сайтах. Существуют некоторые особенности, связанные с управлением информацией в сетевой среде и, в частности, в среде WEB. В отличие от классического понятия публикации материалов, ассоциирующегося с печатным изданием, размещение информации в сети подразумевает использование средств вычислительной техники на всех этапах управления информацией Кроме того, процесс публикации происходит гораздо быстрее и динамичнее.
Вся процедура подготовки материалов и их публикации отличается простотой и доступностью. Круг потенциальных пользователей такой информации практически не ограничен Еще одна особенность управления содержанием WWW связана с источниками информации, о чем будет отмечено ниже, в подразделе 11.3.
Именно эти особенности публикации материалов стати причиной столь быстрого развития среды WEB. Вначале это были отдельные энтузиасты, в основном ученые и программисты, подхватившие идею проекта Тима Бсрнерса Ли об информационной среде, базирующейся на телекоммуникационных технологиях, для проведения совместных исследований в области физики высоких энергий, выросшую впоследствии в глобальную информационную среду World Wide Web. Им не составляло труда использовать язык разметки (HTML) для форматирования документов и файловую структуру- для их размещения (принцип построения \VEB достаточно подробно описан в Раздел 1).
С расширением аудитории и выходом WEB за рамки применения только в научных изысканиях, стали появляться системы, превратившиеся в дальнейшем в средства визуального ред актирования документов и поддержки структуры статических (представляющих собой набор HTML-страниц) Web-сайтов: FrontPage [20], Dreamweaver [21], HomeSite [22] и др. С помощью этих систем можно легко создавать и модифицировать сайты, не обладая специальной квалификацией и не вдаваясь в тонкости HTML. Но сейчас подобные системы по целому ряду причин перестают удовлетворять требованиям различных сфер деятельности человека которые предъявляются к публикации информации в WWW. В числе таютх требований - независимость от среды представления, возможность обеспечить эффективный поиск, повторное использование как документа целиком, так и отдельных его элементов. Информация в отдельных сетях и Интернет в целом сама по себе становится ресурсом, требующим должной организации и управления. Однако принципы построения сервиса WEB не отвечают поставленным требованиям. Основными проблемами здесь являются следующие.
Использование языка HTML для разметки документов. Первоначально язык HTML был предназначен для разметки научных документов и их последующего совместного использования сотрудниками разных институтов и лабораторий. HTML состоял из небольшого фиксированного набора элементов- заголовков нескольких уровней, абзацев, списков и др., но главной его особенностью было использование гиперссылок и специальных меток (anchors, см. Раздел I, подраздел 1.2.1) для указания точек перехода Все вместе ПОЗВОЛЯЛО достаточно легко размечал, простые документы и устанавливать связи как между нихш, так и между компонентами одного документа.
Однако изначально задуманный как язык структурной разметки документов, в своем развитии HTML превратился в язык разметки для их представления. Его конструкции в большей степени отвечают за внешний вид, чем отображают структуру документа Исходный текст становится практически нечитаемым, а доля полезной (не относящейся к разметке) информации состааляст лишь несколько процентов. Повторное использование
таких документов, например, представление в другом виде или редактирование, становится затруднительным, а зачастую невозможным.
Хранение документов, как набора файлов. Такой подход удобен для реализации протокола взаимодействия клиента и сервера в среде WEB. Однако в атом случае организация управления документами становится достаточно сложной задачей. Манипуляция файлами с использованием команд операционной системы не отвечает большинству требований, предъявляемых в настоящее время к управлению содержанием. Написание специальных скриптов или программ является относительно трудоемкой задачей, требующей соответствующей высокой квалификации. К тому же сфера их применения достаточно специфична и, «скак правило», ограничивается предметной областью поставленной задачи.
Изначально статический характер WEB. Как уже неоднократно отмечалось (см. Раздел I), протокол HTTP, лежащий в основе WEB предназначен для выдачи по запросу клиента (пользователя) документа, размеченного с использованием языка HTML Для идентификации документа в подавляющем большинстве продуктов, реализующих WEB сервер, используется имя файла, в котором он хранится в файловой системе компьютера Такой подход идеально подходит для управления статическими или редко изменяющимися документами и совершенно непригоден для динамической генерации содержания по запросу. Для устранения этого недостатка был предложен протокол CGI, реализующий интерфейс между запускаемым по запросу клиента приложением и HTTP сервером. Однако здесь возникают проблемы, обусловленные как техническими вопросами (например, производитслыюсть сервера), так и организационными аспектами (соответствующая квалификация для написания приложений) использования CGI протокола
Таким образом, указанные проблемы являются своеобразным тормозом на пути эффективного использования сервиса WEB. Становится очевидным, что от преодоления этих препятствий зависит дальнейшее развитие сервиса Далее рассмотрим один из подходов к комплексному решению возникших проблем, который выразился в появлении систем управления содержанием WEB. Созданию одной из таких систем и посвящена настоящая работа
предыдущий следующий
= К содержанию =


11.1 Проблемы управления содержанием в среде WEB - релевантная информация:

  1. Введение
    проблемы, возникшие еще на этапе создания и развития новых технологий, решены в настоящее время. Важнейшей в этом перечне является проблема управления содержанием WEB сайта. Термин «содержание» в данном случае не затрагивает семантическую сторону' информации, представляемой в WEB пространстве, а подразумевает информационное наполнение или собственно данные. Настоящая работа посвящена созданию
  2. 1.4 Вывод
    проблема будет рассмотрена в Раздел II). Таким образом, был пройден определенный цикл, когда WEB породил новую область своего применения, связанную с появлением WEB сервисов (см подраздел 1.2 настоящего раздела), а именно- приложений, предоставляющих определенные услуги пользователях! и функционирующих в среде WEB. Это, в свою очередь, привело к развитию основ самой среды. Однако эволюция WEB
  3. Раздел II Управление содержанием в среде WEBКак было показано в предыдущем разделе, наибольшее распространение в Интернет получил сервис WEB. Именно благодаря его появлению произошел очень быстрый рост популярности Интернет и, как следствие, рост размеров сети и объема содержащейся в ней информации. Часто под термином «разместить документы в Интернет» понимают помещение информации на WEB сайте. Такое широкое использование Интернет во всех сферах жизнедеятельности человека предъявляет новы
    проблемы управления содержанием, а также представлены подходы к их решению, реализованные в уже существующих программных комплексах. Кроме этого, на основании анализа этих программных подходов будут определены основные задачи, на решение которых направлена созданная автором система управления содержанием в среде
  4. 11.2 Развитие систем управления содержанием.
    проблемы объективны. Стремительное развитие WEB привело к его использованию для решения задач, в значительной степени отличных от тех, для которых он был первоначально задуман и реализован. Эволюция WEB породила целый ряд новых сфер его применения К их числуэ в первую очередь, следует отнести разработку WEB приложений. В отличие от статичных сайтов, такие приложения используют среду WEB для
  5. 11.3 Основные задачи систем управления содержанием WEB.
    проблемы управления содержанием сайта, что отражается на усилении той или иной стороны функционирования продукта. Отметим также две разработки отечественных фирм (DynaSile и Communiware), что немаловажно для учета российской специфики Интернет и проблем управления информацией в
  6. Заключение
    проблем, определяющих настоящее и будущее среды WEB, в первую очередь- с позиции управления информацией, которая определяет ее содержание. В ходе такого анализа выявлено, что в основе существующих в настоящее время проблем управления информацией лежат технологические особенкосги WEB протоколов и стандартов (HTTP, HTML). Именно функциональные возможности и простота применения этих протоколов
  7. 3.2.2. Виртуальная реальность компьютерных сетей
    проблему свободы личности в Сети, которая не имеет однозначного решения: с одной стороны, ее провозглашение в виде «Декларации независимости киберпространства» Дж.П.Барлоу, с другой, широкое распространение программ сбора данных о пользователе в электронной коммерции [168]. Как отмечает А.Е.Войскунский [44, 67], под электронным фронтиром о образном плане подразумевается обращение
  8. 2.1. Анализ вариантов использования онтологии
    проблем в области использования онтологий, которые нужно учитывать при разработке семантических порталов: Проблема 1. Невозможность автоматического определения соответствия двух произвольных онтологий. Эта проблема возникает при интеграции информации из различных источников. В качестве преодоления данного ограничения в [74] предлагается создавать онтологии с использованием общих онтологий
  9. 3.1 Разработка плана банковских маркетинговых интернет-коммуникаций и этапы контроля.
    проблемы займет некоторое время. По этой же причине особое внимание должно быть уделено составлению договоров со сторонними организациями, принимающими участие в проекте, поскольку лишь юридически оформленные отношения в данном случае могут являться единственным «рычагом» при контроле качества работы
  10. Основные правила написания текста для Интернета
    проблема классификации PR-текстов в Интернете совершенно не получила своего научного осмысления ни в отечественной, ни в зарубежной пиарологии. В данном диссертационном исследовании мы приведем классификацию и жанровую типологию PR-текстов в киберпространстве как членение всего корпуса PR-текстов в киберпространстве по признакам адресата и стилистике написания. В своем сочинении И.Р. Гальперин,