Предоставьте надежные информационные ресурсы тем, кто
принимает решения. Узнайте о простом, но полезном способе комбинировать
возможности обработки данных awk и XML, который можно использовать для
представления системных данных о UNIX® в удобной для восприятия форме,
пригодной для отправки в корпоративную сеть или интернет. UNIX создает
отчеты о производительности и загруженности системы, расходе ресурсов и
отчеты с другой системной информацией, которая может использоваться
управляющими персоналом и другими заинтересованными лицами.

Внешние
требования радикально изменили бизнес-процессы. Современная юридическая
и административная среда делают эффективное использование критической
информации обязательным для бизнеса. Требования, содержащиеся к примеру
в законе Sarbanes-Oxley (Sarbanes-Oxley Act — SOX), принуждают к
эффективному использованию и управлению информацией. Чтобы
соответствовать требованиям федерального правительства о
протоколировании финансовой информации, и способствовать собственному
контролю с обратной связью за операционной, организации сегодня должны
использовать методики управления сбором информации. Учитывая эти
требования, управление сбором системных данных приобрело более важное
значение, чем было при его традиционном назначении – мониторинг системы
и инструмент для решения проблем.

Файлы системного
журнала являются наиболее важными и часто исследуемыми инструментами
мониторинга системы. В UNIX® каждая программа, которая создает
журнальные файлы, либо пишет информацию непосредственно в свой
журнальный файл, либо собирает информацию посредством службы syslogd.
Хотя регулярный просмотр и анализ этих файлов должен быть базовой
методикой, используемой системными администраторами, реальность часто
отличается от желаемого. Из-за значительных объемов данных, которыми
надо управлять, многие системные администраторы не имеют ни времени, ни
желания анализировать системные журналы. Однако, на современном рынке
работа с системными журналами является наиболее важной задачей,
игнорировать которую нельзя.

Нежелание использовать
журнальные файлы с данными может повлечь не только проблемы с
правительственными службами, но также негативно повлиять на культуру
работы предприятия в целом. Неспособность управлять этими ресурсами
неизбежно приведет к неэффективному процессу системного
администрирования, контроля и управления. Как следствие, также возросла
важность методов, используемых при сборе и распространении информации.

Учитывая
эти обстоятельства, система управления журналами должна развиваться за
рамки традиционного использования журнальных файлов. Предприятиям нужен
простой способ управления большими объемами информации. Предприятие
всегда заинтересовано во внедрении наиболее эффективного и менее
затратного метода выполнения любой задачи. Поэтому, чтобы решение было
реализовано, оно должно удовлетворять этим требованиям.

В начало

листинг 1)
будет готов к обработке текста из входного файла, его надо чуть-чуть
доработать. Для выполнения действий перед началом обработки текста в
awk можно определить начальный блок кода BEGIN. ПосколькуBEGIN обрабатывается до того, как awk начнет обработку входного файла, необходимо создать:

  • Переменная разделителя полей
    (FS)
  • Оператор объявления XML
  • Корневой тег
    <root>

В программном коде ниже будет определен журнальный файл
FS, затем будет использоваться оператор print для помещения первых XML-выражений в файл данных.

Кавычкам в операторе print
предшествует обратная косая черта (backslash), поэтому awk верно
интерпретирует выражение. Awk не запишет обратную косую черту в
XML-файлы.

листинге 2.

листинга 3, преобразует данные журнального файла в XML-структуру.

листинг 4). Блок END
выполняется после того, как будут обработаны все строки из входного
файла. Этот блок следует использовать для того, чтобы напечатать
закрывающий корневой XML-тег </root>.

листинге 5 показана законченная awk-программа.

В начало

листинге 6 иллюстрирует структуру data island.

листинге 7. Тег <table>
при помощи атрибута datasrc обращается к XML data island (блок данных XML), который идентифицируется атрибутом logID.

листинг 8).

листинг 9). Сам по себе, элемент <td>
не может быть привязан к данным, тогда как тег <span> может. XML-данные отображаются при помощи тэга <span> с атрибутом
datafld, находящимся в колонках таблицы. Атрибут datafld определяет XML-элемент, который будет помещен в ячейку таблицы. Значение атрибута
datafld должно соответствовать имени XML-тега. Следует вспомнить, что именами XML-тегов, созданных утилитой awk, были <timestamp>
и <description>.
По мере того как XML-файл считывается, для каждого элемента,
идентифицирующегося тегом, создаются дополнительные табличные строки.

Листинг 10 содержит завершенный HTML-файл.


Awk для предприятия

В
этой статье были показаны впечатляющие результаты совместного
применения awk и XML. В статье было показано как использовать XML для
структуризации и объединения данных в информацию, подходящую как для
размещения в сетях масштаба предприятия, так и для размещения ее в
Интернете. Также было показано как сделать информацию доступной для
широкого круга интересующихся лиц.

Работа со
своевременной и точной информацией увеличивает доходы предприятия.
Поэтому, если руководители частной или государственной компании
оперируют этой информацией, то это является существенным преимуществом
данной компании. Методы, описанные в этой статье, можно приспособить
под свои нужды, или использовать их в качестве основы собственного
метода обработки информации, реализуемого при помощи awk и XML/HTML. По
минимуму, эта статья должна укрепить понимание исключительной
полезности awk в качестве основного инструмента для извлечения и
подготовки данных и для обоснования нужности одного из назначений XML —
универсальное хранилище данных.

Об авторе


Грейс
Уокер (Grace Walker), партнер в фирме Walker Automated Services в
Чикаго, Иллинойс — многосторонне образованный, обладающий огромным
опытом консультант в области IT. Она работала в информационных
технологиях в качестве менеджера, администратора, программиста,
инструктора и Web-дезайнера в различных сферах, включая
телекоммуникации, образование, финансы и средства программного
обеспечения. Вы можете связаться с ней по электронному адресу gwalker@walkerautomated.com

Карта сайта: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34