авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 | 3 | 4 | 5 |   ...   | 10 |
-- [ Страница 1 ] --

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ,

МЕХАНИКИ И ОПТИКИ

Сборник

тезисов докладов

конференции молодых

ученых

Выпуск 1

посвящен

11M-годовщине со дня создания СПбГУ ИТМО

Санкт-Петербург

OM1M

Сборник тезисов докладов конференции молодых ученых, Выпуск 1. – СПб: СПбГУ ИТМО, OM1M. – O35 с.

В издании «Сборник тезисов докладов конференции молодых ученых, Выпуск 1» публикуются работы, представленные в рамках VII Всероссийской межвузовской конференции молодых ученых, которая будет проходить 20–23 апреля 2010 года в Санкт-Петербургском государственном университете информационных технологий, механики и оптики.

В 2009 году Университет стал победителем многоэтапного конкурса, в результате которого определены 12 ведущих университетов России, которым присвоена категория «Национальный исследовательский университет».

Министерством образования и науки Российской Федерации была утверждена Программа развития государственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный университет информационных технологий, механики и оптики» на 2009– годы.

Санкт-Петербургский государственный университет информационных технологий, механики и оптики, Авторы, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УДК 515.142. МЕТОДИКА АВТОМАТИЗАЦИИ ОТЛАДКИ И ТЕСТИРОВАНИЯ РЕАЛИЗАЦИИ АЛГОРИТМОВ ОБРАБОТКИ ИЗОБРАЖЕНИЙ И.В. Байдаков, М.В. Стержанов (Белорусский государственный университет информатики и радиоэлектроники) Научный руководитель – д.ф.-м.н., профессор Л.И. Минченко (Белорусский государственный университет информатики и радиоэлектроники) В процессе разработки алгоритмов обработки изображений обязательно возникают следующие задачи. 1) Тестирование алгоритма на корректность отработки. 2) Тестирование используемого подхода или алгоритма на скорость выполнения.

Анализ производительности алгоритма зачастую лучше всего осуществляется аналитическими методами, позволяющими получить некоторую зависимость производительности от входных данных или их размера. Но при аналитическом подходе возможны следующие проблемы. 1) При использовании внешних библиотек по обработке изображений, зачастую невозможно оценить зависимость производительности от входных данных аналитически, например, в случае, если исходный код не доступен. 2) Корректное с точки зрения математики описание алгоритма вовсе не обозначает, что его практическая реализация будет наилучшей. В качестве примера можно привести алгоритм корневой сортировки, имеющий линейную сложность [1]. Язык программирования, платформа могут вносить дополнительные ограничения.

Классическим подходом к решению поставленных проблем является эмпирическое тестирование алгоритмов, к которым относятся ручное и модульное тестирование. Ручное тестирование заключается в создании графического приложения, которое запускается с входным параметром в виде некоторого изображения и выводит результат обработки на экран. После этого пользователь визуально сравнивает полученный результат с ожидаемым (который не формализован и находится в виде визуального образа в сознании тестировщика).

Модульное тестирование представляет собой более совершенный в смысле автоматизации вид тестирования: тестировщик формализирует свои ожидания. При этом результат обработки изображения сравнивается с изображением, располагающимся в тестовом методе или на диске.

Недостатки ручного тестирования очевидны: большая трудоёмкость, возможность ошибки визуального контроля, которая зависит от психофизиологического состояния человека. Достоинства: простота реализации и выполнение (с некоторой, невысокой, долей приемлемости) обеих задач.

Недостатки модульного тестирования: трудоёмкость написания тестовых случаев. В самом тесте можно поточечно описать только простейшие, генерируемые «на лету»

изображения. Созданные вручную тестовые изображения будут примитивного содержания.

Для более сложных изображений требуется сравнение выходного изображения с эталонным (ground truth data) [2]. Возникает проблема получения эталонного изображения. Его нельзя нарисовать вручную в графическом редакторе, а затем сравнивать с полученным результатом обработки алгоритма. Например, ручное утоньшение реального штрихового изображения достаточно сложно. Это очень трудозатратная работа с большой вероятностью ошибок.

Очевидно, что эталонное изображение должно быть результатом машинной обработки.

Основная идея решения представляет из себя синтез обоих подходов с пакетным режимом обработки данных и статистической обработкой результатов. Используется большая выборка входных изображений, на которых можно осуществлять тестирование. Каждое входное изображение обрабатывается некоторым алгоритмом, в результате чего получается выходное изображение, которое сохраняется на диске. При этом сохраняется информация о времени отработки конкретного алгоритма для конкретного изображения. После завершения работы предлагаемой системы, на выходе имеется множество выходных изображений и данные о времени обработки каждого из них.

Проведём анализ предлагаемого решения. Как и в ручном тестировании, мы можем визуально проверить полученные результаты. Отличие же от ручного тестирования следующее. Но ручное тестирование и отладка[3] производятся циклически: выбор входного изображение – запуск алгоритма – анализ выходного изображения. В предлагаемом подходе подобного цикла нет. Поэтому нет и временных издержек на переходы между этапами, т.к.

производится простой просмотр массива изображений с целью выявления дефектов работы алгоритма. Тем не менее, данный аспект несёт недостатки ручного тестирования – психофизическая утомляемость после сосредоточенного просмотра некоторого количества изображений устаёт. Но уровень приемлемости тестирования в этом случае будет интуитивно выше, т.к. будет просмотрено больше изображений.

Лучшие результаты пакетное тестирование даёт, если рассматривать его «автоматическую» составляющую. 1) имеется возможность проверить надежность работы алгоритма на большом множестве экспериментальных изображений. В совокупности с качественным модульным тестированием и визуальным просмотром подмножества результатов повышает приемлемость реализации алгоритма. 2) можно быстро проверить различные методик решения одной задачи на корректность. Пусть имеются несколько конкурирующих алгоритмов, результаты которых совпадают при одинаковом входном изображении. Примерами могут служить такие операции математической морфологии, как эрозия и дилатация. С помощью простого автоматизированного сравнения результатов отработки нескольких алгоритмов можно говорить об очень высокой степени корректности алгоритмов в случае совпадения результирующих множеств. Т.о. задача по проверке алгоритмов на эффективность выполнения значительно упрощается, и сводится, фактически, к поиску и формированию множества входных изображений. 3) имеется возможность статистической обработки результатов работы алгоритмов с их последующим анализом.

Пусть имеется предположение о линейной зависимости времени обработки алгоритма от площади входного изображения. На сформированном множество входных изображений произведем статистический анализ времени работы. В случае большого значения среднеквадратичного отклонения, можно сделать следующие предположения: 1.

Некорректность работы алгоритма на некотором изображении. Например, алгоритм преждевременно завершает работу;

поэтов время изображения будет мало и отобразится на среднеквадратичном отклонении. Задав некоторый порог отклонения, можно автоматизированным способом выявить некорректность работы алгоритма. 2. Алгоритм работает слишком долго на некотором изображении. Тогда, возможно, что реализация алгоритма содержит ошибку, либо предположение о зависимости времени работы алгоритма неверно.

В любом случае, предлагаемый подход может указать проблематичные места с точностью до входного изображения. Это актуально в случае, если множество входных изображений превышает несколько сотен, т.к. достижение этого же результат с помощью ручного тестирования будет очень трудозатратно.

Литература 1. McConnell J., Analysis of Algorithms: An Active Learning Approach, 2d ed. – Jones & Bartlett. – 2008. – РР. 451.

2. Liu Wenyin, Dov Dori. A protocol for performance evaluation of line detection algorithms. – Machine Vision and Applications archive, Volume 9, Issue 5–6 (March 1997). – Рp. 240–250.

3. Andreas Zeller. Why Programs Fail: A Guide to Systematic Debugging. Morgan Kaufmann, San Francisco. – 2005.

УДК 004. ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ РАСПОЗНАВАНИЯ РЕЧИ В КОЛЛ-ЦЕНТРАХ П.В. Балакшин Научный руководитель – д.т.н., профессор А.Ю. Тропченко Многие современные технические устройства оснащены дополнительными функциями, облегчающими управление. Особенно стоит выделить возможность голосового управления, основанного на автоматическом распознавании речи. Голосовой интерфейс на языке пользователя – это наилучшее решение. Действительно, ведь речь – это наиболее натуральная, удобная, эффективная и экономичная форма человеческого взаимодействия.

Дополнительным подтверждением актуальности могут служить крупные научно исследовательские центры (Массачусетский Технологический Университет, Исследовательский центр речевых технологий IBM), специализированные международные конференции: InterSpeech, SpeCom и другие.

Примерно 5 лет назад автоматическое распознавание речи нашло применение в достаточно новой для России области: в работе колл-центров. Сначала это были простейшие IVR (Interactive Voice Recognition) системы, заменившие собой импульсный набор. В настоящее время ряд колл-центры всерьёз рассматривают возможность частичной замены операторов на некие технические устройства, способные распознавать речь, обрабатывать её и выдавать осмысленный и необходимый ответ клиенту. Целью данной работы является исследование возможностей использования автоматического распознавания речи в работе колл-центров.

Следует подчеркнуть, что общение оператора колл-центра и клиента происходит в виде живой беседы. Следовательно, распознавание речи должно происходить если не в реальном, то в квазиреальном масштабе времени. Распознавание с такой скоростью стало возможным благодаря современным вычислительным машинам с высокой производительностью.

Преимуществами систем распознавания речи являются:

1. Быстрая верификация голоса клиента во время ответа на один несложный вопрос.

2. Возможность работы с клиентами в круглосуточном режиме.

3. Существенное снижение времени ожидания (handle time).

4. Возможность использовать распознавание речи в качестве дополнительного источника информации не только при разговоре, но и при дальнейшем анализе работы колл центра.

К недостаткам использования систем распознавания речи стоит отнести:

1. Невозможность распознавания с точностью 100% из-за большого количества различных особенностей произношения, таких как диалект, дефекты речи, эмоции, и ассоциативным восприятием речи человеком.

2. Технология распознавания речи позволяет распознать и обработать звонки только из заранее подготовленного списка.

Однако существуют критерии, не позволяющие однозначно отнести их к преимуществам или недостаткам. Например, размер речевого словаря при распознавании речи. С одной стороны, меньший словарь обеспечит более высокую точность распознавания. С другой стороны, существует вероятность распознать редкий вопрос с очень плохой точностью.

Таким образом, можно сделать вывод, что применение распознавания речи в колл центрах имеет смысл, но в сочетании с другими средствами автоматизации. Кроме того, необходима строгая настройка системы распознавания речи по нескольким критериям, обеспечивающая наиболее выгодное использование и с точки зрения производительности колл-центра, и с точки зрения увеличения финансовой эффективности работы. Одним из примеров активного использования распознавания речи в работе колл-центров является горячая линия аэропорта г. Дубай.

УДК 004. АНАЛИЗ МЕТОДОВ МАРКИРОВАНИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ В ПРОСТРАНСТВЕННОЙ ОБЛАСТИ Ван Цзянь Научный руководитель – д.т.н., профессор А.Ю. Тропченко Краткое вступление, постановка проблемы. Проблема защиты авторского права на мультимедиа информацию привела к необходимости разработки технологии защиты авторского права и технологии защиты от копирования мультимедиа информации. Одной из таких технологий является цифровое маркирование данных. При этом необходимо создать алгоритмы, которые позволяли бы «подписывать» или маркировать мультимедийные данные без потери информативности и качества воспроизведения, однако при этом в любой момент можно было бы определить, кому принадлежат авторские права на тот или иной мультимедийный продукт. Данные, скрыто встроенные в мультимедийные продкукты называют «цифровым водяным знаком» – ЦВЗ.

В общем виде проблема маркирования изображений рассматривается как проблема передачи слабого сигнала малой мощности (ЦВЗ) в широкополосном сигнале (изображении) таким образом, чтобы быть визуально не восприимчивым и устойчивым к искажениям, которые могут появиться в процессе передачи информации.

В данной работе рассматривается метод внедрения ЦВЗ на основе выделения в изображении простанственных локальных областей или блоков близкой яркости. Основной интерес этого метода заключается в том, что он обесчивает хороший компромисс между устойчивостью внедрения ЦВЗ и объемом вычислительных затрат. Особенностью метода является адаптируемость при внедрении ЦВЗ к содержанию (однородности) блоков изображения, в которые производится внедрение. Рассматривается также процедура извлечения ЦВЗ на предмет определения авторского права.

Целью настоящей работы является исследование алгоритмов внедрения идентификационной информации в сжимаемое изображение.

Базовые положения исследования. Основой метода является модифицированный алгритм Bruyndonckx.

ЦВЗ представляет собой строку бит. Для повышения помехоустойчивости применяется код БЧХ (Код Боуза-Чоудхури-Хоквингема). Внедрение осуществляется за счет модификации яркости блока 88 пикселей. Процесс встраивания осуществляется в три этапа.

1. Классификация, или разделение пикселей внутри блока на две группы с примерно однородными яркостями.

2. Разбиение каждой группы на категории, определяемые данной сеткой.

3. Модификация средних значений яркости каждой категории в каждой группе.

Промежуточные результаты. Модификация. Итак, множество пикселей оказалось разделенным на блоки пяти подмножеств: две зоны 1 и 2, две категории А и В и пиксели, не принадлежащие какой-либо зоне (для блоков первого типа). Встраивание бита ЦВЗ осуществляется по следующему правилу: встраивается единичный бит, если средняя яркость в блоке первой категории выше, чем средняя яркость в блоке второй категории, встраивается нулевой бит в противном случае.

С другой стороны, необходимо обеспечить равенство значений яркости в каждой зоне, для достижения этого, яркость всех пикселей одной зоны меняется одинаково. Алгоритм извлечения ЦВЗ является обратным алгоритму внедрения. При этом вычисляются средние значения яркостей и находятся разности.

Основной результат. В данной статье представлен новый подход к вложению цифрового водяного знака в изображение. Такой подход основан на выделении в изображении пространственных однородных по яркости блоков и встраивании кодов ЦВЗ в пикселы блока. Код вкладывается в порядке, определяемом отношением между средними значениями внутри блока. Исследовано влияние различных параметров вложения на видимость ЦВЗ и его устойчивость к извлечению.

УДК 004.032. СТРУКТУРА СИСТЕМЫ СБОРА И ОБРАБОТКИ ГЕОФИЗИЧЕСКИХ ХАРАКТЕРИСТИК Т.Е. Войтюк Научный руководитель – д.т.н., профессор А.В. Демин Краткое вступление, постановка проблемы. С каждым годом объем промышленной добычи нефти и газа в нашей стране увеличивается. Однако при такой интенсивной добыче многие нефтегазовые компании сталкиваются с уменьшением запасов полезных ископаемых.

Для поддержания добычи нефти и газа на прежнем уровне компаниям дополнительно необходимо проводить геологическую разведку и разработку новых месторождений. Однако такие месторождения располагаются в удаленных местах с суровым климатом. Вследствие этого растет себестоимость добываемых ресурсов, усложняется их транспортировка.

С другой стороны, в месторождениях, находящихся на поздней стадии освоения, еще сохранились значительные запасы нефти и газа вследствие экстенсивных методов добычи в прежнее время. Эти запасы располагаются в различных продуктивных пластах, а добыча из отдельно взятого пласта, как реализовывалось раньше, экономически нецелесообразно.

Основным способом решения данной проблемы является добыча нефти из нескольких пластов одновременно. Для решения этой задачи необходимо осуществлять постоянный мониторинг количественных и качественных параметров работы скважины, а также проводить анализ геофизической обстановки для формирования решений по оптимизации работы скважинного оборудования. Использование новейших информационных технологий в процессе разработки нефтегазовых месторождений России становится первостепенной задачей при уменьшении легкодоступной ресурсной базы.

Цель работы. Для увеличения эффективности добычи нефти и контроля месторождения необходимо определить структуру информационно-измерительной системы, которая позволит производить постоянный мониторинг работы скважины.

Базовые положения исследования. Разработка структуры информационно измерительной системы сбора и обработки геофизических характеристик состоит из классификации объектов геофизической информации, определения основных подсистем и их функциональности, описания алгоритма работы.

Промежуточные результаты. В ходе работы определены основные объекты геофизической информации. Проведена систематизация объектов, используя иерархический метод классификации, и описание преобразования геофизической информации при переходе между уровнями иерархии. Описана структура информационно-измерительной системы с разбиением на подсистемы по функциональному назначению. Разработан алгоритм анализа геофизических характеристик с учетом структуры системы. Анализ производится в реальном масштабе времени, учитывает взаимодействие между модулями, составляющими структуру системы сбора и обработки, и предусматривает интерактивную работу с системой оператора.

Основной результат. В результате работы была описана структура информационно измерительной системы. Данную структуру можно применить для проектирования системы сбора и обработки различных геофизических характеристик в реальном масштабе времени в не зависимости от состояния скважины и измеряемых величин.

УДК: 004. СИСТЕМА СТЕРЕОВОССТАНОВЛЕНИЯ ТРЕХМЕРНЫХ ОБЪЕКТОВ А.Н. Волкович (Объединенный институт проблем информатики Национальной академии наук Беларуси) Научный руководитель – д.ф.-м.н., профессор А.В. Тузиков (Объединенный институт проблем информатики Национальной академии наук Беларуси) Решение проблем построения современных программно-алгоритмических систем хранения, обработки и передачи мультипоточных данных, является одной из наиболее актуальных задач в современном компьютером видении. Перспективным направлением развития данных исследований является разработка программно-алгоритмического обеспечения для высокоточного восстановления исследуемых реальных объемных сцен.

Кроме того объективная реальность накладывает на реализуемые системы необходимость эффективной реализации на основе распараллеленной обработки и аппаратного ускорения для обеспечения возможности оперативного получения результатов.

Одним из подходов в построении трехмерных моделей реальных объектов является подход, основанный на использовании нескольких цифровых изображений. Выделяют два подхода для получения трёхмерной информации по изображениям: подход, использующий некоторые характерные признаки изображённых объектов, и подход, использующий плотные карты диспаратности. Алгоритмы построения плотной карты диспаратности позволяют для каждой точки одного изображения найти соответствующую ей точку на втором изображении, либо определить, что такой точки нет.

Методы построения плотной карты диспаратности можно разделить на две группы:

локальные методы, которые работают с небольшими окрестностями точек для нахождения соответствий (например, блочный метод), и глобальные, которые работают со строками изображения (динамическое программирование) или с изображением целиком (метод максимального потока в графе). Локальные методы могут быть достаточно эффективны, однако они чувствительны к локально-неоднозначным регионам (например, регионам с однородной текстурой). Глобальные методы менее чувствительны к таким регионам, однако они более ресурсоёмки.

В ходе работ были исследованы, изучены возможности повышения эффективности вычислений при автоматизированном восстановлении трехмерных сцен за счет параллельной реализации различных этапов процесса средствами MPI. Рассмотрена применимость средств графических ускорителей (GPGPU) для реализации высокопроизводительных вычислений.

Кроме того было проведено исследование возможностей графических ускорителей для эффективной реализации алгоритмов обработки изображений и ряда вычислительно сложных задач. Предложены способы декомпозиции исходных данных в рассматриваемых задачах реконструкции трехмерных сцен для параллельной обработки средствами nVIDIA CUDA.

В принципе, задача распараллеливания блочного метода и метода динамического программирования не относится к разряду сложных. Благодаря тому, что вычисления производятся в локализованных регионах, очевидна возможность разделения задачи.

В ходе работ были реализованы модули вычисления плотных карт диспаратности, позволяющие получать желаемые результаты по скорости обработки изображений.

Закономерно возникло желание получить программную реализацию системы, выполняющую real-time восстановление объемных данных получаемых с видеокамер. Однако реализация модулей только в виде консольных приложений не является удобной для дальнейшей отладки методов и эргономики работы. Отсюда возникает необходимость создания оконного интерфейса для работы с системой.

Для этих целей было реализовано программное решение StereoGUI. Данная программная реализация представляет собой Windows-приложение содержащее средства ввода информации со стерео устройств, библиотеки вычисления диспаратности и средства отображения входной, промежуточной и итоговой информации.

Поскольку непосредственно процесс организации получения информации из видеоустройства не является задачей хорошо проработанной, видится возможным использование сторонних библиотек. В конкретном случае был использован модуль TVideoGrabber являющийся разносторонним компонентом для видео изображении и медиа проигрывателей совместимый с Delphi and C++Builder (как VCL компонент) или с Visual Basic and Visual C++ (ActiveX OCX компонент). На основном окне приложения организовывается выбор устройств используемых для ввода левого и правого изображений, алгоритм обработки.

После инициализации устройств ввода открываются окна, в которых производится отображение данных получаемых с камер. По окончанию подстройки устройств ввода пользователь может выбрать алгоритм обработки и произвести запуск расчета.

Поскольку заранее не известны параметры вычислительной системы счет производится по выборке кадров. Выборка формируется по принципу готовности предыдущего результата.

Таким образом, выборка происходит не равномерно, но при этом не происходит отставания обрабатываемого потока по времени.

Модуль расчета производит построение плотной карты диспаратности средствами nVidia CUDA. Далее производится отображение построенной карты в отдельном окне. Из данного окна пользователь может вызвать трехмерное отображение модели. Трехмерная модель отображается средствами OpenGL. В окне отображения модели производится вывод трехмерной сцены. Так же пользователю предоставлена возможность производить перемещение и вращение смоделированной поверхности.

Рис. 1. Приложение StereoGUI Дальнейшее развитие системы предполагает переработку системы из бинокулярной в n-окулярную, интеграцию в общий графический интерфейс других структурных модулей, для создания дружественной пользователю рабочей среды. Кроме того, в конце 2009 года корпорация nVidia объявила в рамках проекта CUDA поддержку среды разработки OpenCL, что при небольшой адаптации позволит сделать модули GPGPU вычислений не зависимыми от аппаратного обеспечения.

УДК 004.4' СИСТЕМА ПОРОЖДЕНИЯ ДОКУМЕНТОВ В ФОРМАТЕ WORD PROCESSING ML Д.В. Деев (Уральский государственный лесотехнический университет) Ю.С. Окуловский (Уральский государственный университет им. А.М. Горького) Научный руководитель – д.т.н., профессор В.П. Часовских (Уральский государственный лесотехнический университет) В современных корпоративных информационных системах (КИС) возникает необходимость порождения документов в формате doc. Поскольку этот формат является стандартом де-факто для хранения и передачи документов в электронном виде на сегодняшний день. Однако данный формат является проприетарным и его структура является закрытой.

Разработчики КИС часто используют следующие форматы, которые могут быть отображены MS Word и другими текстовыми процессорами: HTML, RTF и XML. HTML – язык простой для понимания, однако шаблоны документов в этом формате сложно набирать с клавиатуры. Кроме того, он не поддерживает колонтитулы и вставку файлов (изображений и т.д.). Решением этой проблемы может служить MHT. Однако, у него есть более критичный недостаток – далеко не все офисные приложения способны понимать его.

Достоинствами формата RTF являются его широкая распространенность в офисных пакетах и возможность описать произвольный документ MS Word. С другой стороны, данный формат имеет очень сложную, интуитивно не понятную структуру и в текстовом виде его затруднительно использовать при изменении шаблонов документов с клавиатуры.

Рассмотрим, наконец, формат XML, а именно, его схему Word Processing Markup Language, который может использоваться для создания документов. Основными достоинствами XML документов Microsoft Word являются:

данный формат по своей структуре напоминает структуру doc-файлов, поэтому хорошо распознается и пересохраняется данным редактором;

для описания данных в XML для Microsoft Word не требуется полного соответствия схеме XML;

документ Microsoft Word описывается на стандартизированном XML языке;

формат XML для Microsoft Word является открытым.

Однако у XML для Microsoft Word есть ряд недостатков:

большой объем кодирования. Язык Word Processing ML имеет избыточный синтаксис и даже простые выражения иногда требуют большого количества тегов;

интуитивно не понятная структура разметки текста. В данном языке описание разметки текста строится не в соответствии с ожидаемой структурой, как это реализовано, например, в HTML:

• выделение полужирным начертанием является открытием нового участка текста, а не применение вложенного атрибута к существующему;

• списки в Word Processing ML не являются отдельной сущностью как HTML. В данном языке это стиль параграфов, который имеет атрибут стиля списка, и атрибут структуры списка. Данные атрибуты ссылаются на стили в преамбуле документа, которые ссылаются на еще более развернутые стили;

• разметка таблицы в Word Processing ML. В каждой ячейке необходимо указывать ее ширину, несмотря на то, что все размеры столбцов указываются в теге таблицы;

существует ряд особенностей, которые осложняют работу человека с данным форматом;

• большинство единиц измерения выражаются в твипах (1/20 точки). Даже простое вычисление полей документа, например все поля 3 см, будет выглядеть так:

3566,57224=1699,716721700. Эти вычисления сложно провести в уме, наоборот хочется задать значения в сантиметрах или миллиметрах;

• размер шрифта указывается в полупунктах, т.е., чтобы указать шрифт 12 кегля, мы должны написать 24. Поскольку человеку проще задавать шрифт «как есть», то здесь несложно ошибиться;

• чтобы выделить цветом какой-либо текст, можно использовать маркер. И, несмотря на то, что цветов даже в безопасной веб-палитре много. Инструмент Маркер имеет ограниченный набор цветов, за каждым из которых закреплено слово, а не шестнадцатиричный код как, например, для цвета шрифта.

Важным недостатком всех рассмотренных решений является отсутствие стандарта, который бы позволил подставлять в шаблон текстовые переменные. Проблема генерации документов из КИС, таким образом, не решена. На имеющихся языках можно создать шаблон документа, но нельзя подставить туда автоматически значения переменных.

Язык Thorn – это технология преобразования текста, которая хорошо справляется с рядом недостатков языка Word Processing ML. Документ Thorn состоит из набора тегов. При разборе тега, выполняется внешняя программа, которая описывает преобразования параметра тегов. Thorn является мощной технологией преобразования текстов, и успешно использовался на протяжении нескольких лет для создания сайтов, кодогенерации и других схожих задач. Представляется эффективным применение данного языка для документов в формате Word Processing ML.

В результате создана система команд, которая позволяет описывать все основные элементы текстового документа в формате Word Processing ML: заголовки, параграфы, списки, таблицы и другие элементы с указанием уникальных стилей или стилей по умолчанию, если ничего не добавлено;

колонтитулы, где могут быть указаны элементы зависящие от размера порожденного документа, которые невозможно задать из КИС, например, номера страниц и общее количество страниц;

параметры печати страницы: поля, дополнительные отступы, формат бумаги, ориентация и т.п.

Другим результатом работы является система, которая способна породить как сам документ, так и программу, которая может породить документ с параметрами, что выгодно отличает данную систему от других систем порождения документов. Кроме того данная система успешно использовалась при создании нескольких уже внедренных в производство КИС.

УДК 336. ЗАЩИТА ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА РАБОЧЕГО ЛИСТА ЭЛЕКТРОННЫХ ТАБЛИЦ А.М. Зиновьев (Санкт-Петербургский государственный горный институт им. Г.В. Плеханова (технический университет)) Научный руководитель – к.п.н., доцент Н.И. Сатарова (Санкт-Петербургский государственный горный институт им. Г.В. Плеханова (технический университет)) В последнее время в связи с широким доступом в сети Интернет и локальных сетях всё острее встаёт вопрос защиты информации от несанкционированного доступа и пиратства.

Существует множество способов защиты информации. В нашем исследовании будет рассмотрена защита рабочих листов электронных таблиц средствами Microsoft Excel, Calc OpenOffice.org.

В электронных таблицах можно защищать как отдельные участки (диапазоны ячеек), так и рабочие листы и даже всю книгу. По-умолчанию, всем ячейкам на листах одной книги может быть включён режим защиты, для активации которого требуется включить защиту листа, задать пароль, задать, если надо, диапазон, в котором будет включена или выключена защита. Также, можно использовать пароли на разные диапазоны. Паролей может быть несколько на разные участки. Помимо этого, можно включить режим сокрытия формул, таким образом, пользователь не сможет увидеть, как именно, откуда и когда получены значения в выбранную ячейку и не сможет никак её изменить.

Одним из наиболее простых для пользователя, являющимся в тоже время неожиданным для злоумышленника, способом защиты информации на листе может быть метод простого перекрашивания текста в цвет основного фона на листе. Это собьёт с толку потенциального пирата, запутает его намерения. Кроме того можно использовать новый замечательный вариант – сочетать защиту листа с помощью инструментов MS Excel, Calc OpenOffice.org и закрашивание текста.

В работе предлагается разработать пример реализации такой защиты рабочего листа.

Комплексный подход к решению проблем обеспечения информационной безопасности документов подразумевает, что рядовой пользователь должен знать и уметь самостоятельно применять подобные простые способы защиты документов.

УДК 004. МЕТОДЫ ПАССИВНОГО ОПРЕДЕЛЕНИЯ КООРДИНАТ ОБЪЕКТОВ В.О. Иванова Научный руководитель – д.т.н., профессор А.В. Демин В настоящее время основными методами пассивного измерения координат объектов в оптическом спектре диапазона длин волн являются триангуляционный и амплитудный методы. Амплитудный метод основан на оценке измерения относительного изменения уровня сигнала. Триангуляционный метод основывается на измерении пеленга данных объектов с разнесенных на некоторое расстояние точек.

Триангуляционный метод измерения координат сводится к последовательному измерению пеленга на цель и дальнейшему расчету дальности до цели по двум пеленгам и базе между точками измерения дальности. Однако при измерении координат быстродвижущихся целей использование данного метода без оценки параметров движения цели может привести к измерению дальности до ложной цели. Другим недостатком данного метода является значительные ошибки измерения дальности при малых углах пеленгов.

Таким образом, при триангуляционном методе для повышения точности измерения координат, в особенности высокоскоростных целей при малых углах пеленга, необходимо достаточно длительное накопление информации о цели.

Принцип работы данного метода позволяет сделать выводы о том, что при измерении координат высокоскоростных, высотных целей находящихся на стационарном участке траектории использование данного метода наиболее эффективно при малых углах, а также при малых дистанциях, где триангуляционный метод работает с большими ошибками.

Алгоритм определения кинематических характеристик целей триангуляционным методом основан на определении дальности до цели, ее угловых координат и измерении параметров вектора её скорости в инерциальном пространстве по результатам последовательных замеров пеленгов на неё с помощью пассивных оптико-электронных систем. Алгоритм работает в широком диапазоне дальностей и углов пеленга на цель.

Для повышения точности определения параметров движения цели может быть использована адаптивная процедура, включающая коррекцию интервала времени между последовательными этапами обработки. С целью оценки применимости данной методики измерения координат были проведены точностные исследования в зависимости от различных параметров и показано, что точность определения угла и дальности до цели зависит в основном от двух факторов: значений угла пеленга и приращения угла пеленга за интервал между измерениями. При этом второй фактор оказывает существенно большее влияние, чем первый.

Помимо погрешностей, вызванных неточностью измерения угла пеленга, существует также ряд методических и инструментальных погрешностей, учет которых необходим при решении практических задач. Методические погрешности алгоритма расчета параметров движения цели связаны с несоответствием гипотезы о прямолинейном и равномерном движении, принятой в данной методике, реальной траектории его движения. Уменьшение методической погрешности алгоритма возможно путем усложнения расчетных формул для других гипотез относительно траектории движения цели. Инструментальные погрешности связаны с конкретным вычислительным устройством, реализующим данный алгоритм.

Предложенный алгоритм позволяет определять кинематические параметры движения цели: дальности и направления вектора скорости по замерам пеленгов на цель пассивными оптическими средствами. Точность определения дальности и углов зависит от точности замеров пеленгов, интервала времени между замерами пеленгов и дальности до цели.

Зависимость среднеквадратической ошибки оценок дальности и углов от среднеквадратической ошибки замеров углов пеленга в пределах, которые зависят от начальной дальности: носит линейный характер, что подтверждает правомерность использования формулы для расчета дисперсии оценки дальности. Для повышения точности определения параметров движения цели может быть использована адаптивная процедура, включающая коррекцию интервала времени между последовательными этапами обработки.

Принятие решения на осуществление коррекции проводится на основе анализа точности получаемых оценок на каждом шаге обработки.

В рамках данной работы предложен алгоритм обзора пространства и обнаружения цели.

Алгоритм может быть оптимизирован на основе решения задачи минимизации будущего риска путем реализации алгоритмов адаптивного выбора порога фильтрации сигналов от цели и повышения вероятности правильного обнаружения путем введения программируемого обзора пространства.

УДК 004.415.532. ГЕНЕТИЧЕСКИЙ АЛГОРИТМ ГЕНЕРАЦИИ ТЕСТОВЫХ ДАННЫХ ДЛЯ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ ПРОГРАММ А.М. Карпушинский Научный руководитель – к.т.н., доцент Т.А. Павловская При тестировании ПО отыскивать тесты вручную – процесс чрезвычайно долгий и трудоемкий, особенно когда программа сложная, поэтому в последнее время прилагаются усилия к созданию средств, автоматизирующих этот процесс, иначе: разработке методов автоматизированной генерации тестовых данных (далее АГТД). Большинство существующих методов поиска тестовых данных ориентированы на структурные языки программирования, в то время как объектно-ориентированные языки (такие как Java, C#, далее ООЯП) гораздо более сложные в тестировании. Все ООЯП является событийно управляемыми, т.е. передача управления внутри программы осуществляется как прямо, так и косвенно. Основными источниками сообщений в ООЯП являются события (например, event в С#), асинхронные вызовы (которые, по сути, являются комбинацией событий) и исключения (exceptions). Я предлагаю разбить тестирование программы, написанной на ООЯП, на два уровня:

модульное тестирование и интеграционный. Целью данной работы является разработка нового метода АГТД, использующего метод глобальной оптимизации на основе генетического алгоритма. Предлагаемый метод адаптирован для решения проблемы тестирования объектно-ориентированного кода, в частности, содержащего обработку исключений как одного из аспектов событийно управляемой модели.

Генетический алгоритм (далее: ГА) в общем случае является алгоритмом глобальной оптимизации некоторой целевой функции многих переменных. Возможные решения задачи оптимизации именуются особями (хромосомами). Множество возможных решений образует популяцию. Каждая особь оценивается степенью приспособленности. Возможные решения обычно кодируются для применения к ним генетических операций. К этим операциям относятся скрещивание (кроссовер) и мутация. Сначала произвольным образом генерируется начальная популяция особей. Промежуточная популяция – это набор особей, получивших право размножаться. Особи промежуточной популяции случайным образом разбиваются на пары, потом с некоторой вероятностью скрещиваются, в результате чего получаются два потомка, которые записываются в новое поколение, или не скрещиваются, тогда в новое поколение записывается сама пара.

Такой процесс эволюции может продолжаться до бесконечности. Критерием останова может служить заданное количество поколений или схождение популяции (кроссовер практически никак не изменяет популяции, а мутирующие особи склонны вымирать).

Итоговым решением задачи может служить наиболее приспособленная особь последнего поколения.

Рассмотрим ГА, адаптированный для решения проблемы интеграционного тестирования ООЯП. Положим, что каждый метод в отдельности оттестирован и представляет собой «черный ящик», а передача управления между методами осуществляется посылками сообщений. Таким образом, программа представляется в виде совокупности классов, экземпляры которых «общаются» посредством посылки сообщений друг другу.

Описание таких взаимодействий может быть отражено диаграммой последовательностей, и эта диаграмма может служить формальной спецификацией для разрабатываемой программы.

В любой момент времени класс может находится в одном из своих состояний. Каждое состояние характеризуется совокупностью значений полей и наличием одного из полученных сообщений. При интеграционном тестировании программы критерием тестирования является покрытие всех дуг (т.е. всех возможных передач управления между методами всех классов). Пусть искомые тестовые наборы полагаются особями в рамках алгоритма.

Хромосомой особи будем считать последовательность конструкторов, одного или нескольких вызовов методов (включая значения параметров) и посылки сообщений, а также номера состояний, в которе переходит класс в результате выполнения этой последовательности операций. Функцию приспособленности в данном случае определим как отношение количества дуг, приведших к дуге T на текущем тестовом наборе к общему количеству дуг, которые могут привести к этой дуге. Скрещивание двух выбранных с определенной вероятностью особей происходит оператором одноточечного кроссовера: случайным образом выбирается точка раздела, потомки получаются путём обмена отсечёнными частями.

Критерием останова является схождение популяции, либо установленное количество поколений.

В рамках данной работы мною были изучены существующие методы АГТД, рассмотрены проблемы тестирования ООЯП, предложен способ АГТД объектно ориентированных программ, содержащих обработку исключений и разработан метод генерации тестовых наборов, основанный на генетическом алгоритме.

УДК 004. РАЗРАБОТКА МЕТОДИКИ ОЦЕНКИ ПОКАЗАТЕЛЯ ЭФФЕКТИВНОСТИ ЗАЩИЩЕННОСТИ ИНФОРМАЦИОННОЙ СИСТЕМЫ НА ОСНОВЕ ЗНАЧЕНИЙ «ПОТЕНЦИАЛОВ»

ИСТОЧНИКОВ УГРОЗ БЕЗОПАСНОСТИ ИНФОРМАЦИИ О.Ю. Королева Научный руководитель – к.т.н., доцент Г.П. Жигулин Краткое вступление, постановка проблемы. При построении системы защиты информации под объектом защиты, как правило, понимается информационная система. При выборе системы защиты объекта безопасности необходимо учитывать такие факторы как ее влияние на функционирование защищаемой системы – отказоустойчивость, способность системы предоставлять информацию легальным пользователям – доступность и как наиболее актуальный в наше время фактор – стоимость разрабатываемой системы защиты. Чтобы избежать таких проблем как снижение функциональности, экономические и временные потери на этапах постановки задач и проектирования необходимо учитывать критерий адекватности выбираемой системы защиты – показатель эффективности защищенности информационной системы. Данный показатель представляет собой совокупность вероятностных, информационных и экономические аспектов защищаемой системы, которые позволяют определять меру защищенности информации при заданных условиях.

Цель данной работы – разработать методику оценки показателя защищенности информационной системы с учетом потенциальных каналов утечки информации с использованием их моделей.

Базовые положения исследования. Методика оценки показателя эффективности защищенности информационной системы основывается на моделирование, которое позволяет при меньших затратах ресурсов решить задачу его автоматизированного контроля.

Моделированием называется анализ (исследование) модели объекта. Его описание или физический аналог, создаваемые для определения и исследования его свойств. В модели учитываются существенные для решаемой задачи элементы, связи и свойства изучаемого объекта. При этом различают вербальные, физические и математические модели и соответствующие им виды моделирования.

Вербальная модель описывает объект на естественном языке с применением специальных терминов – тезауруса.

Физическая модель представляет материальный аналог реального объекта, который можно подвергать в ходе анализа различным воздействиям. Однако на практике построить физическую модель объекта трудно, а зачастую нецелесообразно.

Математические модели разрабатываются в виде аналитических зависимостей, уравнений и статистических характеристик.

В данной работе используются комбинированные методы моделирования, что позволяет строить универсальные модели информационной системы, выстраиваемой системы защиты и потенциальных угроз – каналов утечки информации путем детализации их элементов и связей между ними, необходимых для решения конкретной поставленной задачи.

Обзор существующих методик. Большинство существующих методик оценки показателя эффективности защищенности информационной системы, как правило, используют аддитивную модель, представляющую собой совокупность оценок статических параметров системы и не учитывают потенциальные каналы утечки информации – их числовые эквиваленты («потенциалы»).

Описание новой методики. Рассматриваемая в данной работе, методика оценки показателя эффективности защищенности информационной системы строится для модели, представляющей собой совокупность следующих систем: информационная система, предполагаемая система защиты и система потенциальных каналов утечки информации.

Данный вид модели позволяет учитывать все внутренние и внешние связи – модель «состава системы».

Методика может быть использована как при выборе системы защиты информации из уже существующих на рынке, так и при построении новой системы. В первом случае будет иметь место модель «белого ящика» поскольку все входные воздействия известны, а в качестве передаточной функции будет выступать рассматриваемая система защиты информации. Для второго используется модель «черного ящика» так как по входным сигналам и желаемым выходным сигналам необходимо построить передаточную функцию.

Оценка показателя эффективности защищенности информационной системы в данной методике основывается на значениях «потенциалов» – числовых эквивалентов источников угроз информационной безопасности, получаемых путем статистического анализа измеряемых показателей.

Оценка преимуществ и ограничений новой методики. Применение данной методики, представляющей собой системный подход, позволяет учесть все важные факторы при выборе и построении системы защиты информации, учесть взаимное влияние системы защиты и защищаемого объекта, спрогнозировать потенциальные информационные угрозы.

Появляется возможность существенно снизить экономические затраты, являющиеся последствием выбора неадекватной системы защиты. Однако возможности моделирования ограничиваются уровнем формализации описания каналов утечки и степенью адекватности математических выражений реальным физическим процессам, лежащим в основе их образования. Для получения наиболее точного результата в методике приведена система оценки допустимых погрешностей и отклонений.

Основные результаты. В работе достигнуты следующие результаты:

1. Построены содержательные и концептуальные модели информационной системы, системы защиты информации и каналов утечки.

2. Определены основные моделируемые параметры рассматриваемых систем.

3. Выявлен перечень актуальных угроз информационной безопасности, порождаемых внутренними и внешними источниками.

4. Определены методики расчета значений «потенциалов» источников угроз информационной безопасности.

5. Получена аналитическая форма оценки параметра защищенности информации.

УДК 004.75, 004.772, 004. ПРИНЦИПЫ ОРГАНИЗАЦИИ МНОГОТОЧЕЧНОГО ДОСТУПА К РАСПРЕДЕЛЕННОЙ СИСТЕМЕ ХРАНЕНИЯ ДАННЫХ Н.М. Лукьянов Научный руководитель – к.т.н., профессор В.В. Кириллов В настоящей работе описываются подходы, применяемые при построении высокодоступной распределенной системы хранения данных, имеющей множественные точки доступа к необходимой информации. Предложены нетрадиционные способы резервирования данных с использованием незащищенных от сбоев устройств хранения, описан метод выбора оптимального узла хранения с использованием ранжирования весовыми коэффициентами, описана процедура восстановления данных узла после программного или аппаратного сбоя в работе системы.

Постановка задачи. Задачей распределенной системы хранения данных, как составного элемента централизованного Интернет сервиса, является хранение программ и данных и предоставление доступа к ним по мере необходимости со стороны неограниченного количества сетевых пользовательских сервисов. Следовательно, подобные распределенные системы должны быть хорошо масштабируемыми, высоко доступными и иметь открытую гибкую архитектуру.

Такие требования подразумевают решение ряда проблем, которые присутствуют во многих компонентах системы. Среди них:

общий принцип организации хранилища;

выбор оптимальных аппаратных компонентов системы;

способы резервирования данных на узлах и в сети;

алгоритмы восстановления данных в системе.

В результате решения описанных выше проблем будет получена высокодоступная распределенная система хранения данных, способная функционировать в условиях частичной неисправности своих узлов хранения, за счет использования принципа многоточечного доступа к данным.

Архитектура системы. Любую распределенную систему хранения и обработки данных можно рассматривать как совокупность распределенных программно-аппаратных компонентов. В данном случае такими аппаратными компонентами являются отдельные серверы, объединенные локальной вычислительной сетью. Программная составляющая реализации системы является наиболее важной и несет в себе всю функциональную нагрузку системы. Организация взаимодействия отдельных узлов распределенной системы хранения данных опирается на сервис ориентированную архитектуру. Каждый сетевой сервис состоит из ряда модулей определяющих его функциональность, а также функциональное назначение узла распределенной системы хранения данных, на котором размещен данный сетевой сервис.


Условно всю распределенную систему хранения данных можно разделить на пять составляющих: пользователь, сервер приложений, сервер метаданных, узлы хранения и сервер производительности. Подобный подход является гибридным и использует составляющие всех трех разновидностей файловых систем: параллельных, симметричных и с API доступом.

Отдельные алгоритмы, реализованные в виде модулей, позволяют обрабатывать разнородную информацию, в зависимости от ее типа, среды передачи и условий внутри системы хранения. Происходит интеллектуальная, а не конвейерная обработка данных. Благодаря модульности, формализовав правила ввода/вывода данных, появляется возможность модернизировать последовательность обработки информации путем добавления новых модулей.

Хранение и восстановление данных. Система хранения состоит из множеств узлов, состоящих из несложных аппаратных компонентов. Последовательности из двух, трех или более узлов объединены в группы. На каждом из узлов, состоящем в одной группе содержится одинаковый набор данных. В результате мы получаем возможность многоточечного доступа к данным даже в том случае, если в группе функционируют не все ее участники.

Не менее важным моментом в работе всей системы является скорость и последовательность действий для восстановления данных. В случае выхода из строя одного или двух узлов хранения данных, находящих в одной группе, система автоматически или с минимальным участием администратора восстанавливает свою нормальную работу.

Применяется механизм зеркального копирования данных с одного из нормально функционирующих узлов группы (донора) на новый резервный узел системы. При этом количество запросов к серверу метаданных минимизировано, что позволяет избежать излишней нагрузки в процессе восстановления узлов.

Заключение. Применение сервис ориентированной архитектуры в программной части реализации распределенной системы хранения данных позволяет отказаться от дорогостоящих аппаратных систем хранения данных при организации информационно ёмких Интернет сервисов. Кроме того, описанная выше идеология восстановления работоспособности узлов хранения данных позволяет легко масштабировать ресурсы системы, не уступая при этом в вопросах высокой доступности, надежности дорогостоящим многомашинным вычислительным комплексам. Гибкость и простота модульной системы позволяет наращивать функциональность, как отдельных компонентов, так и всей системы в целом прямо в процессе эксплуатации.

В ходе работы с помощью языков программирования были реализованы ранее недоступные аппаратные реализации алгоритмов резервирования данных. Разработан алгоритм выбора оптимального узла хранения, основанный на методе ранжирования с весовыми коэффициентами. Рассмотрена последовательность движения пользовательских данных внутри системы. Благодаря использованию внутреннего высокоскоростного соединения узлов хранения стало возможным переносить данные с узла на узел за минимально возможное время – 1500 Мб за 7,2 часа, что в три раза превосходит среднюю скорость восстановления RAID массива уровня 5.

УДК 004. СРАВНИТЕЛЬНАЯ ОЦЕНКА ПАРАМЕТРОВ СИСТЕМ ВСТРАИВАНИЯ ПОЛЬЗОВАТЕЛЬСКИХ ДАННЫХ В ВИДЕОПОТОК Р.Ю. Мартимов Научный руководитель – к.т.н., доцент Н.Ф. Гусарова Проблематика работы связана с цифровой стеганографией. Данная наука занимается решением задач цифровых водяных знаков (ЦВЗ), построения скрытых каналов связи, отслеживания распространения материалов в Интернете и т.д. С ростом компьютерного пиратства актуальность различных средств защиты авторских прав также будет расти.

Причем доля продаж на рынке интеллектуальной собственности через интернет с течением времени также будет возрастать. И для того, чтобы предотвратить незаконное копирование тех же фильмов или музыки, нужны будут соответствующие технические средства. Для решения этих задач как нельзя лучше подходит цифровая стеганография. Например, легко можно будет отследить, где и как распространяются те фильмы, на которые были нанесены ЦВЗ (цифровые водяные знаки), а также источник, с которого была сделана копия, поскольку достаточно легко сопоставить уникальный ЦВЗ на фильме при отправке человеку с его регистрационными данными.

Данная работа посвящена именно видео, поскольку, по мнению авторов, это очень интересное и перспективное направление. С одной стороны, здесь могут быть применены те методы, которые используются в стеганографии изображений, а с другой - добавляется очень важное измерение – время. В целом задачи стеганографии близки к тем, которые решаются при сжатии видео, однако в направлении цифровой стеганографии видеопотоков (ЦСВП) есть, безусловно, и свои проблемы. К ним, например, относится то, что по мере того, как растет эффективность алгоритмов сжатия видео, возможностей для встраивания становится все меньше и меньше.

В рамках работы рассматривается задача встраивания кодирующих меток в видеопоток, сжатый по стандарту MPEG 2. В качестве основной схемы встраивания выбрана схема «дифференциальной разности энергий» (Differential Energy Watermarks – DWE), для которой исследованы возможности выбора областей, пригодных для встраивания, и возможные параметры такого выбора. Кроме этого, в работе рассмотрен разработанный авторами стеганографический алгоритм, основанный на принципах шумоподобного кодирования.

Ключевым компонентом схемы встраивания DWE является «энергия» областей, в которое будет производиться встраивание. Принятие решения о встраивании бита в ту или иную область принимается на основе двух параметров – интегрального порогового уровня «энергии» области, а также частотного порога. Эти параметры, по сути, определяют шаблон отбора регионов.

Интегральный пороговый уровень с физической точки зрения соответствует предполагаемому уровню шума (D). Чем выше выбирается D, тем с одной стороны, большее количество областей не пройдут классификационный отбор, а значит, будет снижена скорость встраивания, но, с другой стороны, робастность кадра с встроенными данными значительно вырастет. Последнее обстоятельство связано с тем, что если алгоритм встраивания отделен от кодера во время пространственного сжатия, применяемого в стандарте MPEG 2, то производится квантование коэффициентов после дискретного косинусного преобразования (ДКП), что приводит к снижению «энергии». Если после этого она остается ниже фактического уровня шума, выделить данные не представляется возможным.

Другим классификационным параметром выступает пороговый частотный уровень. С точки зрения матрицы коэффициентов, пороговый уровень – это номер коэффициента при зигзаг-сканировании. Он позволяет численно определить примерную степень заметности встроенных данных.

Исследовано частотное распределение блоков по энергетическим интервалам. По нему можно судить о влиянии, которое оказывает выбор D на «емкость» контейнера. Исследованы распределения уровней энергии и их влияние на процент ошибок в встроенных битах, а также на артефакты, возникшие на изображении.

Разработан алгоритм, базирующийся на идеях шумоподобного кодирования и реализующий корреляционную обработку сигналов. Проведен ряд оценочных тестов данной новой схемы встраивания.

В рамках работы создана оценочно-классификационная модель областей кадра с точки зрения их пригодности для встраивания кодирующих меток для алгоритма DEW, а также спроектирована и реализована стеганографическая библиотека с открытым исходным кодом, с использованием таких технологий программирования, как шаблонное метопрограммирование обобщенное и обьектно-ориентированное программирование.

Проведены экспериментальные оценки влияния указанной классификационной модели на процент ошибок, а также того влияния, которое оказывает пространственная компонента MPEG 2- кодирования и декодирования на сохранность встроенных данных.

Основными направлениями дальнейших исследований схемы DEW являются создание методик оценки областей для встраивания, обладающих низкой вычислительной сложностью, а также создание новых схем встраивания, основанных на теории шумоподобного кодирования, в частности, развитие и исследования концепции разрабатываемого корреляционного алгоритма.

УДК 004.93’ РАЗРАБОТКА МЕТОДИКИ АВТОМАТИЗИРОВАННОЙ ПРОВЕРКИ ТРУДНОСТИ ВОСПРИЯТИЯ УЧЕБНОГО ТЕКСТА М.М. Невдах (Белорусский государственный технологический университет) Научный руководитель – д.х.н., профессор М.А. Зильберглейт (Белорусский государственный технологический университет) Введение. Статистические методики анализа данных с поддержкой компьютерных технологий обладают огромным потенциалом в разрешении многих практических задач обработки текстовых массивов. Одной из областей анализа текстов с точки зрения его доступности для читателя является читабельность, под которой следует понимать некоторую характеристику печатного материала, зависящую от его элементов внутри данного материала, которые влияют на успешность его усвоения определенной группой читателей.

Проблема качества учебных изданий является одной из центральных в отечественном книгоиздании и привлекает к себе внимание широкого круга исследователей. От повышения качества учебной литературы будет зависеть совершенствование профессиональной подготовки специалистов. В настоящее время уровень учебного материала в основном зависит от профессионализма автора и редактора и практически не связан со способностями читателей. Очевидно, что данная оценка не всегда является объективной. В связи с этим создание надежных и общепринятых методов автоматизированной проверки трудности учебного текста, ориентированной на потребности читателя, является крайне актуальной задачей.

Основная часть. Автоматизация ряда процессов предполагает конструирование автоматических устройств, способных реагировать на изменяющиеся характеристики различных объектов определенным количеством удовлетворительных для человека реакций.

В нашем случае стоит задача определения понятности (читабельности) текста для будущих читателей, решение которой включало несколько этапов.


На первом этапе были выбраны и реализованы методы для определения трудности понимания учебных текстов по философии и экономической теории (методика дополнения, метод балльных оценок, метод парных сравнений). По данным проведенных экспериментов были найдены объективные критерии, определяющие трудность текста.

На втором этапе были выделены и вычислены значения 49 параметров учебных текстов по философии и экономической теории: длина текста в абзацах, длина текста в буквах, средняя длина абзаца в фразах, средняя длина абзаца в словах и др. На основе методов многомерного статистического анализа были определены относительно однородные группы взаимосвязанных признаков. Затем из каждой полученной группы был выделен информативный признак.

На третьем этапе был проведен дискриминантный анализ, на основе которого было разработано решающее правило для отнесения учебных текстов по философии и экономической теории к группе легких или трудных текстов [1].

На последнем этапе на основе разработанного решающего правила создана программа Readability analysis, предназначенная для автоматизации оценки трудности учебных текстов для студентов вузов. Программа написана на языке Delphi и включает в себя три подпрограммы:

1) «расчет текстовых параметров»;

2) «вычисление дискриминантных функций»;

3) «вывод результатов». Первая подпрограмма проверяет объем текста, который должен превышать 1800 символов, и рассчитывает основные функции;

вторая – вычисляет дискриминантные функции для текстов по философии и экономической теории;

третья – сравнивает функции между собой и на этом основании выводит результаты относительно трудности текста.

Входные данные программы – текст на русском языке. Выходные данные представляют собой таблицу значений статистических характеристик текста и оценку уровня трудности текста для будущих читателей. Оценка трудности учебных текстов с помощью созданной программы преследует следующие основные цели:

определение количественных характеристик текста, влияющих на его трудность;

запись статистических данных текста в отдельный файл с возможностью накапливания результатов по различным исследуемым текстам;

автоматизированный анализ трудности текста в соответствии со способностями студентов.

Статистика количественных показателей текстов может накапливаться и в дальнейшем использоваться для сравнительного анализа характеристик текстов.

Программа выполняет вычисление характеристик текста, влияющих на уровень его трудности, и содержит следующие функции:

1. Функция text_word определяет длину текста в словах.

Следует отметить, что текстовый редактор MS Word после проверки правописания выдает статистику удобочитаемости, которая не всегда верно отражает реальные данные о количестве предложений и слов для текста на русском языке. Например, скобка, поставленная через пробел, считается как слово. Поэтому в программе Readability analysis определены символы, часто используемые для набора текста, но не являющиеся его словами: различные виды скобок ( ), [ ], { },, звёздочки *, ***, чёрточки и др.

2. Функция paragraph_symbol определяет среднюю длину абзаца в печатных знаках.

Разделителем абзацев является наличие двух и более пробелов в начале строки. Перед загрузкой текста в окно программы необходимо устранить лишние пробелы между словами, установить абзацный отступ, сохранить документ в формате.txt.

3. Функция sentence_word определяет среднюю длину предложения в словах. Как было сказано выше, MS Word выдает неверные результаты относительно количества предложений. Если строки текста отделены знаком абзаца, то каждая строка определяется как предложение. В программе Readability analysis в данной функции определены правила выявления конца предложения. Это знаки: точка (.), восклицательный знак (!), восклицательный знак и многоточие (!..), вопросительный знак (?), вопросительный знак и многоточие (?..), многоточие (…). Один символ с точкой (например, К. Маркс, т. д., т. е.) не считается предложением.

4. Функция word_ symbol определяет среднюю длину слов в печатных знаках.

Разделителем слов является пробел.

Все вычисленные количественные характеристики текста формируются в выходной массив и выводятся в виде списка в элемент Statistics окна программы. Результаты могут быть сохранены в отдельном текстовом файле.

Практическая значимость программы Readability analysis связана с тем, что она может быть использована в редакционно-издательской деятельности при подготовке учебной литературы для высшей школы. Анализ трудности текста на стадии его подготовки и дальнейшее усовершенствование материала позволят привести уровень сложности учебного текста в соответствие со способностями читательской группы.

Заключение. Результаты данного исследования дают возможность продолжить автоматизацию редакционно-издательского процесса. Полная или частичная замена человека специализированной системой позволит добиться не только невозможного для человека быстродействия, но и необходимого качества изданий благодаря объективной оценке трудности текста на основе его информационных характеристик, полученных в опоре на восприятие читателей.

Литература 1. Невдах М.М. Исследование информационных характеристик учебного текста методами многомерного статистического анализа / М.М. Невдах // Прикладная информатика. – 2008. – № 4. – С. 117–130.

УДК МЕТОДОЛОГИЯ УПРАВЛЕНИЯ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТЬЮ ПРИ ПРОЕКТИРОВАНИИ IT-ИНФРАСТРУКТУРЫ ПРЕДПРИЯТИЯ А.О. Нестеров Научный руководитель – д.т.н., профессор Ю.А. Гатчин В настоящее время проблема управления проектной деятельности очень актуальна во многих странах, особенно в России, так как по статистике большинство проектов в России не выполняются в поставленный срок. В результате не выполнения предприятия несут огромные убытки, и появляется риск срыва проекта.

Целью данной работы является выявление основных ошибок управления проектной деятельностью и разработка методов их недопущения.

В ходе выполнения работы проведен сравнительный анализ организации проектной деятельности различных предприятий.

Исследование проблем в управлении проектной деятельности позволит значительно сократить риски не выполнения проектов и помочь руководителям быстрее принимать управленческие решения.

УДК 004. РАСПРЕДЕЛЕННАЯ СИСТЕМА УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМИ УСТРОЙСТВАМИ П.Ю. Абдураманов, С.А. Жигалов, В.И. Кандоба, Д.О. Конончук, И.С. Медведев (Уральский государственный университет им. А.М. Горького) Научный руководитель – к.ф.-м.н. Ю.С. Окуловский (Уральский государственный университет им. А.М. Горького) Система управления роботами состоит из множества подсистем: алгоритмы оптимального управления, непосредственная передача сигналов сервоприводам, техническое зрение, распознавание речи, калибровка и т.д. При программировании систем управления, такая декомпозиция должна быть оформлена в виде одной из парадигм программирования.

Реализация в структурной парадигме (в виде API) или объектно-ориентированной (в виде библиотеки классов) оказывается неудобной по ряду причин: необходимость разработки версий для разных операционных систем;

высокий порог вхождения из-за сложности реализации, содержащей большое разнообразие методов программирования;

трудности в модификации и управлении разработкой, требующих централизации. Эти проблемы имеют тенденцию к усугублению в связи с растущей сложностью современных систем управления роботами.

Решением является выполнение в парадигме сервисов: обособление отдельных подсистем и разрешение их взаимодействия только по специально оговоренным каналам связи. Такой подход можно наблюдать в LabView, DirectShow, или конвеерах Unix. Мы предлагаем использовать эту идеологию для систем управления роботами, оформляя каждую подсистему в качестве отдельного приложения – сервиса – с коммуникацией по стандартным интерфейсам межпроцессного взаимодействия.

Стандартные способы такого взаимодействия – WCF, DLL, RPC – не кросс платформенны и, следовательно, ограничивают область применимости разрабатываемой системы. Едва ли не единственным кросс-платформенным способом межпроцессного взаимодействия (исключая файлы и стандартные потоки ввода-вывода, не рассматриваемые из за проблем с быстродействием и другими ограничениями) является стек протоколов TCP/IP. К сожалению, этот протокол обладает достаточно неудобным прикладным интерфейсом.

Цель настоящей работы – создание кросс-платформенного протокола обмена информацией между приложениями, и реализация на его основе системы управления роботами.

Нами разработан протокол RoboCoP, реализованный поверх стека протоколов TCP/IP.

Реализация протокола позволяет инициализировать протокол и отправить сообщение тремя строчками программного кода, что значительно облегчает написание робототехнических сервисов по сравнению с использованием TCP/IP. Протокол берет на себя такие технические проблемы, как чтение конфигурационных файлов, оповещения об ошибках или восстановление утерянных подключений. Протокол оптимизирован под нужды робототехники, которые заключаются, прежде всего, в передаче значительных объемов информации. В результате, помимо маршрутизируемых сообщений «каждый-каждому», в протокол введены немаршрутизируемые сообщения, передаваемые от одного сервиса другому непосредственно.

В частности, изображение, полученное от сервиса камеры, передается непосредственно сервису, потребляющему это изображение, а не промежуточному сервису-маршрутизатору. За счет реализации на базе TCP/IP, протокол делает возможным не только межпроцессное взаимодействие на одном компьютере, но и распределение управляющей системы по нескольким вычислительным узлам, в том числе – бортовому компьютеру робота.

Выполнено тестирование производительности робота. Показано, что соединение на одной машине множества простых сервисов, каждый из которых выполняет преобразование малого объема данных за короткое время, не наблюдается существенного падения производительности. Именно эта часть считалась «узким местом» протокола и потенциальной угрозой для его использования в качестве средства межпроцессного взаимодействия на одной машине. На других тестах – больших объемах данных, передаче данных через локальную сеть Ethernet и WiFi – результаты также удовлетворительные: реализация протокола не вызывает существенных временных задержек, помимо системной обработки стека TCP/IP.

На основе протокола создана система управления многозвенным манипулятором – робототехнической рукой. Первой тестовой задачей является сборка пирамиды из разноцветных кубиков. Входными данными являются изображения, снятые с видеокамеры.

Разработаны сервисы получения и начальной обработки изображения с видеокамеры;

выделения объектов на изображении;

позиционирования объектов в реальных координатах;

вычисления углов сервоприводов, необходимых для доставки эффектора руки в заданную точку;

интеллектуальной коррекции полученных углов для подавления ошибок, связанных с погрешностью измерения руки;

пересчета углов в сигнальные единицы на основании калибровочной информации;

отправки сигналов на сервоприводы. Также разработаны вспомогательные сервисы калибровки робота и тестирования сервоприводов, отрисовки изображения и сопутствующей видеоинформации, ручного управления многозвенным манипулятором как посуставно, так и по желаемым перемещениям эффектора.

Второй тестовой задачей стало дистанционное управление гусеничным роботом.

Оттестирована распределенная работа протокола, при которой часть сервисов (сервис видеокамеры и сервис отправки команд на сервоприводы) расположены на роботе, а другая часть – на головном компьютере. Дополнительно написаны сервисы определения скоростей гусениц по желаемому перемещению и повороту робота.

Все программное обеспечение написано на языке C# для платформы.NET 2.0.

Программное обеспечение собирается и эффективно работает с платформой MONO, чем обеспечивается кросс-платформенность. Все программное обеспечение будет выпущено под лицензией GNU/GPL для свободного использования.

Рассмотрим основные преимущества созданного решения. Первым из них является простота освоения. Для написания управляющей системы нет необходимости изучать логику работы всех подсистем: достаточно лишь изучения формата данных тех подсистем, с которыми идет обмен информацией. Данные, получаемые центральной системой управления, оказываются естественными: управляющая программа строительства принимает список реальных координат увиденных объектов и должна выдать реальные координаты, в которые следует доставить эффектор. В таких условиях написание простых управляющих систем возможно даже людьми, никогда ранее не знакомыми с робототехникой, что способствует применению системы в образовании. Еще одним преимуществом является локальность разработок. При реализации какого-либо сложного алгоритма для, например, системы трехмерного технического зрения разработчик работает локально, лишь над своим проектом, и не подвержен изменениям и рефакторингу в других проектах. Таким образом, упрощается проблема коллективной разработки робототехнических приложений, поскольку отсутствует необходимость в центральном управлении ей.

Протокол RoboCoP и системы управления на его основе будут активно развиваться в будущем. В частности, появятся сервисы для: выделения углов и границ на изображениях, полученных с камеры;

SLAM-алгоритмов для позиционирования себя и выделенных точек изображения в трехмерном пространстве;

полностью автономной калибровки многозвенного манипулятора, гусеничного и мобильного роботов;

управления гексаподом (шагающей установкой). Развитие протокола будет сосредоточено в следующих направлениях.

Планируется расширение протокола взаимодействия на другие носители: UDP (для ускоренной ненадежной отправки больших объемов информации) и MPI (для реализации распределенных вычислений на базе RoboCoP в многопроцессорных системах). Также предполагается портирование протокола на другие языки: Java (для включения в управляющие системы мобильных устройств – сотовых телефонов и коммуникаторов) и С (для программирования микроконтроллеров).

УДК 004. АНАЛИЗ МЕТОДОВ ПОСТРОЕНИЯ ТРАЕКТОРИИ ДВИЖУЩИХСЯ ОБЪЕКТОВ НА ОСНОВЕ СЕГМЕНТАЦИИ ВИДЕОДАННЫХ И.С. Рубина Научный руководитель – д.т.н., профессор А.Ю. Тропченко Краткое вступление, постановка проблемы. Задача построения траектории движущихся объектов является неотъемлемой частью эффективных схем сжатия видеопоследовательностей. Выбор её решения всегда является компромиссом между точностью приближения и вычислительной сложностью алгоритма.

Сегментный подход к решению задачи построения траектории движущихся объектов устраняет большую часть недостатков решений на основе попиксельного подхода с высокой трудоёмкостью алгоритма и объектного похода со сложностью в определении формы объекта прогнозирования. Сущностью компенсации в нем является прямоугольный блок.

Сегментный подход использует предположение о том, что в рамках двух соседних кадров местоположение и форма объектов изменяются незначительно. Тогда это изменение можно скомпенсировать параллельным переносом сегмента на некоторый вектор. Это допущение работает для подавляющего большинства кадров видеопоследовательности, за исключением участков полного изменения кадра при переключении сцены.

В связи с тем, что полный перебор возможных вариантов прогноза для блока имеет высокую вычислительную сложность, в рамках исследования необходима выработка схемы селекции блоков для сравнения.

Целью данной работы является анализ существующих методов построения траектории движущихся объектов на основе сегментации видеоданных и выработка способов их модификации.

Базовые положения исследования. Человеческое зрение имеет особенность не отличать умеренно пониженное разрешение и менее точно представленное динамичное движение.

При поиске совпадений необходимо учитывать совпадения, найденные на более ранних стадиях решения задачи.

В рамках решения задачи необходимо осуществлять поиск глобального минимума критерия различия сущностей, препятствуя выявлению локального минимума вместо глобального.

Промежуточные результаты. Произведен анализ существующих схем построения траектории движущихся объектов на основе сегментации видеоданных. Были выявлены их существенные достоинства и недостатки, а также выработаны направления модификации рассмотренных алгоритмов. В частности, была определена возможность сочетания некоторых подходов для улучшения по ряду критериев оптимизации.

Основной результат. В ходе исследования было выявлено, что для видеопоследовательностей различной динамичности алгоритмы построения траектории движущихся объектов на основе сегментации видеоданных показывают различные результаты. Например, перебор по шаблону дает высокую точность на прогнозируемом количестве шагов в сценах высокой динамичности, в то время как иерархический поиск дает лучшее качество прогнозирования на последовательностях низкой динамичности.

В общем, наиболее удачным признано сочетание алгоритмов, основанных на сегментном подходе, с параметрическими алгоритмами. В целях дальнейшей оптимизации схемы поиска необходимо объединение сегментов по направлению движения в рамках объекта – приближение к объектному подходу.

УДК 004.932. МЕТОДЫ ВСТРАИВАНИЯ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ ДЛЯ ИДЕНТИФИКАЦИИ И ЗАЩИТЫ ВИДЕОИНФОРМАЦИИ А.П. Старченко Научный руководитель – д.т.н., профессор И.П. Гуров Рассмотрены методы встраивания водяных знаков для идентификации изображений.

Представлена информация об основных видах цифровых водяных знаков, дана краткая характеристика каждого из них. Обсуждаются особенности основных алгоритмов для встраивания цифровых водяных знаков и их восстановления из изображений.

Встраивание цифрового водяного знака – технология, созданная для идентификации информации, представляемой в форме изображений, и защиты авторских прав в области мультимедийных файлов. Развитие компьютерных технологий обусловило создание методов цифровой стеганографии, которая включает следующие направления: встраивание цифровых водяных знаков, встраивание информации с целью ее скрытой передачи, встраивание идентификационных номеров, встраивание заголовков. Цифровой водяной знак обычно представляет собой текст или логотип. Цифровые водяные знаки могут быть видимыми на изображении или скрытыми. В большинстве случаев используются невидимые цифровые водяные знаки, которые внедряются в цифровые данные. Цифровые водяные знаки принято подразделять на три вида: робастные, хрупкие и полухрупкие. Робастные цифровые водяные знаки устойчивы к различным искажениям изображения. Хрупкие цифровые водяные знаки применяются для аутентификации, аналогично электронной цифровой подписи.

Полухрупкие цифровые водяные знаки устойчивы по отношению к одним воздействиям и неустойчивы по отношению к другим. Например, может быть разрешено копирование изображения, но наложен запрет на внесение в него каких-либо изменений.

Цифровой водяной знак отличаются тем, что информация встраивается непосредственно в сигнал. Объекты мультимедиа в этом случае представляют собой контейнеры (носители) данных. Технология цифрового водяного знака должна обеспечивать устойчивость встроенной информации при максимальных искажениях контейнера, конечно, не приводящих к существенным искажениям исходного сигнала. Например, у изображения могут быть отредактированы цветовая гамма или яркость. Кроме того, цифровой водяной знак должен быть робастным по отношению к геометрическим преобразованиям изображения, например, к его поворотам и масштабированию.

Встраивание ЦВЗ возможно благодаря особенностям системы восприятия человека.



Pages:   || 2 | 3 | 4 | 5 |   ...   | 10 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.