Skip to main content
Ilya (w-495) Nikitin
  • 123098, Russia, Moscow, Zhivopisnaya st. 38-1-25
  • +79165360541
The paper focuses on the algorithms of the event detection in content-based video retrieval. Video has a complex structure and can express the same idea in different ways. This makes the task of searching for video more complicated. Video... more
The paper focuses on the algorithms of the event detection in content-based video retrieval. Video has a complex structure and can express the same idea in different ways. This makes the task of searching for video more complicated. Video titles and text descriptions cannot give the whole information about objects and events in the video. This creates a need for content-based video retrieval. There is a semantic gap between low-level video features, that can be extracted, and the users’ perception. The task of event detection is reduced to the task of video segmentation. Complex content-based video retrieval can be regarded as the bridge between traditional retrieval and semantic-based video retrieval. The properties of video as a time series are described. Introduced the concept of anomalies in the video. A method for event detection based on comparing moving averages with windows of different sizes is proposed. According to the classification given at the beginning of this article, our method refers to statistical methods. It differs from other methods with low computational complexity and simplicity. The video stream processing language is proposed for function-based description of video handling algorithms. So, our method is formulated in the form of a declarative description on an interpreted programming language. Unfortunately, most of the existing video processing methods use exclusively imperative approach, which often makes understanding more difficult. Examples of the use of this language are given. Its grammar is described too. As shown by experiments, the implementation of the proposed video events retrieval method, unlike their counterparts, can work for video streams too with a real-time and potentially infinite frame sequences. Such advantages within low computational requirements make implementation of the method helpful in aviation and space technology. The algorithm has some disadvantages due to necessity parameter selection for particular task classes. The theorem on near-duplicates of video is formulated at the end of the article. It asserts the near-duplicate videos express the same sequence of phenomena.
The paper focuses on an overview of the different existing methods in content-based video retrieval. During the last decade there was a~rapid growth of video posted on the Internet. This imposes urgent demands on video retrieval. Video... more
The paper focuses on an overview of the different existing methods in content-based video retrieval. During the last decade there was a~rapid growth of video posted on the Internet. This imposes urgent demands on video retrieval. Video has a complex structure and can express the same idea in different ways. This makes the task of searching for video more complicated. Video titles and text descriptions cannot give the hole information about objects and events in the video. This creates a need for content-based video retrieval. There is a semantic gap between low-level video features, that can be extracted, and the users' perception. Complex content-based video retrieval can be regarded as the bridge between traditional retrieval and semantic-based video retrieval.

Keywords: frames; near-duplicates video; scenes; shots; video annotation; video classification; video mining; video reranking; video retrieval.

В статье предлагается обзор различных существующих методов ассоциативного поиска по видео. В течение прошлого десятилетия наблюдался стремительный рост количества видео размещаемых в Интернете, что создало острую необходимость в появлении поиска по видео. Видео имеет сложную структуру. Одна и та же информация может быть выражена различными способами. Это серьёзно усложняет задачу видео-поиска. Заголовки и описания видео не могут дать полного представления о самом видео, что влечет за собой необходимость использования ассоциативного поиска по видео. Существует семантический разрыв между низкоуровневыми характеристиками видео и восприятием пользователей. Комплексный ассоциативный видео-поиск может рассматриваться как связующее звено между обычным поиском и смысловым поиском по видео.

Ключевые слова: анализ видео; аннотирование видео; видео-поиск; кадры; классификация видео; нечеткие дубликаты видео; ранжирование видео; сцены; съёмки.
В приведенном обзоре рассмотрены некоторые методы поиска нечетких дубликатов видео, их преимущества и недостатки. На основе структурного представления видео построена комбинация методов и предложен дескриптор съёмки. Методы поиска... more
В приведенном обзоре рассмотрены некоторые методы поиска нечетких дубликатов видео, их преимущества и недостатки. На основе структурного представления видео построена комбинация методов и предложен дескриптор съёмки.

Методы поиска нечетких дубликатов реализуют следующие шаги.
1. Видео делят на отрезки.
2. Из каждого отрезка выделяют ключевые кадры.
3. Для представления ключевых кадров извлекают последовательности в которых содержатся характеристики кадров. Характеристики ключевых кадров используются для представления всего видео.
4. Подобие между видео как подобие вычисляют наборов характеристик ключевых кадров.
Различают методы, использующие глобальные характеристики (ГХ) и методы, использующие локальные характеристики (ЛХ). ЛХ‑методы сводят задачу поиска похожих видео к задаче поиска дубликатов изображений.
В работе рассмотрены ЛХ‑методы:
отслеживание траекторий особых точек кадра, сравнение особых точек ключевых кадров, сравнение визуальных «видео‑слов» по частотным словарям ГХ‑методы моделируют пространственную, цветовую и временную информацию кадров и сцен видео. Сходство между видео из запроса и видео из базы определяется как соответствие подписей (сигнатур) видео. Глобальные характеристики полезны, для поиска «почти одинаковых» видео и могут выявить незначительные правки в пространственно‑временной области. В работе рассмотрено несколько способов формирования подписей для ГХ‑методов:
локально‑чувствительное хеширование; использование порядковой меры; представление видео как последовательности геномов (ДНК‑представление);
фиксация точке перемены съёмок (сцен);
построение дерева перемены съёмок.
На данный момент наиболее перспективными кажутся ГХ‑методы. Они позволяют без особых вычислительных затрат приближенно решить задачу. Однако, для уточнения могут потребоваться ЛХ‑методы.
В конце работы предложена комбинация методов на основе структурного представления видео. Введено понятие дескриптора съёмки. Он состоит:
из вектора отношений длин съёмок к длинам других съёмок — глобальные характеристики и описания свойств начального и конечного кадров — локальные характеристики.

The paper focuses on an overview of the different existing methods in near duplicate video retrieval. The advantages and disadvantages of the methods are discussed. At the end we suggest an original combination of methods based on structural video representation and propose a novel shot descriptor.

Near duplicate video retrieval techniques implement the following steps.
1. Video is divided into segments.
2. Keyframes are extracted from each segment.
3. Features are extracted from keyframes. Keyframe features represent the whole video.
4. The similarity between the videos is calculated as a similarity between keyframe features.
There are methods using global features and the local ones. Local methods reduce the problem of finding similar videos to the problem of finding image duplicates. The paper discusses the local methods:
tracing the trajectories of the points of interest in the frame; comparison of the points of interest in keyframes; bag of visual keywords.
Global methods simulate the spatial, temporal and color information of frames and scenes. The similarity between the video query and the videos from database is defined as the similarity of video signatures. Global features are useful for retrieve „almost identical“ videos and can identify minor changes in the space‑time domain. In this paper we consider several ways to built global signatures:
locally sensitive hashing; ordinal measure; video DNA‑representation; shot change positions; the shot change tree.
At the end the combination of methods within a novel shot descriptor is 0 proposed. The descriptor consists of:
a vector of the relations of shot lengths to lengths of other shots (relative shot lengths) as a global feature; features of initial and final frames as local ones.
Никитин И. К. Элементы ассоциативного поиска по видео [Текст] / И. К. Никитин // Новое слово в науке: перспективы развития : материалы междунар. науч.–практ. конф. (Чебоксары, 10 сент. 2014 г.) / редкол.: О. Н. Широков [и др.]. –... more
Никитин И. К. Элементы ассоциативного поиска по видео [Текст] / И. К. Никитин // Новое слово в науке: перспективы развития : материалы междунар. науч.–практ. конф. (Чебоксары, 10 сент. 2014 г.) / редкол.: О. Н. Широков [и др.]. – Чебоксары: ЦНС «Интерактив плюс», 2014. – С. 223–230. – ISBN 978-5-906626-37-0.

За последние несколько лет объем носителей мультимедийной информации вырос в несколько раз. В сложившейся ситуации необходим простой и гибкий поиск неструктурированным мультимедийных данных. В статье предлагается обзор  существующих методов ассоциативного поиска по видео.
The paper focuses on an approach to a near-duplicate videos search. The search is based on the comparison of scene relative lengths in the space L2. The comparison is made with Gale-Church hypothesis. The concept "shot descriptor" was... more
The paper focuses on an approach to a near-duplicate videos search. The search is based on the comparison of scene relative lengths in the space L2. The comparison is made with Gale-Church hypothesis. The concept "shot descriptor" was introduced. To speed up the performance of this method, semantic hashing was suggested, i.e. a generalization of locally sensitive hashing. 

В работе рассмотрен подход для поиска нечетких дубликатов видео. Поиск основан на сравнении относительных длин сцен в пространстве L2. Сравнение проводится с учетом гипотезы Гейла-Черча. Вводится понятие «дескриптора сцены». Для ускорения работы метода предложено использовать семантическое хеширование, обобщение локально чувствительного хеширования.
Существует достаточно широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. Для многих военных и гражданских приложений, необходимо наличие возможности поиска нечетких дубликатов видео. К таким приложениям можно... more
Существует достаточно широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. Для многих военных и гражданских приложений, необходимо наличие возможности поиска нечетких дубликатов видео. К таким приложениям можно отнести формирование поисковых сниппетов для видео-материала; поиск «пиратского» содержимого; оптическую навигацию БПЛА. Понятие «нечеткий дубликат» означает неполное или частичное совпадение текущего документа (изображения) с другим документом подобного класса. Существует несколько вариантов поиска нечетких дубликатов, но большинство подходов требуют значительных затрат либо по времени, либо по памяти. Многие методы рассматривают только содержимое кадров и не учитывают временные особенности видео. В этой работе используются сравнение относительных длин сцен для обнаружения нечетких дубликатов. Подобный подход применяется в математической лингвистике для выравнивания параллельных корпусов текстов на разных языках. Автор считает, что два нечетких дубликата видео являются «переводами» друг друга. Требуется установить близость таких «переводов». Относительная длина сцены вычисляется как вектор отношений абсолютной длины сцены к абсолютным длинам остальных сцен видео. Относительные длины сцен двух нечетких дубликатов редко будут совпадать. Это связано, в том числе, с ошибками распознавания границ сцен. Если относительная длина сцены одного видео отличается от длины сцены другого видео не более чем в два раза, и все предыдущие сцены выравнены, то, текущая пара сцен выражает одно и то же явление, при условии, что оба видео являются нечеткими дубликатами друг друга. Чем менее отличаются относительные длины сцен, тем более вероятно, что сцены похожи. Если длины отличаются больше чем в два раза, то длину меньшей сцены складывают с длиной следующей сцены этого же видео, и рассматривают объединенную сцену как одну. В случае совпадения относительных длин сцен видео применяется сравнение начальных и конечных кадров внутри сцен. Для решения задачи используются методы опорных векторов и мешка слов.
В работе рассмотрен подход для поиска нечетких дубликатов видео. Поиск основан на сравнении относительных длин сцен в пространстве L2. Сравнение проводится с учетом гипотезы Гейла-Черча. Вводится понятие «дескриптора сцены». Для ускорения... more
В работе рассмотрен подход для поиска нечетких дубликатов видео. Поиск основан на сравнении относительных длин сцен в пространстве L2. Сравнение проводится с учетом гипотезы Гейла-Черча. Вводится понятие «дескриптора сцены». Для ускорения работы метода предложено использовать семантическое хеширование, обобщение локально чувствительного хеширования.
Существует широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. В частности, для многих военных и гражданских приложений, необходимо наличие поиска нечетких дубликатов видео. Для мирного применения, — это... more
Существует широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. В частности, для многих военных и гражданских приложений, необходимо наличие поиска нечетких дубликатов видео. Для мирного применения, — это группировка подсказок в выдаче поисковиков, поиск неправомерных публикаций видеофайлов, сокращение объема хранимой и передаваемой информации. Для военного применения можно тоже перечислить несколько вариантов.
Даны два видео файла или потока. Нужно выяснить являются ли они дубликатами друг друга. Здесь, под словом дубликат понимается не формализуемое условие: «На этих файлах изображено одно и то же?». Возможна, и другая постановка этой задачи.... more
Даны два видео файла или потока. Нужно выяснить являются ли они дубликатами друг друга. Здесь, под словом дубликат понимается не формализуемое условие: «На этих файлах изображено одно и то же?».  Возможна, и другая постановка этой задачи. Дан набор видео, для нового добавляемого в этот набор видео нужно определить,  есть ли дубликат этого нового видео в наборе или нет. Понятие «нечеткий дубликат» является устоявшимся термином в задачах информационного поиска и обычно употребляется применительно к документам и изображениям. Нечеткость в данном случае интерпретируется как неполное или частичное совпадение документов или изображений.
Работа посвящена разработке распределенной статистической системы перевода естественных языков. Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие... more
Работа посвящена разработке распределенной статистической системы перевода естественных языков. Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие языки. В работе проведен краткий обзор существующих типов систем машинного перевода, описана теоретическая база статистических систем машинного перевода, изложен нетрадиционный подход к созданию таких систем. В результате работы было создано распределенное программно-информационное обеспечение статистической модели перевода научно-технических текстов на примере русского и английского языков. Система представляет набор приложений взаимодействующих с общей базой данных. Набор приложений можно разделить на два класса: а) приложения необходимые для обучения системы по уже имеющимся переводам, которые выполнены человеком; б) приложения осуществляющие подбор наиболее подходящих переводных эквивалентов. Алгоритмы обучения системы были разработаны c учетом особенностей научных текстов и слабо применимы для других стилей литературы. За неимением текстов нужного объема и качества, в рамках данной работы обучение системы проводилось на комбинированном наборе переводов, состоящим преимущественно из официально-делового и публицистического стилей литературы. Для подбора наиболее подходящих переводных эквивалентов используется жадный инкрементный поиск. Его основным преимуществом является высокая скорость работы, что может оказаться важным для оперативного перевода. Качество перевода разработанной системы несколько уступает существующим аналогам. Это объясняется особенностями исходных данных и характером используемых алгоритмов. Скорость работы системы в несколько раз превосходит скорости доступных систем подобного класса. Для сравнения систем использовался одинаковый набор данных. В экономической части проведен расчет стоимости разработанной стемы. В разделе посвященном охране труда и окружающей среды описано каких последствий можно избежать при использовании созданной системы.
Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода. Задачи работы: описать в общих чертах стилистику научно-технического текста; описать принципы работы, основные типы систем машинного перевода;... more
Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода.
Задачи работы:
описать в общих чертах стилистику научно-технического текста;
описать принципы работы, основные типы систем машинного перевода;
изучить особенности языковых средств научного стиля;
выяснить какие из языковых средств остаются в тексте после его перевода;
сравнить текст, переведенный машиной и профессиональным переводчиком.
Объектом исследования являются преобразования, возникающие при машинном переводе текста научно-технической литературы.
Предметом исследования являются особенности структурно-семантических трансформаций при машинном переводе определенной научной работы с английского языка на русский.
В ходе исследования были использованы следующие методы:
аналитический;
сравнительный;
изучение монографических публикаций и статей;
метод сплошной выборки;
методы лингвистического анализа;
метод обобщения.
Теоретическая значимость работы заключается в попытке собрать и систематизировать информацию о малоизученном аспекте взаимодействия двух областей знаний:
об особенностях стиля научно-технической литературы;
об особенностях систем машинного перевода.

Практическая ценность работы определяется:
описанием особенностей научного стиля в виде диаграмм и схем, что, по нашему мнению, является наиболее доходчивым и методически оправданным.
комплексом собранных сведений относительно систем машинного перевода, которые также представлены в виде диаграмм и схем;
приведенным стилистическим анализом отрывков из классического труда Д. Кнута «Искусство программирования»;
сопоставлением машинного и «человеческого» перевода приведенного отрывка.

В качестве теоретической основы исследования были использованы как классические работы А. И. Гальперина И. В. Арнольд, посвященные стилистике английского языка, Я. И. Рецкера, А. Д. Швейцера, посвященные общей теории перевода, так и современные труды Ю. Н. Марчука, П. Н. Хроменкова, Б. Н. Рахимбердиева, посвященные машинному переводу. Особенно хотелось бы отметить работу С. Рассела, в которой дается объяснение принципов работы многих приложений искусственного интеллекта, в том числе машинного перевода.
The presentation focuses on finding of similar videos. The notion of «near-duplicates» is introduced. A near-duplicate is an object that approximates another object of the same class. The presentation contains near duplicate problem... more
The presentation focuses on finding of similar videos. The notion of «near-duplicates» is introduced. A near-duplicate is an object that approximates another object of the same class. The presentation contains near duplicate problem statement and a generalized model of the video search. Also a method of searching and comparing near duplicate videos is proposed. The method reduces near duplicate videos retrieval to time series indexation. This is achieved through a temporal video segmentation. Also a streaming video filtering declarative language is presented. It helps to implement a video segmentation. A final algorithm for near duplicate videos indexation and retrieval is formulated and compared with analogues.

Доклад посвящён поиску похожих видео. Введено понятие «нечетких дубликатов» видео. Нечетким дубликатом называют объект, частично совпадающий с~другим объектом подобного класса. Рассмотрена актуальность проблемы поиска нечетких дубликатов видео. Построена обобщённая модель поиска по видео. Предложен метод поиска и сравнения нечетких дубликатов, который с помощью сегментации видео по временной оси, сводит задачу к поиску и сравнению временных рядов. Представлен декларативный язык потоковой фильтрации видео, с~помощью которого реализована сегментации. Сформулирован алгоритм индексации и поиска нечётких дубликатов видео. Проведено сравнение с аналогами.
Video has a complex structure and can express the same idea in different ways. This makes the task of searching for video more complicated. Video titles and text descriptions cannot give the whole information about objects and events in... more
Video has a complex structure and can express the same idea in different ways. This makes the task of searching for video more complicated. Video titles and text descriptions cannot give the whole information about objects and events in the video. This creates a need for content-based video retrieval. There is a semantic gap between low-level video features, that can be extracted, and the users’ perception. The task of event detection is reduced to the task of video segmentation. Complex content-based video retrieval can be regarded as the bridge between traditional retrieval and semantic-based video retrieval. The properties of video as a time series are described.
Презентация доклада «Элементы поиска нечетких дубликатов видео» на XIII Всероссийской научной конференции «Нейрокомпьютеры и их применение» (17 марта 2015 года). Я хочу рассказать о поиске нечетки дубликатов видео. Понятие «нечеткий... more
Презентация доклада «Элементы поиска нечетких дубликатов видео» на XIII Всероссийской научной конференции «Нейрокомпьютеры и их применение» (17 марта 2015 года).

Я хочу рассказать о поиске нечетки дубликатов видео. Понятие «нечеткий дубликат» означает неполное или частичное совпадение текущего документа (изображения) с другим документом подобного класса. Почему интересно заниматься поиском дубликатов именно видео?

Видео

На слайде приведены ретроспектива и прогноз развития Российского интернет видео.

Данные взяты из http://www.ewdn.com/online-video-russia.html

Online Video in Russia / Adrien Henni, Vladimir Baydin, Alexandra Chekareva et al.;
Ed. by Adrien Henni;
East-West Digital News. –– First edition. –– East-West Digital News, 2013. –– October. ––
Main partners: comScore, Ernst & Young, the Moscow Higher School of Economics, The Next Web.
URL: http://www.ewdn.com/online-video-russia.html
Видно, что ожидается рост как и зрителей онлайн‑видео, так и количество просмотров от одного зрителя. Издатели, пользователи и сторонние организации часто редактируют и публикуют копии оригинального видео. Часто одинаковые видео снабжаются совершенно разными, причем очень часто не соблюдаются в том числе и правовые аспекты. Задача поиска таких копий могут быть решены через поиск нечетких дубликатов видео. Кроме того поиск нечетких дубликатов может быть полезен для организации систем рекомендаций по видео.

Пример ошибочной рекомендации видео

На слайде показана страница из Youtube с роликом, посвященным Челябинскому метиориту. Можно увидеть, что в качестве похожих видео нам предложены очень далекие по содержанию материылы.

Поиск

Поиск нечетких дубликатов полезен и для группировки выдачи поисковых систем. Задача казалось бы простая и должна была бы быть уже решена. Но вот например для фильма «Очаровательный Коралловый Риф» Ни одна из популярных поисковых систем не смогла корректно выделить дубликаты. Пример для Mail.ru Аналогичную картину можно видеть для Яндекса. Такая же проблема наблюдается и для Вконтакте. Ну и для упомянутого ранее тут Youtube.

Группировка новостей

НДВ удобно использовать для просмотра видео‑материалов о событиях, размещенных в разных СМИ. Это особенно полезно для новостей. Видео часто показывают очень похожие визуальные изображения и ролики, но с совершенно различной трактовкой. Авторская интерпретация преподносится зрителям, например, в комментариях диктора или субтитрах. Обычно отличается подача информации в СМИ, которые контролируют разные общественные или политические силы. СМИ, поддерживающие противоположные позиции, могут описать ситуацию поразному, но визуальное содержание, всего скорее, будет близким. Обнаружение таких видео и подача их вместе помогут людям получать более полное представление о происходящем с учетом различных точек зрения.

Подходы к определению понятия НДВ

Тема поиска НДВ относительно нова для научного сообщества.

И потому существует целый ряд различных толкований и определений.

Наиболее употребляемые определения Ву, Шена, Башарата, и Керубини, представленные далее, относятся к одному и тому же.

НДВ по Ву — копии друг друга, отличаются набором модификаций.
НДВ по Шену — общая сцена, разные условия съемки и варианты монтажа.
НДВ по Башарату — общая смысловая концепция, разные варианты представления.
НДВ по Керубини — общая семантика и нет дополнительной информации.
Схема поиска по видео

Поиск видео состоит из следующих шагов:

Анализ временно́й структуры видео — деление видео на фрагменты, которое включает обнаружение границ съёмок.
Определение характеристик фрагментов: параметров ключевых кадров, характеристик движения и объектов.
Извлечение информации из характеристик.
Аннотация видео, построение семантического индекса.
Обработка пользовательского запроса и выдача результата.
Обратная связь и переранжирование результатов для улучшения поиска характеристик.
Сегментация видео

Деление видео включает всебя обнаружение границ съёмок, извлечение ключевых кадров, сегментацию сцен иаудио. Съёмка — набор кадров внутри непрерывной временной области, кадры, которой значительно отличаются от кадров соседних областей. Кадры съёмок связаны между собой по смыслу. Съёмки считаются основной структурной единицей видео. Исторически, съёмка (монтажный план, кинематографический кадр) — отрезок киноплёнки, на котором запечатлено непрерывное действие между пуском и остановкой камеры, или между двумя монтажными склейками. Методы сегментации видео работают с уже созданным видео, и достоверно определить была монтажная склейка или нет, не всегда возможно. Именно по этой причине в литературе используется конструктивное определение съёмки, которое мы привели в начале абзаца. Сцена — группа смежных съёмок, связанных конкретной темой или предметом. С точки зрения семантики, самым мелким элементом видео является кадр (фотографический кадр, кадрик). Съёмка является более крупным делением. Из съёмок складываются сцены, а из сцен видео целиком. Деление видео включает в себя обнаружение границ съёмок, извлечение ключевых кадров, сегментацию сцен и аудио. Это может показаться не естественным, но сегментацию сцен и выделение ключевых кадров проще проводить, если уже известны границы съёмок.

Выделение признаков

Из полученных частей видео выделяют признаки. К признакам относят: характеристики ключевых кадров; объекты; движение в кадре; характеристики аудио и текста.

Типы видео‑сигнатур

Локальные:

выражают локальную информацию кадра,
напрямую работают с дескрипторами особых точек.
Глобальные:

выражают одной сигнатурой целый кадр;
выражают одной сигнатурой все видео целиком;
выражают изменении кадров во времени.
Локальные сигнатуры: оценка

Пусть дано некоторое видео:

разрешение 800 × 600 пикселей;
в кадре может быть найдено около 1000 точек;
Если таких видео много:

100 000 видео‑файлов;
по 5 ключевых кадров в каждом виде;
500 000 000 ключевых точек;
Каждая точка представлена вектором:

SIFT (128 компонент)
или PCA‑SIFT (64 компоненты);
Глобальные сигнатуры

Одна сигнатура — целый кадр:

средние цветовые моменты кадра;
цветовые моменты областей кадра (дескриптор GIST);
мешок визуальных слов;
линеаризация, видео как ДНК;
Одна сигнатура — видео целиком:

средний цветовой момент видео;
ссылочная видео‑гистограмма — набор опорных кадров;
кластеризация кадров.
Пространственно‑временные сигнатуры:

отслеживание траекторий;
линеаризация, порядковая сигнатура;
последовательность монтажных склеек;
дерево сцен.
Что такое видео?

Видео содержит в себе несколько видов данных.

метаданные — заголовок, автор и описание;
звуковая дорожка;
тексты полученные при помощи технологии оптического распознавания символов (OCR) или при помощи технологий распознавания речи;
визуальная информация кадров видео.
Важно, что источники данных разной природы не являются независимыми. Они тесно связаны и дополняют друг друга, позволяя воссоздать полную картину происходящего. Таким образом, видео обладает комплексностью. Комплексность (системность, мультимодальность)  — способность взаимодействовать с пользователем по различным каналам информации и извлекать и передавать смысл автоматически. Комплексность видео состоит в возможности автора выражать мысли, используя по крайней мере два информационных канала. Каналы могут быть визуальными, звуковыми или текстовыми.

Видео — это последовательность

Видео — последовательность фактов, развивающихся во времени.

Свойства фактов — пространственная характеристика видео,
продолжительность и порядок фактов — временная.
Что есть факты?

простейший вариант — сцены‑съёмки;
ищем точки смены съёмок (монтажных склеек).
Пространственная характеристика: начальный и конечный кадр («мешок слов», GIST).

Временная характеристика:

отношения длин съёмок к длинам соседних съёмок
алгоритмы выравнивания последовательностей.
Результаты и перспективы

Предложен подход:

относительные длины;
выравнивания;
дескриптор фактов в видео;
Проведены эксперименты (17 тыс. фильмов).

Приложения

алгоритм поиска нечетких дубликатов;
что такое относительные длины;
временные отметки перемены сцен;
выравнивания последовательностей.
Существует широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. В частности, для многих военных и гражданских приложений, необходимо наличие поиска нечетких дубликатов видео. Для мирного применения, — это... more
Существует широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. В частности, для многих военных и гражданских приложений, необходимо наличие поиска нечетких дубликатов видео. Для мирного применения, — это группировка подсказок в выдаче поисковиков, поиск неправомерных публикаций видеофайлов, сокращение объема хранимой и передаваемой информации. Для военного применения можно тоже перечислить несколько вариантов.
The term “Near-duplicate” is an object that is fully or partly similar to another object. There are natural and artificial near-duplicates. Natural near-duplicates are similar objects within the similar environment, while artificial... more
The term “Near-duplicate” is an object that is fully or partly similar to another object. There are natural and artificial near-duplicates. Natural near-duplicates are similar objects within the similar environment, while artificial near-duplicates are objects, which comes from one original object. Now lets, turn to the main aims of the the near duplicate retrieval. Firstly, the near duplicate retrieval may be helpful for the optical navigation of cruise missiles or pilotless planes. Secondly, it is helpful for grouping snippets of the search engines. Moreover, it is necessary for the video classification and copyright management. This is the most important part for the online cinema. Nowadays there are several ways to find near duplicates. First one is based on global video features. Another is based on local and global features of particular frames. Then, youtube.com uses the audio based approach while, Licenzero uses the visual words. Also the combinations of different methods are applied. We propose an algorithm of the near duplicate video retrieval based on the shot detection. A shot is a sequence of the frames, which are considerably different form the frames of another sequence. Imagine our task as the following: There are a lot of the initial videos. Somebody gives us some new video, and we should say if it is a copy of one or more of the initial videos. We compute scene descriptors for every shot of every initial video and for every shot of the given video. Then we compare these descriptors to each other.If several descriptors of the given video are coincide with descriptors of the initial videos, it means these parts of videos are duplicates. Else, the given video is unique. As a result of this work we have the approach for the near-duplicate video retrieval. Firstly, It includes length ratios and relative lengths. Secondly, we use the scene aliment. The same method is used in the computer linguistics for the sentences aliment in the bilingual corpora. It is called Gale-Church algorithm. Thirdly, we propose scene descriptors. Several experiments have been conducted.
XI All-Russian Conference “Neurocomputers and their application”, Мoscow: MSUPE, 19.03.2013. Понятие «нечеткий дубликат» означает неполное или частичное совпадение текущего документа (изображения) с другим документом подобного... more
XI All-Russian Conference “Neurocomputers and their application”, Мoscow: MSUPE, 19.03.2013.

Понятие «нечеткий дубликат» означает неполное или частичное совпадение текущего документа (изображения) с другим документом подобного класса.

Дубликаты бывают естественные и искусственные. Естественные дубликаты — схожие объекты, при схожих условиях. Искусственные нечеткие дубликаты — полученные на основе одного и того же оригинала.

Поиск нечетких дубликатов может быть полезен для оптической навигации беспилотных аппаратов, для определения характера ландшафта местности, составления каталогов видео, группировки сниппетов поисковых систем, фильтрация видео рекламы, и поиска пиратского видео.

Нечеткие дубликаты тесно связаны с проблемами классификации видео и поиска по видео. Но эти задачи являются самостоятельными.

На данный момент нечеткие дубликаты пытаются искать, сравнивая глобальные особенности видео, глобальные и локальные особенности кадров и множеств кадров. Сравнивают звуковой ряд (так, например делюат в ютубе). Ищут и сравнивают визуальные слова, характерные последовательности (лицензЕро). Используется комбинация методов.

Мы предлагаем алгоритм поиска нечетких дубликатов на основе сцен. Есть множество исходных файлов, для видео сцен этих файлов вычислены дескрипторы сцен. Получаем новое видео. Требуется установить является ли новое видео дубликатом существующих. Вычисляем дескрипторы сцен этого видео . Дескриптор каждой сцены нового видео сравниваем с каждым дескриптором кадой сцены каждого исходного видео.

Если на нектором временном промежутке дескрипторы совпали, считаем, считаем, что временной промежуток является дубликатом одной из частей исходного видео. Если не несовпали ни на одном — считаем видео уникальным.

Что такое сцена?

Существует три различных понятия. Кадр, Фотографический кадр — статическая картинка. Сцена, монтажный кадр — множество кадров связанных единством места и времени. Съемка, кинематографических кадр, множество кадров связанных единством съемки. 1 сцена может включать несколько съемок. Съемку часто называют <<сценой>>. Далее мы будем рассматривать съемку, но называть ее будем <<сценой>>.

Введем формальное определение. Сцена-съемка, набор кадров определенной временной области кадры которой значительно отличаются от кадров соседних опластей. Аналогичным образом можно ввести понятие звуковой сцены, правда возникает отдельная проблема выделения звуковых-кадров.

Выделение сцен происходит на основе трех базовых подходов. Это сравнение гистограм соседних кадров. Сравнение спектров кадров и сравнение векторов оптического потока. На слайде приведены первые кадры сцен рекламы на МТС, выделенные c помощью ffmpeg. ffmpeg использует сравнение гистограмм кадров.

Если исходную рекламу сжать разными кодеками, мы получим нечеткие дубликаты этого видео. Выделяя сцены в каждом видео, увидим, что точки перемены сцен для этих двух файлов не совпадают.

Если взять более продолжительное видео, и выделить сцены при более высокой чувствительности, то можно заметить, что для разных кодеков сцены определяются совсем не однородно. Более того, некоторые сцены могут не распознаться.

Для решения этой проблемы мы предлагаем использовать относительные длины сцен. Для каждой сцены вычисляем отношение длины сцены к длинам остальных сцен. Для первых четрех сцен рекламы МТС получаем следующую матрицу. В практических задачах удобнее вычислять отношения длин, для трех предыдущих сцен. Это удобно и вслучае, если все видео целиком нам недоступно.

Если относительная длина сцены одного видео отличается от длины соответствующей сцены другого видео не более чем в два раза, то можно предположить, что сцены выражают одно и то же явление. В этом случае то длину меньшей сцены можно сложить с длиной следующей сцены этого же видео, и рассматривать объединенную сцену как одну. Подобные метод называют алгоритмом Гейла-Черча. Используется в математической лингвистике для выравнивания праллельных корпусов тесктов на разных языках.


Если относительные длины двух сцен совпали, не факт что сцены действительно одинаковы. Требуется сравнивать внутренние свойства сцен. Можно взять начальные и конечные кадры.

Сравнивать можно попиксельно, на основе детектора краев. В данном случчае удобно использовать глобальные дескриптор GIST, и мешок слов.

GIST представляем из себя простой но не очень точный способ глобального описания изображения. Применим для широкого круга задач.

Мешок слов, обычно более точен, при достаточном размере словаря. Необходимо, чтобы был набор изображений, на которых можно обучиться. Хорош, если работа ведется только в рамках конкретной предметной области. Но работает медленне и потенциально бесконечен по памяти.

Т.о. получили дескриптор сцены. Он состит из вектора отношений длины сцены к длинам других сцен; Его удобно сразу хранить, с объединениями соседних сцен учитывая гиппотезу Гейла Черча; И характеристики начального и конечного кадров. В зависимоти от задачи мешок слов или GIST.

Вернемся к предложеннуму алгоритмы. Мы сравнивали дескрипторы на прямую в пространстве L2. Но это не эффективно, для больших дескрипторов.

Можно предложить использование цифровых семантических подписей. Введем бинарные подписи. Подписи должны быть близки для близких дескипторах в L2.

Самое простое, что можно предложить: Линейно чувствительные хеши. Пространство дескрипторов, делим гиперплоскостью на 2 подпространства. Назначаем дескрипторам этих подпространств подпись 0 или 1. Получили бит подписи. С увеличением числа бить ассимптотически приближаем метрику L2. Для задач подобного рода лучше себя показали обучаемые хеши. К ним относятся бустинг и ограниченная машина Больцмана. В качесвтве бустинга исользуется модификация AdaBoost. Цель — получить такие подписи, расстояние между дескрипторами вычисляется, будет вычисляться как расстояние Хемминга.

Ограниченная машина Больцмана: Вероятностная рекурентная нейронная сеть. Вероятностная версия сети Хопфилда. Или нейросетевая версия Скрытой Модели Маркова. Применяется модификация, без связей внутри слоев. Мощность словем понижается от размера входного вектора до размера требуемого кода.


В результате проделанной работы: был разработан подход поиска нечетких дубликатов видео на основе сцен. Его основные моменты: относительные длины, выравнивания сцен на основе лингвистичского алгоритма Гейла-Черча, дескрипторы сцен; Проведен ряд экспериментов, которые показали удобства подхода.

Далее нам требуется разработать собственный инструмент для поиск перемены, сейчас используется ffmpeg. лучше проработать схемы с использованием Больцмана Провести эксперименты на реальном множестве исxодных данных.
Работа посвящена разработке распределенной статистической системы перевода естественных языков. Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие... more
Работа посвящена разработке распределенной статистической системы перевода естественных языков. Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие языки. В работе проведен краткий обзор существующих типов систем машинного перевода, описана теоретическая база статистических систем машинного перевода, изложен нетрадиционный подход к созданию таких систем. В результате работы было создано распределенное программно-информационное обеспечение статистической модели перевода научно-технических текстов на примере русского и английского языков. Система представляет набор приложений взаимодействующих с общей базой данных. Алгоритмы обучения системы были разработаны c учетом особенностей научных текстов и слабо применимы для других стилей литературы. За неимением текстов нужного объема и качества, в рамках данной работы обучение системы проводилось на комбинированном наборе переводов, состоящим преимущественно из официально-делового и публицистического стилей литературы. Для подбора наиболее подходящих переводных эквивалентов используется жадный инкрементный поиск. Его основным преимуществом является высокая скорость работы, что может оказаться важным для оперативного перевода. Качество перевода разработанной системы несколько уступает существующим аналогам. Это объясняется особенностями исходных данных и характером используемых алгоритмов. Скорость работы системы в несколько раз превосходит скорости доступных систем этого класса. Для сравнения систем использовался одинаковый набор данных. В экономической части проведен расчет стоимости разработанной стемы. В разделе посвященном охране труда и окружающей среды описано каких последствий можно избежать при использовании созданной системы.
Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода. Задачи работы: описать в общих чертах стилистику научно-технического текста; описать принципы работы, основные типы систем машинного перевода;... more
Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода. Задачи работы: описать в общих чертах стилистику научно-технического текста; описать принципы работы, основные типы систем машинного перевода; изучить особенности языковых средств научного стиля; выяснить какие из языковых средств остаются в тексте после его перевода; сравнить текст, переведенный машиной и профессиональным переводчиком. Объектом исследования являются преобразования, возникающие при машинном переводе текста научно-технической литературы. Предметом исследования являются особенности структурно-семантических трансформаций при машинном переводе определенной научной работы с английского языка на русский. В ходе исследования были использованы следующие методы: аналитический; сравнительный; изучение монографических публикаций и статей; метод сплошной выборки; методы лингвистического анализа; метод обобщения. Теоретическая значимость работы заключается в попытке собрать и систематизировать информацию о малоизученном аспекте взаимодействия двух областей знаний: об особенностях стиля научно-технической литературы; об особенностях систем машинного перевода. Практическая ценность работы определяется: описанием особенностей научного стиля в виде диаграмм и схем, что, по нашему мнению, является наиболее доходчивым и методически оправданным. комплексом собранных сведений относительно систем машинного перевода, которые также представлены в виде диаграмм и схем; приведенным стилистическим анализом отрывков из классического труда Д. Кнута «Искусство программирования»; сопоставлением машинного и «человеческого» перевода приведенного отрывка. В качестве теоретической основы исследования были использованы как классические работы А. И. Гальперина И. В. Арнольд, посвященные стилистике английского языка, Я. И. Рецкера, А. Д. Швейцера, посвященные общей теории перевода, так и современные труды Ю. Н. Марчука, П. Н. Хроменкова, Б. Н. Рахимбердиева, посвященные машинному переводу. Особенно хотелось бы отметить работу С. Рассела, в которой дается объяснение принципов работы многих приложений искусственного интеллекта, в том числе машинного перевода.
Автор курса, Светлана Владимировна Бабарина — старший преподаватель кафедры Производственный менеджмент и маркетинг Московского Авиационного Института, год проработала в компании AIG (American International Group)
Research Interests:
Составлено на основе лекций, которые читает Иванов Н. В. в МАИ на факультете иностранных языков (второе высшее 2009 г).
Research Interests:
Студенты TeX-ники: И.К. Никитин, Ю.М. Сергукова, А.А. Кухтичев, А.А. Филипова. Преподаватель: В.Н. Калита. Предмет политологии. Сущность политики. Политология и ее предмет. Разделы. Сущность политики. Политология и ее предмет. Разделы.... more
Студенты TeX-ники: И.К. Никитин, Ю.М. Сергукова, А.А. Кухтичев, А.А. Филипова. Преподаватель: В.Н. Калита.

Предмет политологии. Сущность политики. Политология и ее предмет. Разделы. Сущность политики. Политология и ее предмет. Разделы. Методы. Категории. Функции. Место. Методы. Категории. Функции. Место. История.. Социально-классовые общности. Субъекты. Потребности. Интересы. Конфликт. Консенсус. Классы. Социальные слои. Социально-классовая структура современного общества. Марксизм. Запад. США. Социально-этнические общности. Понятие этноса. Этнические процессы в современном мире. Понятие этноса. Сущность этноса. Этнические процессы. Национальный вопрос: содержание, исторический опыт. Решения. Демократические принципы национальной политики. Государственно-правовые формы решения национального вопроса. Личность и политика. Понятие личности. Политическая социализация. Значения. Этапы. Факторы. Проблема политического лидерства. Мотивация. Предпосылки. Политическое участие. Политическая элита. Понятия политической элиты. Её состав и функции. Функции. Проблема отбора правящей элиты. Политическая власть. Сущность. Характеристики. Основные типы концепций. Субъект. Объект. Носитель. Методы. Методы осуществления политической власти. Легальность и легитимность. Политический режим. Понятие и типология политических режимов. Тенденции к развитию политических режимов. Недостатки демократии. Причины господства демократии в развитых странах. Причины преобладания авторитарности в странах третьего мира. Факторы демократизации в третьем мире. Политическая культура. Понятия и структура. Понятия. Типы. Политическая культура России. Истоки. Современное положение. Словарик. Консерватизм-Радикализм. Левые-Правые. Демагогия и популизм. Политическое повеление. Политическая идеология. Понятия идеологии. Её сущность и формы. Роль идеологии. Структура. Характеристики. Современные идеологии. Политическая идеология. (Продолжение). Либерализм. Неолиберализм. Консерватизм. Неоконсерватизм. Социализм. Социал-реформизм. Анархизм. Фашизм. Политическая система. Государство. Политическая система. Основные функции политической системы. Гражданское общество. Ядро. Государство. Государство. Правовое государство. Теория разделения властей. Политические партии. Сущность. Основные признаки и функции политических партий. Основные признаки партий. Функции политических партий. Типология партий и партийные системы. Типология партий. Партийная система. Однопартийная система. Многопартийная система. Политические выборы. Роль, функции и основные принципы выборов в современных демократических государств. Всеобщее избирательное право. Основные типы избирательных систем. Порядок проведения выборов и референдумов. Проблемы финансового и информационного обеспечивания избирательной кампании.
Research Interests:
Лектор: Короткова Т. И. Лекции взяты с http://www.mainfo.ru/. (2006 год) А туда они попали с сайта 805 кафедры. (2004 год) Сами по себе лекции отчасти оставались актуальны в 2010 году. Оглавление: Принцип гарантированного... more
Лектор: Короткова Т. И.
Лекции взяты с http://www.mainfo.ru/. (2006 год)
А туда они попали с сайта 805 кафедры. (2004 год)
Сами по себе лекции отчасти оставались актуальны в 2010 году.

Оглавление:
Принцип гарантированного результата. Системы, операции, управление. Цикл управления операцией. Математическая модель операции. Получение оптимального гарантированного результата. Многократное повторение операций. Сравнение альтернативных решений. Игровые модели. Непрерывные игры. Решение матричной игры в чистых стратегиях. Применение смешанных стратегий. Приближенное решение матричной игры. Графическая интерпретация матричной игры. Свойства оптимальных стратегий. Порядок решения матричной игры. Учет динамики в информированности оперирующей стороны. Матричная игра с n игроками, коалиция. Игры с непротивоположными интересами. Этапы игры с участием лица принимающего решения (ЛПР). Многокритериальные задачи. Методы свертывания критериев. Компромиссные решения. Метод векторных оценок. Необходимые и достаточные условия оптимальности по Парето. О сужении области компромиссов. Многокритериальные задачи распределения средств. Эпсилон эффективность. Участие человека в принятии решения. Сетевые модели. Сведение сети к сети с одним источником и одним стоком. Отношения между потоками и действия над ними. Теорема о совместно согласованных потоках. Простые потоки. Теорема о декомпозиции потока. Допустимый поток. Теорема о построении допустимого потока. Метод пометок отыскания кратчайшего расстояния. Алгоритм построения максимального потока. Алгоритм построения максимального потока. Алгоритм отыскания максимального потока минимальной стоимости (двухкритериальная задача в сети). Сведение сетевой задачи к ЗЛП. Многопродуктовые потоки. Общая процедура изменения маршрута. Принятие решения в условиях нечетких множеств. Основные понятия. Операции над нечеткими множествами. Отображение нечеткого множества. Нечеткое отображение нечеткого множества. Нечеткий прообраз нечеткого множества. Задачи оптимизации в нечеткой постановке. (подход Беллмана—Заде). Методы экспертного оценивания. Проблема группового выбора. Некоторые затруднения. Основные этапы экспертизы. Анализ результатов оценки объектов. Анализ компетентности экспертов по взаимооценкам. Анализ компетентности экспертов по оценкам объектов. Обработка результатов парных сравнений. Аппроксимация сверхтранзитивных матриц. Многоуровневые модели принятия решений. Типы иерархий. Страты. Слои. Многоэшелонные системы: организационные иерархии. Зависимость между уровнями. Координируемость. Используемые понятия. Описание задач двухуровневой системы. Принятые правила декомпозиции. О формировании задачи координации. Принцип прогнозирования взаимодействия без модификации целей. Условия применимости принципа прогнозирования связующих переменных без модификации локальных функций. Сходимость итерационного процесса координации для принципа прогнозирования связующих переменных без модицикации локальных функций. Условия применимости принципа прогнозирования связующих переменных с модификацией локальных функций. Сходимость итерационного процесса координации для принципа прогнозирования связующих переменных с модификациями локальных функций. Условия применимости принципа последующего согласования связующих переменных. Сходимость итерационного процесса координации для принципа последующего согласования связующих переменных. Единый подход. Вопросы для самоконтроля.
Research Interests:
"Методичка основана на курсе лекций, который читает О. В. Казанцев в рамках курса лекций «Методы и средства Мультимедиа». Эта вторая версия лекций, в ней исправлен ряд опечаток, немного изменена верстка."
Research Interests:
Research Interests:
Research Interests:
Research Interests:
Research Interests:
Research Interests:
Information Systems, Computer Science, Data Mining, Business Intelligence, Customer Relationship Management (CRM), and 32 more
Research Interests: