vk_logo twitter_logo facebook_logo googleplus_logo youtube_logo telegram_logo telegram_logo

ИВК представляет новую информационно-аналитическую систему обработки неформализованных естественных текстов "ИВК СОНЕТ"

Дата публикации: 21.05.2007
Количество просмотров: 748

Компания ИВК — один из ведущих российских производителей компьютерной техники, системообразующего ПО и средств защиты информации, объявляет о завершении разработки и начале продвижения на российский рынок нового программного продукта — Информационно-аналитической системы обработки неформализованных естественных текстов "ИВК СОНЕТ™".

Эта система позволяет госструктурам, силовым ведомствам, коммерческим предприятиям и общественным организациям создавать эффективные решения промышленного уровня для сбора, систематизации и анализа неструктурированной текстовой информации, полученной из всевозможных источников, включая информационные ресурсы Интернет, новостные ленты и обновляемые разделы сайтов, сообщения электронной почты, электронные документы различных форматов и др. В итоге, значительно возрастает оперативность, точность и обоснованность решения таких задач, как глубокое изучение рынка, анализ действий конкурентов, "информационная разведка", идентификация информационных кампаний, выявление тенденций и как результат – принятие эффективных управленческих решений.

Система "ИВК СОНЕТ™" базируется на собственных технологиях и разработках компании ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Синтаксический анализ выделяет простые предложения в составе сложного и устанавливает связи между словами. Технология морфологического анализа позволяет учитывать изменяемость слов, ярко выраженную в русском языке. В результате значительно возрастает полнота, точность поиска информации, а также увеличивается скорость обработки запроса.

Отдельные технологии, вошедшие в "ИВК СОНЕТ™", в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др.

Вместе с тем, при создании программного продукта "ИВК СОНЕТ™" данные технологии были значительно усовершенствованы по функциональности и производительности, а также интегрированы в единый комплекс инструментов для сбора и консолидации информации из различных источников, решения всевозможных задач по анализу собранного массива текстов, а также настройки системы на новые предметные области. Благодаря интуитивно понятному интерфейсу системы "ИВК СОНЕТ™" для эффективной работы с ней требуется лишь минимальное обучение.

Подчеркнем, что вошедший в "ИВК СОНЕТ™" набор функций достаточен для поддержки работы аналитика над задачами, критически важными практически для любой организации.

В ПО "ИВК СОНЕТ™" объединены средства сбора и консолидации информации, инструменты фильтрации и поиска, а также три вида аналитической обработки: классификация, кластеризация и контент-анализ.
Встроенные средства и специальные программы-конверторы позволяют автоматически заносить в базу данных системы сообщения в наиболее распространенных форматах, включая TXT, HTML, XML, RTF, DOC, E-MAIL и др. При этом "ИВК СОНЕТ™" унифицирует формат полученной информации, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа.
Система фильтрации и поиска позволяет формировать выборки на основе сложных запросов, в которых могут быть задействованы регулярные выражения, ключевые слова, временные интервалы и разнообразные атрибуты сообщения, например, автор, рубрика и т.д.
Классификация позволяет распределять сообщения по заданным рубрикам, набор и содержание которых как раз и задают привязку системы к конкретной предметной области. В этой связи необходимо отметить, что система "ИВК СОНЕТ™" не накладывает технических ограничений на количество рубрик, число описывающих рубрику словосочетаний и на их длину. Это свойство системы, в сочетании с морфологическим и синтаксическим анализом, значительно повышает эффективность классификации, резко сокращает объем текстов, необходимых для обучения системы.
Кластеризация группирует информационные сообщения по степени близости их содержания к анализируемому в текущий момент тексту-ядру кластера. При этом заготовленный рубрикатор не требуется.

Контент-анализ формирует список словосочетаний, составляющих "информационное окружение" анализируемого объекта. В реальных задачах этот вид аналитической обработки позволяет, в частности, выявлять наиболее проблемные (актуальные) вопросы "вокруг" анализируемого объекта. Особо отметим, что реализованный в системе "ИВК СОНЕТ™" контент-анализ позволяет отслеживать динамику изменения проблемных вопросов во времени.

В перспективе компания ИВК планирует дальнейшее развитие комплекса "ИВК СОНЕТ™". В ближайших планах - внедрение функции тонального анализа, позволяющего выявлять сообщения с положительной, нейтральной и негативной эмоциональной окраской. Затем в систему будут включены функции создания семантической сети терминов, окружающих изучаемый объект, а также установления возможных транзитивных связей между объектами. Кроме того, компания планирует интегрировать систему "ИВК СОНЕТ ™" в среду "ИВК Юпитер ™", что расширит возможности анализа территориально-распределенных массивов текстовой информации, разграничения доступа к данным "ИВК СОНЕТ™", безопасного обмена информацией между аналитиками и потребителями их услуг.

"Сегодня эффективная работа предприятия невозможна без комплексной поддержки принятия решений. Эта проблема одинаково актуальна для крупных промышленных и производственных предприятий, финансовых учреждений, телекоммуникационных компаний, средств массовой информации, различных государственных учреждений и силовых структур, — говорит Григорий Сизоненко, генеральный директор компании ИВК. — Но постоянно "вылавливать" из общего потока действительно важную информацию с каждым днем становится все сложнее. Объем данных растет стремительно, а на их "просеивание" сотрудники предприятий, независимо от отрасли и направления деятельности, тратят массу времени. Решение проблемы состоит в дополнении комплекса средств автоматизации информационно-аналитической системой, позволяющей оперативно получать подробную информацию по изучаемому вопросу, выявлять общие и частные тенденции, характерные для исследуемого объекта, вести информационную разведку, анализировать действия конкурентов, определять характер спроса на тот или иной вид товаров или услуг и т.д.. Внедрение таких систем – логичный шаг для каждого современного предприятия, организации и, естественно, новый этап отечественной информатизации. Именно поэтому мы в компании создали новое направление и разрабатываем линейку информационно-аналитических продуктов, первым из которых стал "ИВК СОНЕТ™".

От редакции: если у вас есть чем поделиться с коллегами по отрасли, приглашаем к сотрудничеству
Ссылка на материал, для размещения на сторонних ресурсах
/news/newsline/11218/ivk-predstavlyaet-novuyu-informatsionno-analiticheskuyu-sistemu-obrabotki-neformalizovannyih-estestvennyih-tekstov-ivk-sonet-.html

Обсудить на форуме

Оставлять комментарии могут только зарегистрированные пользователи

Зарегистрироваться