Закрыть
Логин:
Пароль:
Забыли свой пароль?
Регистрация
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

DOCFLOW - теория и практика электронного документооборота. Все о ECM и СЭД (системы электронного документооборота), ЭП

Eng
01.06.2006
Пример использования технологий аналитической обработки информации в рамках документооборота органов государственной власти

Краюшкин Д.В., генеральный директор,
Кащенко А.А., руководитель проектов,
ООО «МЕТТЭМ программные системы»


На сегодняшний день на рынке СЭД представлено значительное число систем электронного документооборота отличающихся как по своим функциональным возможностям так и, соответственно, по занимаемой на рынке нише. Как правило, системы электронного документооборота используются для автоматизации следующих функциональных задач:

  • электронное архивное хранение документов;
  • выполнение функций делопроизводства;
  • маршрутизации и хранение документов.

Наибольшее распространение на сегодняшний день получили системы смешанного типа сочетающие в себе все, приведенные выше функции. При этом, необходимо отметить, что из широкого ряда систем эффективно выполняющих основные функции документооборота, только некоторые представляют возможности по аналитической обработке накапливаемой в рамках документооборота информации.

Отметим, что ряд государственных органов использует для аналитической обработки информации серьезные и дорогостоящие программные продукты, обеспечивающие поиск, сбор и аналитическую обработку общедоступной информации. При этом получается, что затрачиваются существенные ресурсы на поиск и сбор информации, а уже имеющаяся в распоряжении информация остается за кадром. В частности, нередко за кадром остается информация, содержащаяся в обращениях граждан, занимающих важное место в документообороте органов государственной власти.

Своевременное и качественное разрешение обращений граждан играет важную роль в формировании общественного мнения о работе исполнительной власти. При этом стоит отметить, что на сегодняшний день основная работа по анализу обращений и подготовке ответов проводится сотрудниками профильных отделов, обрабатывающих обращения граждан. Для комплексного анализа проблематики обращений за некоторый период времени обычно используются стандартные рубрикаторы, которые редко редактируются. Таким образом, агрегированная информация по обращениям граждан представляется в виде гистограммы, с указанием количества обращений в каждой из рубрик.

На наш взгляд, для более качественной оценки тенденций, прослеживающихся в обращениях граждан, необходимо использовать современные аналитические методы обработки полнотекстовой информации.

Технологические особенности обработки обращений граждан

Обращения граждан можно разделить на ряд основных категорий, каждая из которых характеризуется своими особенностями:

  • «бумажные» письменные обращения;
  • обращения по электронной почте и через официальный web-сайт;
  • обращения по телефону.

Для выполнения аналитической обработки обращений граждан необходимо сформировать единое информационное хранилище для накопления в нем данных. С технологической точки зрения процедура формирования данного хранилища не представляет особых сложностей. Для каждого вида обращений имеются стандартизованные решения позволяющие решать эту задачу.

«Бумажные» письменные обращения

Данный вид обращений является одним из основных. В соответствии с действующим законодательством письменные обращения, поступившие в установленном порядке (переданные в приемную или поступившие по почте), требуют подготовки ответа в течение ограниченного времени.

На сегодняшний день письменных обращений написанных «от руки» поступает все меньше. Значительная часть обращений граждан выполняется в печатном виде, и есть все основания предполагать, что через несколько лет таким будет основной объем обращений.

Для документов, написанных от руки сотрудниками, обрабатывающими обращения граждан, как правило, оформляется краткая справка в печатном (электронном) виде, которая может быть помещена в единое информационное хранилище вместе с отсканированным образом документа.

Печатные документы пригодны для сканирования и распознавания текста, что позволит помещать их в единое информационное хранилище автоматизированным образом и использовать для последующей аналитической обработки. Для выполнения данной работы может использоваться одно из типовых решений, обеспечивающих ввод и распознавание текстовой информации, например комплекс ввода документов ABBYY Integrable Document Input System 6.5.

Обращения по электронной почте и через официальный web-сайт

На сегодняшний день в государственных органах данный вид обращений считается «второстепенным». Причина этого кроется в том, что в отличие от «бумажных» документов, электронные обращения не имеют официального статуса. Однако развитие направления по обработке электронных обращений – дело недалекого будущего, поскольку трудоемкость обработки электронных сообщений значительно меньше, чем трудоемкость обработки бумажного сообщения.

Как мы видим, при обработке электронного сообщения не требуется выполнять работу экспедиции по приему и отправке корреспонденции, она осуществляется автоматически.

При этом время получения ответа на электронное обращение значительно меньше, чем на «бумажное», что также в значительной степени влияет на формирование общественного мнения о работе исполнительной власти.

Несмотря на то, что всегда останутся обращения, которые требуется оформлять в бумажном виде (например, для использования в суде и т.п.), однако очень значительная часть обращений этого не требует.

Задача учета электронных обращений граждан и подготовки ответов на них решается стандартными средствами, которые присутствуют практически в любой системе документооборота, а также в портальных решениях.

С точки зрения задачи аналитической обработки электронные обращения являются наиболее перспективными, поскольку трудоемкость помещения их в единое информационное хранилище минимальна. Для этого требуется только отсеять «спам» и неинформативные сообщения, для получения более качественных результатов аналитической обработки. Далее данные обращения передаются в специализированный менеджер загрузки для помещения их в электронное хранилище.

При помещении в хранилище все поступающие обращения проходят стандартную процедуру обработки, включающую в себя следующие этапы:

  • морфологический анализ;
  • синтаксический анализ;
  • логико-семантический анализ;
  • индексирование.

Обращения по телефону

Стандартная технология обработки телефонных сообщений с помощью call-центров предполагает ввод оператором основных моментов сообщения в специализированную систему с помощью клавиатуры. Таким образом, помещение обращений в единое хранилище может выполняться полностью автоматически.

Особенности аналитической обработки обращений граждан

На этапе регистрации обращений граждан формируется информационное хранилище, обеспечивающего процесс проведения аналитической обработки обращений граждан.

Аналитические процедуры обработки информационного массива можно разделить на две основные категории:

  • агрегационные процедуры;
  • процедуры обработки группы связанных документов.

Агрегационные процедуры

Данные процедуры предназначены для получения обобщенных данных по поступившим обращениям граждан за некоторый период времени. Основной показатель для данных процедур – это количество обращений граждан по некоторому вопросу.

Конкретные результаты могут быть получены с использованием одного из следующих способов:

  • «ручная» рубрикация документов - широко используется в сегодняшней практике, однако не всегда корректно отражает реальную ситуацию, поскольку:
    • обращения могут быть по такой тематике, которая в рубрикаторе не предусмотрена;
    • сотрудник, обрабатывающий обращения граждан, может поместить обращение в первую подходящую рубрику, хотя обращение больше подходит к другой рубрике;
  • автоматическая рубрикация при размещении документов в информационном хранилище – может использоваться как «подсказка» сотруднику, обрабатывающему обращения граждан, отбирая небольшой набор рубрик релевантных обращению; в этом случае сотрудник может выбрать одну из представленных рубрик, а не искать требуемую рубрику во всем рубрикаторе;
  • кластерный анализ массива информации – данный вид аналитической обработки предназначен для выявления в обращениях граждан тематик, которые не были обозначены при рубрикации (также может использоваться для доработки существующего рубрикатора).

Полученные результаты, как правило, представляются в виде гистограммы и позволяют оценить интерес граждан к тематикам, представленным в рубрикаторе.

Процедуры обработки группы связанных документов

При помещении обращений граждан в хранилище помимо индексирования документов выполняется также выделение информационных объектов и связей между ними и размещение их в базе фактографической информации.
Основное преимущество данного подхода заключается в том, что осуществляется «отход в сторону» от конкретных обращений граждан и выполняется анализ ситуации по некоторой группе обращений, в которых фигурируют интересующие нас информационные объекты.

В качестве процедур аналитической обработки на данном уровне предлагается использовать:

  • построение досье на объект;
  • ситуативный анализ;
  • мониторинг типовых ситуаций;
  • расширенные режимы поиска информации.

Построение досье на объект

Построение досье на объект предполагает выполнение поиска в массиве фактографической информации всех связей указанного объекта, а также всех объектов, связанных с исходным, с возможностью получения исходных документов, содержащих описания обнаруженных объектов.

Например (продолжая тематику, отраженную на Рис. 2), мы можем взять в качестве информационного объекта некоторый детский сад № NNNN.

Предположим, что в течение полугода нам поступили следующие документы, в которых упоминался данный детский сад:

  • жалоба гражданина на необоснованный отказ в приеме ребенка в детский сад;
  • жалоба гражданина на «предложения» оказать материальную помощь детскому саду;
  • жалоба гражданина на неблагоустроенность территории детского сада;
  • вопрос гражданина о количестве детей, которые могут содержаться в одной группе с указанием номера данного детского сада;
  • вопрос гражданина о количестве «льготных» мест в данном детском саду на настоящее время;
  • вопрос гражданина о стандартном рационе питания в детском саду с указанием номера данного детского сада.

Если данные документы поступали в разное время и обрабатывались разными сотрудниками то, скорее всего, на каждое обращение был подготовлен ответ и направлен по принадлежности. При этом никаких объективных оснований, для того чтобы обратить особое внимание на данный детский сад не возникло, поскольку указанные проблемы являются стандартными на сегодняшний день.

Полученная картина может служить основанием для того, чтобы обратить на данный детский сад более пристальное внимание. Как мы видим, с рядом объектов связан исходный документ, к которому можно обратиться прямо из режима просмотра диаграммы. Это позволяет провести анализ исходных текстов документов для принятия оперативного решения по отображаемой на диаграмме ситуации.

Ситуативный анализ

Ситуативный анализ объектов – поиск в массиве фактографической информации связанных объектов, как для отдельных объектов, так и для их групп в соответствии с заданными ограничениями на глубину и характеристики поискового алгоритма.

Ситуативный анализ позволяет выявлять в массиве фактографической информации неявные закономерности, получая, таким образом, качественно новые знания.

В результате, в информационном массиве будут отобраны все ситуации соответствующие данной типологии (т.е. указаны все жалобы на отказ в выполнении каких либо действий, связанные с данным детским садом).

Мониторинг типовых ситуаций

Приведенные выше виды аналитической обработки информации, могут выполняться также и в режиме мониторинга.

Мониторинг досье на информационный объект предполагает, что вся вновь поступающая фактографическая информация соотносится с существующим досье. Если выявляются связи, то новые объекты добавляются в досье автоматически.

Для установленных на мониторинг типовых ситуаций, поступающая фактографическая информация проверяется на соответствие типологии, и, в случае выявления ситуации, выполняется сигнальное оповещение сотрудника, обрабатывающего информацию.

Расширенные режимы поиска информации

Для выполнения поиска в информационном массиве предлагаются следующие поисковые режимы:

  • атрибутивный поиск;
  • нечеткий поиск;
  • полнотекстовый поиск похожих документов.

Данные поисковые режимы позволяют отобрать набор документо в, связанных с некоторой рассматриваемой проблемой, а также могут использоваться для поиска конкретных документов, в том случае если стандартные поисковые запросы (по номеру документа, ФИО заявителя, дате поступления и т.п.) не дали требуемого результата.

Атрибутивый поиск

Данный режим поиска обеспечивает отбор информационных объектов по их реквизитам. При формировании поисковых условий предусмотрена возможность комбинировать значения поисковых реквизитов с использованием:

  • операторов И, ИЛИ;
  • частицы НЕ;
  • шаблонов значений для текстовых реквизитов;
  • промежутков вхождения для числовых и временных (даты, времени и т.п.) реквизитов;
  • значений классификационных реквизитов.

Нечеткий поиск

Нечеткий поиск документов позволяет задать сразу несколько критериев – по текстам документов, по рубрикам документов, по атрибутам документов и скомбинировать их в сложный запрос.

Полнотекстовый поиск похожих документов

Данный вид поиска позволяет выполнять в информационном массиве отбор фрагментов, аналогичных или похожих на описание ситуации на естественном языке, вводимое аналитиком (ограничения на характер и количество отличий выбираемых ситуаций от указанной также задается аналитиком).

Отобранные документы упорядочиваются по степени сходства, которая определяется с учетом следующих факторов: количества и значимости совпавших признаков, наличия похожих объектов, совпадения по какой-либо категории признаков.

Перспективы развития систем документооборота

На сегодняшний день на рынке представлено достаточное число систем, позволяющих эффективно автоматизировать документооборот организации.

Фактически, набор функций, выполняемых данными системами, является стандартным, поэтому при выборе конкретной системы документооборота важную роль играют ее дополнительные возможности, расширяющие основные функции.

На наш взгляд, одним из перспективных направлений развития является применение, а для тех систем, в которых данные функции уже имеются, развитие следующих функций:

  • аналитических функций, представляющих возможности по семантической обработке информации;
  • функций качественного нечеткого поиска, позволяющих за короткое время найти в массиве требуемый документ, имея минимум исходной информации для поиска;
  • функций автоматической рубрикации, обеспечивающих достаточную точность при отнесении документа к рубрике.

Данные функции позволят использовать накапливаемую в системах документооборота информацию для принятия более обоснованных управленческих решений, а также повысить удобство использования данных систем.

 

Поделиться:




КАЛЕНДАРЬ
ПОСЛЕДНИЕ НОВОСТИ
21.06.2019
TESSA 3.3 – новые горизонты СЭД
Компания Syntellect объявила о выпуске официального релиза СЭД TESSA версии 3.3.
В новой версии платформы расширены возможности легкого клиента, обеспечена поддержка разных часовых зон и внесено более сотни других улучшений.

28.03.2019
Финансы уйдут в электронный документооборот
На рассмотрение государственной думы РФ вынесен законопроект о введении электронного документооборота в российских организациях. При создании электронных копии бумажных документов, оригиналы нужно будет хранить всего год.

28.03.2019
В ожидании цифрового прорыва
Как выбраться из «колеи», в которой, согласно институциональной теории, движется, увязнув всеми колесами, Россия? Ответ на этот вопрос эксперты ищут не первый год. Вряд ли есть одно решение, но, возможно, в этом стране помогут технологии: отечественная математическая школа всегда высоко ценилась во всем мире, да и IT-отрасль в России развита сильнее прочих. Во всяком случае, именно на их развитие делают ставку власти: от направления «Цифровые технологии» нацпроекта «Цифровая экономика» они ждут настоящего прорыва. Впрочем, его успех, по мнению экспертов, будет зависеть от синхронизации процесса цифровой трансформации во всех российских регионах.