Система корпоративного электронного архива
В рамках отрасли или корпорации речь идет даже не о традиционной автоматизации каталогов библиотек, а о построении интегрированной системы глобального масштаба, обеспечивающей эффективный доступ и хранение огромных объемов документов в электронном виде. Причем, технология должна включать как средства создания/наполнения супербанка данных, так и средства обеспечения его должного функционирования… Читать ещё >
Система корпоративного электронного архива (реферат, курсовая, диплом, контрольная)
В рамках отрасли или корпорации речь идет даже не о традиционной автоматизации каталогов библиотек, а о построении интегрированной системы глобального масштаба, обеспечивающей эффективный доступ и хранение огромных объемов документов в электронном виде. Причем, технология должна включать как средства создания/наполнения супербанка данных, так и средства обеспечения его должного функционирования и развития. Однако, если потребность в такой технологии назрела уже много лет назад, то техническая возможность ее реализации появилась относительно недавно, как следствие появления дешевых носителей, повышение эффективности высокоскоростных вычислительных систем и сетей, новые информационные технологии индексирования сверхбольших массивов данных, наметилось направление внедрения средств искусственного интеллекта, позволяющих моделировать и анализировать большие массивы информации.
Общую идею можно обрисовать следующим образом. Организуется развертывание высокопроизводительной сети, включающей графические рабочие станции и мощные серверы ввода и обработки информации. Для ввода документов с бумажных носителей низкого качества, используются промышленные сканеры потокового ввода. Система корпоративного архива не накладывает никаких ограничений на формат документов, предусматривает обработку разнородных документов, хранение в одном архиве информации различного типа (например, технической документации, финансовых отчетов, документов и т. д.).
Основные преимущества системы заключаются в полной автоматизации следующих операций:
получение электронного образа документа (сканирование);
распознавание текста изображения документа (OCR — распознавание);
морфологического анализа (нормализация) текста документа;
полнотекстового индексирования текстовой информации в документе;
классификации, аннотирования и создания регистрационной карточки документа;
поиска и выборки электронного образа документа по значению его регистрационных атрибутов либо по текстовому содержанию.
Участие оператора требуется только на этапах формирования атрибутов и получения текста документа при использовании OCR — распознавания, если требуется редакторская правка распознанного текста. Выбор операций для конкретной реализации системы зависит от технологической цепочки при работе с разными типами документов.
Предлагаемая система предоставляет также дополнительные возможности:
разграничение доступа пользователей к документам на основе механизма привилегий;
ручное задание атрибутов документа в процессе его регистрации в системе.
Система обеспечивает эффективное индексирование и полнотекстовый поиск информации большого объема. Данные, необходимые для поиска документов, хранятся в высокопроизводительной и отказоустойчивой системе памяти, а графические образы документов — в виде изображений на носителях, характеризуемых длительным временем хранения и дешевизной. Специфическая черта корпоративного электронного архива — обеспечение полнотекстового поиска. Построение и поддержка системы атрибутивного поиска, характерного для систем управления документооборотом, оказывается неприемлемым вследствие временных и стоимостных ограничений.
С учетом того, что большинство архивных документов, практически, не подлежат модификации и удалению, библиотеки на компакт-дисках могут быть предпочтительнее. Кроме того, компакт-диски удобнее в работе: их автономное чтение можно осуществлять на любом компьютере, комплектуемом приводом CD-ROM.
В целом, хранение документов в электронной форме позволяет не только кардинально ускорить поиск необходимой информации, но и в случае больших объемов документооборота значительно сократить стоимость хранения за счет сокращения занимаемых документами площадей.