Содержание

ЗАДАНИЕ НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ4

ОТЗЫВ РУКОВОДИТЕЛЯ5

РЕЦЕНЗИЯ6

ПЕРЕЧЕНЬ ПРИНЯТЫХ СОКРАЩЕНИЙ7

ВВЕДЕНИЕ8

1. АНАЛИЗ СИСТЕМы КЛАССИФИКАЦИИ ИНФОРМАЦИИ11

1.1. Система классификации информации13

1.2. Схема организационной структуры управления информационных и аналитических технологий аппарата администрации Тверской области15

1.2.1. Описание автоматизируемых функций и схемы функциональной структуры АИС «Классификатор»19

1.2.2. Описание постановки задачи22

2. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ23

2.1. Перечень входных данных23

2.2. Перечень выходных данных и документов23

2.3. Описание информационного обеспечения АИС «Классификатор»23

2.3.1. Описание структуры входных информационных сообщений и выходных данных и документов23

2.3.2. Структура информационной части сообщения СМИ24

2.3.3. Основные требования, предъявляемые к подготовке сообщений СМИ в части орфографии25

2.4. Описание организации информационной базы28

2.5. Математическое обеспечение35

2.5.1. Математическая постановка задачи классификации информационных сообщений СМИ35

2.5.2. Описание метода нечеткого поиска38

2.5.3. Описание запросов41

2.5.4. Описание схемы работы системы44

2.6. Техническое обеспечение АИС «классификатор»47

2.6.1. Описание комплекса технических средств47

2.6.2. Инструкция по эксплуатации47

3. ТЕХНИКО-ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ПРОЕКТА50

3.1. Теоретические основы расчетов50

3.2. Расчет экономической эффективности56

ЗАКЛЮЧЕНИЕ61

Приложение 1. Структура входных и выходных документов65

Приложение 2. Текст программы66

Выдержка из текста

ВВЕДЕНИЕ

При современном уровне развития информационных технологий использование компьютера для хранения любых видов информации становится единственным способом, предоставляющим широчайшие возможности по управлению информацией.

В настоящее время идет постоянный и быстрый рост объемов информации. Значительную часть этой информации составляют текстовые данные. В связи с этим встает проблема создания средств доступа к текстовой информации.

Технически существует возможность доступа к значительной части имеющихся текстов, но практически доступна лишь малая часть. Это связано с несовершенством средств доступа. Современные средства поиска, каталогизации, описания текстов не удовлетворяют нарастающим потребностям пользователей. Требуется их развитие в направлении повышения эффективности поиска информации и упрощения взаимодействия с пользователем.

Возможным путем решения проблемы является создание технико-информационных средств описания смысла имеющихся текстов с возможностью дальнейшего осмысленного поиска в массиве текстовой информации. Причем большие и постоянно увеличивающиеся объемы текстовой информации требуют, чтобы такие средства работали в автоматическом режиме.

Наиболее важным направлением автоматизации деятельности предприятий является использование современных информационных технологий для хранения, систематизации и эффективной обработки информации, поступающей из различных источников, а также использования этой информации в целях выработки рекомендаций для принятия управленческих решений.

Проблема использования большого объема накопленных данных является ключевой во многих организациях. Проблема работы с большим количеством информации имеет два аспекта:

•Автоматический сбор информации;

•Автоматический разбор поступившей информации по данной тематике, проведенный на основе анализа текста документа.

В связи с этим, во-первых, появляется задача загрузки информации в систему. Процесс загрузки заключается в занесении данных с носителя информации в хранилище данных. Поставляющие информацию оперативные системы далеко не всегда обладают достаточным уровнем качества данных, поэтому процесс загрузки этих данных в хранилище не ограничивается простым копированием, а включает в себя очистку, согласование и контроль качества. Хранилища данных загружают и постоянно обновляют огромные объемы данных из различных источников, поэтому вероятность попадания в них «грязных данных» весьма высока. Поэтому появляется проблема поиска и выборки необходимой информации из больших массивов текстовых данных.

Эффективность поиска в большом информационном массиве существенно повысится, если его разбить на части по некоторому критерию, связанному с целями поиска. Следовательно, во-вторых, появляется проблема классификации сообщений. Для решения задачи анализа текстовой информации и последующего автоматического распределения ее по требуемым тематикам необходимо в первую очередь сформировать рубрикатор, то есть задать список рубрик и словарь, наиболее точно характеризующие исследуемую область знаний. Классификация документов позволяет сузить область поиска и не только увеличить его скорость, но и значительно повысить точность результатов. Поэтому технологии автоматической классификации документов отводится важное место в системах управления электронным документооборотом.

Суть задачи классификации состоит в автоматическом распределении поступающих в систему документов в зависимости от их типа и содержания по рубрикам.

В настоящее время в структуре областной исполнительной власти ответственность за поддержание информационного тонуса в регионе возложена на управление информационных и аналитических технологий аппарата администрации Тверской области (УИАТ ТО), одной из задач которого является создание условий для удовлетворения информационных потребностей органов власти, населения.

Список использованной литературы

1.ГОСТ 2.105-95. ЕСКД. Общие требования к текстовым документам.

2.ГОСТ Р50.1.028-2001. Методология функционального моделирования.

3.ГОСТ 28195-89. Оценка качества программных средств.

4.ГОСТ 19.102-77.ЕСПД. Стадии разработки.

5.ГОСТ 19.402-78.ЕСПД. Описание программы.

6.ГОСТ 12.1.005-88 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.

7.ГОСТ 19.701-90 Схемы алгоритмов, программ, данных и систем.

8.ГОСТ 34.201-89 Информационная технология. Виды, комплектность и обозначение документов при создании автоматизированных систем.

9.ГОСТ 34.602-89 Информационная технология. Техническое задание на создание автоматизированной системы.

10.СанПиН 2.2.2/2.4.1340-03 Гигиенические требования к персональным электронно-вычислительным машинам и организации работы.

11. Р.2.2.2006-05 Гигиенические критерии оценки условий труда по показателям вредности и опасности окружающей среды, тяжести и напряженности трудового процесса.

12.СанПиН 2.2.548-96 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.

13.Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. – М.: Финансы и статистика, 2004. – 424 с.: ил.

14.Базы данных в Delphi 7. Самоучитель/ В. Понамарев. – СПб.: Питер, 2003. – 224 с.: ил.

15.Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. пособие. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. – 304 с.: ил.

16.Бобровский С.И. Delphi 7. Учебный курс.– СПб.: Питер, 2003. – 736с.

17.Глушаков С.В., Клевцов А.Л. Программирование в среде Delphi 7. – Харьков: Фолио, 2003. – 528с.

18.Гофман В.Э., Хомоненко А.Д. Работа с базами данных в Delphi / В. — 2-е изд. – СПб.: БХВ – Петербург, 2002. – 624с.: ил.

19.Девятков В.В. Системы искусственного интеллекта: Учеб. пособие для вузов. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. – 352 с.: ил.

20.Диго С.М. Проектирование баз данных: Учебник. – М.: Финансы и статистика, 1988. – 216с.

21.Дубнов П.Ю. Access 2000: Программирование баз данных. – М.: ДМК, 2000. – 272с.: ил.

22.Пономарев В. Базы данных в Delphi 7: Самоучитель. – М. и др.: Питер, 2003. – 224с.: ил.

23.Средства защиты в машиностроении: Расчет и проектирование: Справочник/С.В. Белов, А.Ф. Козьяков, О.Ф. Партолин и др.; Под ред. С.В. Белова. – М.: Машиностроение, 1989. – 368 с.: ил.

24.Типовые нормы времени на программирование задач для ЭВМ. – М.: Экономика, 1989.

25.http://google.ru/com/str.zip

26.http://google.ru//narod.ru/Hem/infon.zip

Похожие записи