Пример готовой дипломной работы по предмету: Информационные технологии
Содержание
Введение 5
1 Цели, задачи и алгоритмы сравнения текстов 7
1.1 Цели, задачи и методы сравнения текстов 7
1.2 Обзор и анализ алгоритмов сравнения текстов 12
2 Обзор программных средств 27
2.1 Среда разработки и язык программирования 27
2.3 Классы 33
2.4 Пространство имен System.IO 38
3 Программная реализация анализа подобия текстов 44
3.1 Постановка задачи на дипломное проектирование 44
3.2 Обобщенный алгоритм программы 44
3.3 Векторы сравниваемых текстов 45
3.4 Пользовательские классы и массивы 48
3.5 Выбор текстов, подсчет частот и TF-мер 49
3.6 Создание единого массива терминов, частот и мер двух текстов 51
3.7 Вычисление меры сходства текстов 52
3.8 Тестирование и отладка программы 55
4 Информационная безопасность 59
4.1 Законодательство в сфере информационной безопасности 59
4.2 Оценка рисков информационной системы предприятия 64
4.3 Анализ рисков и уязвомостей системы 66
4.4 Разработка мер безопасности и оценка рисков после их внедрения 69
5 Экономическая часть 72
5.1 Расход трудоемкости разработки программного продукта 72
5.2 Расход на оплату труда разработчика программы 74
5.3 Общие затраты на создание программного продукта 75
5.4 Целесообразность создания продукта 75
Выводы и рекомендации 77
Библиографический список 78
Приложение А. 81
Выдержка из текста
Задача определения тематической схожести также актуальна, существует и постоянно увеличивается, в связи с актуальностью задачи, количество и качество сервисов, реализующих сравнение текстов по различным крите-риям.
Сервис сравнения схожести текстов – необходимый и полезный инст-румент для определения идентичности или похожести текстов. Например, рерайтер или его заказчик хочет убедиться, что его ресурс не будет наказан поисковыми машинами за копирование текста понижением в выдаче, сравнив оригинальный и переписанный текст.
Не менее актуальна задача и для поисковых машин, которые не любят одинаковые или похожие страницы – тем не менее, несмотря на постоянную борьбу с ними, приходится признать, что судя по результатам работы даже лучших поисковиков, проблема эта далеко не решена.
Список использованной литературы
Были использованы материалы статей по методам обработки и сравнения текстов, а также собственные методические материалы по данной теме. Также использовались книги по программированию на языке С#. Различные определения взяты из Википедии.
Библиографический список
1. Мешкова Е.В. Анализ современных методов обработки текстовой ин-формации для автоматической классификации документов / Информационные системы и технологии. Теория и практика: cб. науч. тр. / редкол.: А.Н. Береза [и др.].
– Шахты: ГОУ ВПО «ЮРГУЭС», 2009. – 210 с.
2. Лексин В. Рекомендательная система: полезные задачи текстмайнинга [Электронный ресурс]: Хабрахабр. Блог компании Surfingbird, 2013. URL: http://www.habrahabr.ru.
3. Лексин В. Рекомендательная система: введение в проблему холодного старта [Электронный ресурс]: Хабрахабр. Блог компании Surfingbird, 2013. URL: http://www.habrahabr.ru.
7. Родненко В. Python: Алгоритм Шинглов – поиск нечетких дубликатов текста [Электронный ресурс]:Code is art, 19.01.2009. URL: http://www.codeisart.ru/
8. Fetterly et al. A Large-Scale Study of the Evolution of Web Pages, Addison-
Wesley, Massachusetts, 2003.
9. Лексин В. Поиск нечетких дубликатов. Алгоритм шинглов для веб-документов. [Электронный ресурс]: Хабрахабр. Блог компании Surfingbird, 2013. URL: http://www.habrahabr.ru.
10. Мешкова Е.В. Методические указания по выполнению курсовой работы по дисциплине «Методы и средства обработки информации в глобальных компьютерных сетях» [Электронная версия], ВИС ЮРГУЭС,2011
11. Попов А. Поиск в Интернете, внутри и снаружи [Электронный ресурс]: Корабли в бутылках, 2005. URL: http://www.shipbottle.ru
12. Латентное размещение Дирихле (LDA) [Электронный ресурс]: Википедия, 2011. URL: wikihttp://ru.wikipedia.org/wiki
13. Лексин В. Холодный старт для веб-страниц [Электронный ресурс]: Хабрахабр. Блог компании Surfingbird, 2013. URL: http://www.habrahabr.ru.
14. Латентно-семантический анализ (ЛСА) [Электронный ресурс]: Вики-педия, 2011. URL: wikihttp://ru.wikipedia.org/wiki
15. Readings in Latent Semantic Analysis for Cognitive Science and Education [Электронный ресурс]: Сборник статей и публикаций по ЛСА, 2012. URL: http://www.timc.imag.fr/Benoit.Lemaire/lsa.html
16. Шилдгт Г. Полное руководство по С# — 2-e изд., М.:Вильямс, 2010, -1024 с.
17. Флёнов М.Е. Библия С# — 2-е изд., перераб.и доп. – СПб.,БХВ-Петербург, 2011. – 560 с.
18. К.Уотсон, К. Нейгел, Я. Хю Педерсен, Д. Д. Рид, М. Скиннер, Э. Уайт. Visual C# 2008: базовый курс: изд-во "Диалектика", 2009.
19. Эндрю Троелсен. Язык программирования C# 2010 и платформа .NET 4 – 2011.