Данный проект создан в рамках тестового задания от компании SimbirSoft для отбора на осенний интенсив по треку Backend на C#. Задание: написать приложение, которое позволяет скачивать произвольную HTML-страницу посредством HTTP-запроса на жесткий диск компьютера и выдает статистику по количеству уникальных слов в консоль. Описание задачи:
- В качестве входных данных в приложение принимает строку с адресом web-страницы. Пример входной строки: https://www.simbirsoft.com/
- Приложение разбивает текст страницы на отдельные слова с помощью списка разделителей. Пример списка: {' ', ',', '.', '! ', '?','"', ';', ':', '[', ']', '(', ')', '\n', '\r', '\t'}
- В качестве результата работы пользователь должен получить статистику по количеству уникальных слов в тексте. Пример: РАЗРАБОТКА -1 ПРОГРАММНОГО - 2 ОБЕСПЕЧЕНИЯ - 4
- Приложение должно быть реализовано с помощью стандартных классов(не стоит добавлять собственные реализации списков, словарей и т.п.)
- Приложение написано в соответствии с принципами ООП
- Приложение написано на языке выбранного направления (Java, C#, Golang) Проект:
- Приложение состовит из 3-х классов. 1.1 Класс Save_html_page скачивает на рабочий стол web-страницу с разрешением html. 1.2 Класс Working_with_save_html_file считывает скачанный предыдущим классом файл, удаляет теги разметки, выводит уникальные слова и их количество повторений в консоль. 1.3 Класс DateBase создает в базе данных Access новую таблицу и вносит туда уникальные слова с их количество повторений. Либо обновляет данные, если таблица для данной ссылки уже создана.