Содержание
- Локали
- Локализация данных
- Создание ResourceBundle
- Загрузка ResourceBundle
- Использование ResourceBundle
- Форматирование
- Форматирование чисел
- Форматирование дат и времени
- Форматирование сообщений
- Работа с текстом
- Сравнение строк
- Разбиение текста
- Запись текста
Примеры
zipДомашнее задание 13. Статистика текста
-
Создайте приложение
TextStatistics
, анализирующее тексты на различных языках.-
Аргументы командной строки:
- локаль текста,
- локаль вывода,
- файл с текстом,
- файл отчета.
- Поддерживаемые локали текста: все локали, имеющиеся в системе.
- Поддерживаемые локали вывода: русская и английская.
- Файлы имеют кодировку UTF-8.
-
Подсчет статистики должен вестись по следующим категориям:
- предложения,
- слова,
- числа,
- деньги,
- даты.
-
Для каждой категории должна собираться следующая статистика:
- число вхождений,
- число различных значений,
- минимальное значение,
- максимальное значение,
- минимальная длина,
- максимальная длина,
- среднее значение/длина.
-
Пример отчета:
Анализируемый файл "input.txt". Сводная статистика Число предложений: 30. Число слов: 117. Число чисел: 37. Число сумм: 3. Число дат: 3. Статистика по предложениям Число предложений: 30 (30 различных). Минимальное предложение: "Анализируемый файл "input.txt".". Максимальное предложение: "Число чисел: 37.". Минимальная длина предложения: 13 ("Число дат: 3."). Максимальная длина предложения: 109 ("GK: если сюда поставить реальное предложение, то процесс не сойдётся"). Средняя длина предложения: 37,333. Статистика по словам Число слов: 117 (48 различных). Минимальное слово: "GK". Максимальное слово: "языках". Минимальная длина слова: 1 ("с"). Максимальная длина слова: 15 ("стабилизировать"). Средняя длина слова: 6,641. Статистика по числам Число чисел: 37 (22 различных). Минимальное число: -12345,67. Максимальное число: 12345,67. Среднее число: 208,847. Статистика по суммам денег Число сумм: 3 (3 различных). Минимальная сумма: 100,00 ₽. Максимальная сумма: 345,67 ₽. Средняя сумма: 222,83 ₽. Статистика по датам Число дат: 3 (3 различных). Минимальная дата: 17 мая 2024 г.. Максимальная дата: 30 мая 2024 г.. Средняя дата: 23 мая 2024 г..
-
Аргументы командной строки:
- Вы можете рассчитывать на то, что весь текст помещается в память.
-
При выполнении задания следует обратить внимание на:
- Декомпозицию сообщений для локализации.
- Согласование сообщений по роду и числу.
- Напишите тесты, проверяющие вышеуказанное поведение приложения.
-
Приложение и тесты должны находится в пакете
info.kgeorgiy.ja.*.i18n
и его подпакетах.