Слайды

HTML

Примеры

zip

Домашнее задание 12. Статистика текста

Статистика текста
  1. Создайте приложение TextStatistics, анализирующее тексты на различных языках.
    1. Аргументы командной строки:
      TextStatistics <локаль текста> <локаль вывода> <файл с текстом> <файл отчета>
    2. Поддерживаемые локали текста: все локали, имеющиеся в системе.
    3. Поддерживаемые локали вывода: русская и английская,
    4. Файлы имеют кодировку UTF-8.
    5. Подсчет статистики должен вестись по следующим категориям:
      • предложения
      • строки
      • слова
      • числа
      • деньги
      • даты
    6. Для каждой категории должна собираться следующая статистика:
      • число вхождений
      • число различных значений
      • минимальное значение
      • максимальное значение
      • минимальная длина
      • максимальная длина
      • среднее значение/длина
    7. Отчет должен выводиться в формате HTML.
    8. Пример отчета:

      Анализируемый файл: input.txt

      Сводная статистика

      Число предложений: 38

      Число строк: 41

      Статистика по словам

      Число слов: 153 (95 уникальных)

      Минимальное слово: HTML

      Максимальное слово: языках

      Минимальная длина слова: 1 (и)

      Максимальная длина слова: 14 (Поддерживаемые)

      Средняя длина слова: 10

      Статистика по …

  2. При выполнении задания следует обратить внимание на:
    1. Декомпозицию сообщений для локализации
    2. Согласование предложений