[
новости
/
+++
|
форум
|
теги
|
]
TextCat - implementation of the text categorization algorithm
Дата
15 Sep 2004
[
исправить
]
Заголовок
TextCat - implementation of the text categorization algorithm
Пояснение
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
Home URL
http://odur.let.rug.nl/~vannoord/TextCat/
Флаг
russian
Раздел
Полезные Perl модули.
Преобразование из одной кодировки в другую
Ключи
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
<< Предыдущие 15 записей
-
24.07.2022
Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
-
03.07.2022
Выборочное туннелирование сайтов через WireGuard
-
19.05.2022
Настройка шрифтов для консоли и терминала
-
26.02.2022
Тестирование хелловорлда под 17 платформ одним скриптом
-
23.02.2022
Скрипт для конвертации архива gz в lzma
-
06.12.2021
Сравнение методов исключения разработки на JavaScript для веб технологий
-
30.11.2021
Отправка логов из kubernetes в clickhouse
-
03.11.2021
Linux окружение noroot в Android-смартфоне собственными руками.
-
02.11.2021
Борьба с троллингом на opennet.ru при помощи uBlock Origin
-
20.10.2021
Сборка хелловорлда под 17 платформ одним скриптом
-
11.09.2021
Шифрование данных на существующем разделе ext4 без его переформатирования
-
04.08.2021
Прямая отправка заданий на принтер, без использования CUPS и других прослоек
-
19.06.2021
Запуск процесса с совсем-совсем IDLE приоритетом в Linux
-
11.06.2021
Работа с 32- и 64-разрядными chroot на примере Debian
-
13.05.2021
Эксперименты по борьбе с утечками памяти Telegram Desktop
Следующие 15 записей >>
Партнёры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2024 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру