[
новости
/
+++
|
форум
|
теги
|
]
TextCat - implementation of the text categorization algorithm
Дата
15 Sep 2004
[
исправить
]
Заголовок
TextCat - implementation of the text categorization algorithm
Пояснение
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
Home URL
http://odur.let.rug.nl/~vannoord/TextCat/
Флаг
russian
Раздел
Полезные Perl модули.
Преобразование из одной кодировки в другую
Ключи
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
<< Предыдущие 15 записей
-
05.01.2020
Решение проблемы с зависанием графической подсистемы на компьютерах с APU AMD
-
04.01.2020
Проверка правописания в Telegram Desktop для Linux
-
03.01.2020
Простое устройство для защиты данных в случае кражи ноутбука
-
18.11.2019
Обход блокировки сотовыми операторами использования смартфона в качестве точки доступа
-
09.09.2019
Включение DNS-over-HTTPS в Chrome
-
01.09.2019
Улучшение безопасности sources.list в дистрибутивах, использующих APT
-
28.08.2019
Сравнение работающих в пространстве пользователя обработчиков нехватки памяти
-
27.08.2019
Изменение скорости движения указателя мыши через xinput
-
23.08.2019
Установка Anbox для запуска Android-приложений в Fedora 30
-
02.07.2019
Прокси сервер Squid c E2guardian и Clamav
-
07.05.2019
Монтирование корневой ФС в RO-режиме при загрузке в свежих версиях Fedora
-
12.04.2019
Обход проблем при расширении хранилища ZFS в Linux
-
03.04.2019
Объединение томов через aufs для отказоустойчивости и моментального восстановления
-
31.03.2019
vmhgfs в старых CentOS и RHEL
-
30.03.2019
Связывание повторяемых сборок GNU Guix с архивом исходных текстов Software Heritage
Следующие 15 записей >>
Партнёры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2024 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру