Russian/English/Estonian/Finnish/Swedish phonetic algorithm based on Soundex and Metaphone
-
Updated
Mar 1, 2025 - Python
Russian/English/Estonian/Finnish/Swedish phonetic algorithm based on Soundex and Metaphone
Python course for 2nd year NLP students at NRU HSE, 2018-2019
NLP Section of the Data Science course, NRU HSE
Python for students in humanities, NRU HSE, 2018-2019
/ru/ConceptNet5.7 Python wrapper
Автоматизирует модерацию резюме на русском языке с помощью LLM. Для модерации используются разные llm модели.
Исследовательский вопрос: можно ли измерить «офисный интеллект» LLM? Попытка — здесь. 100 сценариев, 10 критериев, русский корпоративный контекст.
Превращает архив Telegram-чата в книгу о ваших друзьях. Экспорт → статистика → анализ через Claude → отчёт, после которого все будут спорить, кто там самый «душа компании».
Self-hosted batch LLM pipeline for analyzing customer feedback from Excel. Upload xlsx, describe the task, configure output fields — get structured results. Works with any OpenAI-compatible API and Ollama.
A Claude Code skill that catches Russian-language bugs in code: pluralization, case agreement, terminology drift, transliterated identifiers, language mixing. Complements talkstream/ru-text.
🤖 Build engaging conversations with this intelligent chatbot designed for seamless interactions in English and Russian.
Автоматическое обезличивание персональных данных (ПД) по 152-ФЗ. Готовый MCP-сервер и API для безопасной работы ИИ-агентов, n8n и LLM.
Production-grade Russian multi-class text classifier (GRNTI) - XLM-RoBERTa main, ruBERT baseline, FastAPI serving, HF Hub model.
Minimal RAG example for Russian tax domain: markdown chunker, multilingual-e5 embeddings, ChromaDB
An intelligent chatbot.
Self-hosted Russian PII anonymization gateway for safer AI workflows.
🚀 Production-ready API for detecting toxic comments in Russian text, powered by a lightweight PyTorch CNN model (~5MB).
Open Russian-language sports-domain LLM benchmark — 655 expert questions × 35 sports × top-3 judge ensemble. MIT (code) + Apache 2.0 (data).
Bilingual (RU/EN) PII detection & reversible tokenization — pymorphy3 for Russian names, spaCy for English, regex for formats — with quality benchmarks on pii-bench and pii-external.
Обезличиватель документов для работы с LLM
Add a description, image, and links to the russian-nlp topic page so that developers can more easily learn about it.
To associate your repository with the russian-nlp topic, visit your repo's landing page and select "manage topics."