ALFER V1 // ALPHA
SPRINT 1 — SECURITY & HARDENING
ЛОКАЛЬНЫЙ AI-АССИСТЕНТ

Не чат с моделью.
Архитектура вокруг неё.

Alfer работает на вашем компьютере. Внутри — orchestrator, который решает кто обрабатывает запрос. Policy engine, который проверяет каждое действие до выполнения. Память, разделённая на типы. Audit и evaluation в ядре.

Четыре слоя

Alfer строится не как обёртка над моделью, а как управляемая агентная система. Это значит что между запросом пользователя и ответом модели работает несколько контролируемых слоёв.

01
Orchestrator
Решает кто обрабатывает запрос. Чат, память, инструмент, realtime-данные или классификатор безопасности. Запрос проходит через единую точку с явной маршрутизацией.
02
Policy engine
Проверяет каждое действие модели до выполнения. Не задним числом через логи, а перед запуском. Risk classifier, permission manager, path guard.
03
Память по типам
Не одним свалочным логом. История, сжатые сводки, факты о пользователе, знания через RAG. У каждого типа свой механизм извлечения.
04
Audit и evaluation
Каждое действие пишется в журнал. Каждый ответ проходит через слой проверки качества. Не доверие, а контроль.
АНАЛОГИЯ

Ollama это двигатель. LM Studio салон с приборной панелью.

Open WebUI приборная панель с подключаемыми гаджетами.

Alfer это система управления автомобилем целиком. Проверка маршрута, контроль действий, журнал поездки, правила безопасности.

Под капотом

backend
Python 3.11, FastAPI, SQLAlchemy
хранилище
SQLite, локальное, на машине пользователя
runtime моделей
сейчас Ollama, далее любой провайдер
платформа
Windows, далее Linux и Mac
интерфейс
REST API, далее сайт, Telegram, десктоп, мобильный
realtime
5 провайдеров: погода, курсы, крипта, новости, время
тестов
~186, изолированная БД, eval-датасет на 9 категорий

Где мы сейчас

Альфа-тест в июне 2026. Дата ориентировочная, может сдвинуться на 1-2 недели если потребуется качество. После альфы — стабилизация и переход к фазе 2 (собственные обучающие наборы, fine-tuning, векторный RAG).

Этапы 0–6
Ядро готово Backend, orchestrator, handlers, память, policy engine, tools, audit, evaluation. Realtime-слой через LLM-экстрактор и 5 провайдеров.
Sprint 1 — Сейчас
Security & Hardening Language Guard, Malware Classifier, Pre-input Classifier, Anti-Injection. Закрываем критические бреши до выхода на широкую аудиторию.
Sprint 2
Стабильность и тесты Покрытие 70%+, структурированное логирование, реальные healthchecks, метрики, API-key защита.
Sprint 3
Config Engine v1 Управление поведением через подписанные конфиги. Подготовка к B2B-сценариям.
Sprint 4
mini-RAG v1 Knowledge Store, TF-IDF поиск, инжект в промпт. Векторный RAG будет в Phase 2.
Sprint 5
Telegram-бот и Session Capabilities Первый внешний интерфейс. Параллельно с другими спринтами.