Глоссарий
Основные термины и понятия
А
API (Application Programming Interface)
Программный интерфейс, позволяющий автоматизировать работу с нейросетью через код. Для адвоката: возможность создать собственное приложение, которое отправляет запросы в ИИ без ручного копирования текста.
Анонимизация
Процесс удаления из документа персональных данных (имён, адресов, номеров телефонов) перед загрузкой в облачный ИИ. Обязательна для соблюдения адвокатской тайны.
Б
Batch API
Режим пакетной обработки запросов к ИИ. Позволяет загрузить 100 документов одновременно и получить результат через несколько часов. Дешевле обычного API в два раза, но работает медленнее.
Bias (предвзятость)
Систематическая ошибка ИИ, связанная с перекосами в обучающих данных. Пример: если модель тренировалась на западных юридических текстах, она может плохо понимать российское законодательство.
В
VPS (Virtual Private Server)
Виртуальный сервер, который можно арендовать для установки локального ИИ. Дешевле покупки собственного компьютера, но требует технических навыков настройки.
Верификация
Процесс проверки фактов, сгенерированных ИИ. Обязательна для всех ссылок на судебную практику, статьи законов и статистические данные.
Г
Галлюцинация
Ошибка ИИ, когда он выдумывает несуществующие факты, цитаты или судебные решения. Причина: модель генерирует правдоподобный, но неверный текст. Решение: всегда проверять через первоисточники.
GPU (Graphics Processing Unit)
Графический процессор, необходимый для работы локальных ИИ. Для полноценной модели нужна видеокарта с 24+ ГБ видеопамяти (например, NVIDIA RTX 4090).
Е
Embedding (эмбеддинг)
Числовое представление текста в виде вектора. Используется в технологии RAG для быстрого поиска похожих документов. Для адвоката: чем ближе эмбеддинги двух протоколов, тем более схожи их содержания.
И
Импортозамещение
Использование российских ИИ-сервисов (GigaChat, YandexGPT) вместо зарубежных (ChatGPT, Claude) из-за санкций или требований конфиденциальности.
Инференс (Inference)
Процесс генерации ответа ИИ на основе промпта. Для адвоката: момент, когда вы отправили запрос и получаете текст жалобы.
К
Контекстное окно (Context Window)
Максимальный объём текста, который ИИ может «запомнить» в одной сессии. Измеряется в токенах. Примеры: ChatGPT-4o: 128,000 токенов (~100 страниц); Claude 3.5 Sonnet: 200,000 токенов (~150 страниц); DeepSeek: 64,000 токенов (~50 страниц).
Кастомная модель
ИИ, дообученный на ваших данных (например, на архиве ваших жалоб). Требует значительных ресурсов (время, деньги), но даёт лучшие результаты в узкой специализации.
Л
LLM (Large Language Model)
Большая языковая модель, основа современных нейросетей (GPT, Claude, Llama). Обучена на триллионах слов из интернета и может генерировать текст, отвечать на вопросы, переводить.
Локальный ИИ
Нейросеть, установленная на вашем компьютере/сервере. Плюсы: полная конфиденциальность, нет зависимости от интернета. Минусы: требует мощного железа, сложная настройка.
М
Мультимодальность
Сспособность ИИ работать с разными типами данных: текстом, изображениями, видео, аудио. Пример: Google Gemini анализирует видео с камер наблюдения.
Модерация (Цензура)
Фильтрация запросов и ответов ИИ по этическим/юридическим причинам. Может блокировать законные юридические задачи (анализ дел о наркотиках, насилии). Решение: см. ГЛАВА 15 «Обход цензуры».
Н
Нейросеть
Общий термин для систем машинного обучения, моделирующих работу человеческого мозга. В контексте книги: синоним ИИ, алгоритма, модели.
Нулевое доверие (Zero Trust)
Принцип безопасности, при котором ни одному облачному сервису нельзя доверять конфиденциальные данные без анонимизации. Часть 1.
О
Облачный ИИ
Нейросеть, работающая на серверах компании (OpenAI, Google, Anthropic). Доступ через браузер или API. Плюсы: не требует мощного компьютера. Минусы: данные передаются третьей стороне, зависимость от интернета.
Open-source
Программное обеспечение с открытым исходным кодом. Примеры локальных ИИ: Llama (Meta), Mistral, DeepSeek. Можно модифицировать под свои нужды, но требует технических навыков.
П
Промпт (Prompt)
Текстовая команда, инструкция для ИИ. Качество ответа на 80% зависит от качества промпта. Базовая формула: РКЗФ (Роль + Контекст + Задача + Формат). Пример: «Ты — адвокат [Роль]. Мой клиент обвиняется по ст. 228 УК РФ [Контекст]. Составь жалобу [Задача] объёмом 3 страницы в юридическом стиле [Формат]».
Промпт-инжиниринг (Prompt Engineering)
Искусство составления эффективных промптов. Методы: Chain-of-Thought, Few-shot, Role-playing и др. (см. Часть 2).
Параметр (Parameter)
Единица «знаний» нейросети. Чем больше параметров, тем умнее модель, но и требовательнее к железу. Примеры: GPT-4: ~1.7 триллиона параметров; Claude 3.5 Sonnet: ~200 миллиардов; Llama-3.1—70B: 70 миллиардов.
Р
RAG (Retrieval-Augmented Generation)
Технология подключения внешней базы знаний к ИИ. Как работает: 1) Вы загружаете материалы дела (протоколы, экспертизы) в векторную базу; 2) ИИ ищет релевантные фрагменты по запросу; 3) Генерирует ответ на основе найденных документов, а не из «головы». Преимущество: точность, ссылки на источники. Недостаток: сложная настройка.
С
System Prompt (Системный промпт)
Базовая инструкция, которая задаёт поведение ИИ на всю сессию. Пример: «Ты — опытный адвокат по уголовным делам. Всегда ссылайся на статьи УК РФ и УПК РФ. Пиши сухим юридическим языком». Работает во всех последующих запросах.
Семантический поиск
Поиск по смыслу, а не по ключевым словам. RAG использует семантический поиск: запрос «нарушение процедуры ареста» найдёт документ с фразой «незаконное задержание», даже если точных слов нет.
Т
Токен (Token)
Единица текста для ИИ. Один токен ≈ 0.75 слова (в русском языке) или 4 символа. Примеры: слово «адвокат» = 2 токена; фраза «Уголовный кодекс РФ» = 5 токенов; страница текста (A4, Times New Roman 12pt) ≈ 500–700 токенов. Почему важно: стоимость API считается по токенам (вход + выход). Ограничение контекстного окна тоже в токенах.
Temperature (Температура)
параметр творчества ИИ. Диапазон: 0.0–2.0. Temperature = 0: детерминированный, предсказуемый ответ (для юридических документов); Temperature = 1: баланс креативности и точности (для аналитики); Temperature = 2: максимальная креативность (для мозговых штурмов, не для жалоб!).
Ф
Fine-tuning (Дообучение)
Процесс адаптации базовой модели под конкретную задачу. Для адвоката: обучение GPT-4 на архиве ваших жалоб, чтобы он писал в вашем стиле. Требует: 100+ примеров документов; оплата API (~$10–100 в зависимости от объёма); технические навыки (работа с JSON, Python).
Few-shot Learning
техника промптинга с примерами. Вы показываете ИИ 2—3 образца («шота») выполненной задачи, и он имитирует стиль.
Ч
Chain-of-Thought (CoT)
Техника промптинга, где ИИ «думает вслух», разбивая задачу на шаги. Результат: более точный и аргументированный ответ.
Специфические термины
Анти-фейк протокол
Алгоритм проверки фактов от ИИ (см. ГЛАВА 14). Шаги: 1) Попросить ИИ дать ссылки на источники; 2) Проверить ссылки вручную (открыть в браузере); 3) Если ссылки не работают → запросить альтернативные источники; 4) Перепроверить через независимый поиск (Perplexity, Google).
Адвокат Дьявола (Devil’s Advocate)
Техника промптинга, где ИИ критикует собственную позицию. Промпт: «Теперь выступи на стороне обвинения. Какие слабые места ты видишь в этой жалобе?»
Цифровой бункер
Локальный сервер с ИИ, изолированный от интернета. Максимальная конфиденциальность для работы с делами под адвокатской тайной (см. ГЛАВА 2).
Светофор доступа
Система классификации данных по уровню конфиденциальности (ГЛАВА 1): Зелёный — публичные данные (можно в облако); Жёлтый — условно-конфиденциальные (анонимизация обязательна); Красный — адвокатская тайна (только локальный ИИ).
Сокращения
API — Application Programming Interface
CoT — Chain-of-Thought
GPU — Graphics Processing Unit
LLM — Large Language Model
RAG — Retrieval-Augmented Generation
VPS — Virtual Private Server
УК РФ — Уголовный кодекс Российской Федерации
УПК РФ — Уголовно-процессуальный кодекс Российской Федерации
Примечания
1. Актуальность терминов: Индустрия ИИ развивается быстро. Определения актуальны на январь 2026 года.
2. Упрощения: Некоторые термины упрощены для доступности неспециалистам. Для глубокого понимания рекомендуется техническая документация производителей (OpenAI, Anthropic, Google).
3. Дополнительные ресурсы: Официальный глоссарий OpenAI: platform.openai.com/docs; Документация Anthropic Claude: docs.anthropic.com; Курс по промпт-инжинирингу: learnprompting.org