AI-система распознавания путевых листов - Коммерческое предложение

Цель проекта

Автоматизация распознавания рукописных путевых листов с проверкой корректности данных

Текущая ситуация

Рукописное заполнение: 124 водителя заполняют путевые листы от руки с разным почерком
Долгая обработка: Диспетчеры тратят 3-4 часа в день на разбор почерка и перенос данных
Большой объем: 30-40 путевых листов ежедневно + чеки на заправку
Ошибки водителей: Водители неправильно считают пробег (разница показаний спидометра)
Постоянные уточнения: Нужно связываться с водителями, чтобы уточнить непонятные записи
Ручная выгрузка: Все данные нужно вручную переносить в Excel

Что получите

Автоматическое распознавание: Система сканирует путевые листы любого почерка и извлекает данные
Распознавание чеков: Автоматическое считывание сумм и литров заправки
Проверка корректности: Система автоматически вычисляет пробег и сверяет с данными водителя
Алерты об ошибках: Оператор сразу видит расхождения для проверки
Экономия времени: 30-40 листов обрабатываются за минуты вместо 3-4 часов
Выгрузка в Excel: Одним нажатием все данные выгружаются в таблицу
Хранение данных: Все сканы и распознанные данные хранятся 6-12 месяцев

Схема работы системы

1. Сканирование документов

Загрузка: Оператор сканирует пачку путевых листов (30-40 шт) и чеков. Файлы загружаются в веб-интерфейс системы простым перетаскиванием.

2. AI-распознавание рукописного текста

OCR-обработка: Система распознает рукописный текст с путевых листов любого почерка. Извлекаются: показания спидометра (начало/конец), пробег, данные заправки, маршрут, данные водителя.

3. Распознавание чеков

Чеки АЗС: Система автоматически считывает данные с чеков заправки: сумма, литры, дата. Данные сопоставляются с путевым листом водителя.

4. Автоматическая проверка корректности

Валидация данных: Система вычитает конечный показатель спидометра минус начальный и сравнивает с тем, что вписал водитель. При расхождении система выделяет ошибку красным алертом.

5. Проверка оператором

Визуальный контроль: Оператор видит все распознанные данные в удобном интерфейсе. Система подсвечивает поля с низкой уверенностью распознавания (60-70%) и расхождения в расчетах. Оператор проверяет визуально и корректирует при необходимости.

6. Выгрузка в Excel и хранение

Экспорт данных: После проверки оператор нажимает кнопку, и все данные выгружаются в Excel. Сканы и распознанные данные автоматически сохраняются в системе на 6-12 месяцев для возможности возврата к ним.

Варианты реализации распознавания

Мы предлагаем три варианта реализации модуля распознавания рукописного текста с различным соотношением качества, безопасности и стоимости

Вариант 1: Google Gemini 2.5 Pro

Вариант 2: Яндекс OCR

1.5 ₽ / страница

Характеристики:

Качество распознавания: 50-60% на рукописном тексте
Низкая стоимость обработки
Российский сервис (нет рисков трансграничной передачи)
Быстрое внедрение
Потребуется больше ручной корректировки операторами

Операционные расходы:
≈ 1 800 ₽/месяц
при обработке 40 листов/день

Вариант 3: Qwen3 VL (закрытый контур)

Максимальная безопасность

Сервер 110 000 ₽/мес

Характеристики:

Качество распознавания: 85-90% как у Gemini
Полная конфиденциальность (данные не покидают ваш сервер)
Можно дообучить на ваших данных для повышения точности
Нет рисков трансграничной передачи
Неограниченная обработка без платы за страницу
Требуется мощный выделенный сервер

Операционные расходы:
110 000 ₽/месяц
аренда сервера (неограниченная обработка)

Ключевые модули системы

1. Загрузка и управление документами

Web-интерфейс для загрузки отсканированных документов
Поддержка пакетной загрузки (перетаскивание файлов)
Автоматическое разделение многостраничных сканов на отдельные путевые листы
Привязка чеков к соответствующим путевым листам
Статус обработки каждого документа (загружен → обрабатывается → готов к проверке → подтвержден)

2. AI-модуль распознавания

Интеллектуальное извлечение данных:

Распознавание рукописного текста с различным качеством почерка
Извлечение структурированных данных из путевого листа: показания спидометра (начало/конец), пробег, маршрут, данные о водителе, информация о доставке
Распознавание чеков заправки: сумма, литры, дата и время
Определение уровня уверенности для каждого распознанного поля
Подсветка полей с низкой уверенностью распознавания

3. Модуль проверки корректности

Автоматическая валидация данных:

Проверка пробега: Система вычитает начальный спидометр из конечного и сравнивает с указанным водителем пробегом
Сверка заправки: Сравнение данных из чеков с записями в путевом листе
Алерты для оператора: Подсветка расхождений и потенциальных ошибок
Логика проверки: Настраиваемые правила валидации (допустимое отклонение, критические ошибки)

4. Интерфейс оператора

Удобная работа с данными:

Список всех сканов: После распознавания выводится список всех путевых листов
Цветовая маркировка: Плохо распознанные листы (низкая уверенность или ошибки) выделяются цветом в списке
Детальный просмотр: Клик по строке открывает скан рядом с распознанными данными
Редактирование: Быстрая корректировка полей прямо в интерфейсе
Снятие маркировки: После редактирования и подтверждения строчка перестает выделяться цветом
Экспорт в Excel: Выгрузка всех данных в структурированном виде одним нажатием

5. Хранение данных и архив

Хранение всех выгрузок: Каждая выгрузка сохраняется как отдельная запись с датой и временем
Просмотр сканов: Для каждого путевого листа доступен просмотр оригинального скана
Просмотр распознанных данных: Все извлеченные данные сохранены и доступны для просмотра
Поиск и фильтры: Быстрый поиск по дате, водителю, номеру маршрута
Период хранения: Все данные хранятся 6-12 месяцев (настраивается)
Повторная выгрузка: Можно заново выгрузить любые старые данные в Excel

Этапы разработки и стоимость

Этап 1: Аудит и проектирование системы (7 дней) - 100 000 ₽

Задача: Детальный анализ текущих процессов и проектирование архитектуры системы.

Аудит процессов: Изучение текущего workflow обработки путевых листов
Анализ документов: Получение и изучение 20-30 реальных путевых листов с различным качеством заполнения
Проектирование архитектуры: Разработка технической архитектуры и структуры базы данных
Проектирование интерфейса: Создание прототипов экранов для оператора
Формирование ТЗ: Детальное техническое задание с критериями приемки

→ Критерий приемки: Техническое задание + прототипы интерфейсов

Этап 2: Разработка ядра системы и модуля распознавания

Задача: Создание backend, базы данных и интеграция с AI для распознавания.

Вариант A: Интеграция с облачным OCR (Gemini / Яндекс OCR)

21 день - 200 000 ₽

Backend-разработка: Python + FastAPI для обработки запросов
База данных: PostgreSQL для хранения документов и распознанных данных
Интеграция с облачным API: Подключение к Gemini или Яндекс OCR через готовый API
Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
Модуль загрузки: API для загрузки и обработки сканов
Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
Распознавание чеков: Извлечение данных о заправке
Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)

Вариант B: Развертывание Qwen3 VL в закрытом контуре

42 дня - 700 000 ₽

Backend-разработка: Python + FastAPI для обработки запросов
База данных: PostgreSQL для хранения документов и распознанных данных
Развертывание модели Qwen3 VL: Установка и настройка модели на выделенном сервере
Обертка модели в API: Создание собственного API-сервиса для работы с моделью
Оптимизация производительности: Настройка батчинга и кеширования запросов
Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
Модуль загрузки: API для загрузки и обработки сканов
Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
Распознавание чеков: Извлечение данных о заправке
Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)

→ Критерий приемки: Работающий backend + API для загрузки документов + распознавание путевых листов и чеков + валидация данных

Этап 3: Web-интерфейс оператора (28 дней) - 400 000 ₽

Задача: Создание удобного интерфейса для работы операторов с распознанными данными.

Frontend-разработка: Vue.js 3 для административной панели
Загрузка документов: Интерфейс загрузки с drag-and-drop, пакетная загрузка
Список сканов с маркировкой: Визуальное выделение плохо распознанных листов
Просмотр и редактирование: Экран проверки данных со сканом рядом с распознанным текстом
Цветовая индикация: Подсветка полей по уровню уверенности распознавания
Редактирование данных: Быстрая корректировка полей прямо в интерфейсе
Экспорт в Excel: Кнопка выгрузки подтвержденных данных
История и архив: Просмотр обработанных документов и выгрузок

→ Критерий приемки: Полнофункциональный web-интерфейс с загрузкой, проверкой, редактированием и выгрузкой данных

Этап 4: Система хранения данных и архив (21 день) - 350 000 ₽

Задача: Разработка backend-системы хранения, архивации и работы с историческими данными.

Расширение БД: Создание таблиц для хранения истории выгрузок, сканов и распознанных данных
API хранения: REST API для сохранения выгрузок с метаданными (дата, время, оператор)
Файловое хранилище: Организация хранения оригинальных сканов на сервере с индексацией
API поиска: Реализация поисковых запросов по дате, водителю, номеру маршрута
Механизм TTL: Настройка автоматического удаления данных по истечении срока хранения (6-12 месяцев)
API повторной выгрузки: Функционал генерации Excel из архивных данных
Frontend истории: Интерфейс просмотра архива и истории обработанных документов

→ Критерий приемки: Работающая система хранения с API поиска, просмотра и повторной выгрузки данных

Этап 5: Тестирование, развертывание и обучение

Задача: Финальное тестирование, развертывание на сервере и обучение персонала.

Вариант A: 14 дней - 150 000 ₽

Вариант B: 35 дней - 350 000 ₽

*Дополнительное время на тестирование и калибровку локальной модели

Тестирование на реальных данных: Обработка 50+ реальных путевых листов из вашего архива
Калибровка промптов: Точная настройка распознавания под ваши документы
Настройка правил валидации: Адаптация логики проверки под ваши требования
Развертывание на сервере: Установка системы на вашем сервере или облаке
Передача кода: Git-репозиторий с полным исходным кодом
Техническая документация: Инструкции по развертыванию и администрированию
Обучение операторов: 2-часовой онлайн-воркшоп для персонала
Руководство пользователя: Пошаговые инструкции для операторов

→ Критерий приемки: Система развернута + протестирована на реальных данных + персонал обучен + передана документация

*Общий срок разработки:
Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)

Финансовые детали

Стоимость разработки

Предоплата перед началом каждого этапа:

Вариант A: с облачным OCR (Gemini / Яндекс)

100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
200 000 ₽ — перед началом Этапа 2 (Ядро системы и распознавание - 21 день)
400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
150 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 14 дней)

Итого: 1 200 000 ₽ | 91 день

Вариант B: с Qwen3 VL в закрытом контуре

100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
700 000 ₽ — перед началом Этапа 2 (Развертывание модели и распознавание - 42 дня)
400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
350 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 35 дней)

Итого: 1 900 000 ₽ | 133 дня

*Работа на этапе начинается после поступления оплаты. Критерии приемки каждого этапа фиксируются в договоре.

Операционные расходы (зависят от выбранного варианта OCR)

Вариант 1: Google Gemini 2.5 Pro

Сервер Linux: 5 000 ₽/месяц
Google Gemini API: ≈ 6 000 ₽/месяц (40 листов/день)
Итого: 11 000 ₽/месяц

Вариант 2: Яндекс OCR

Сервер Linux: 5 000 ₽/месяц
Яндекс OCR: ≈ 1 800 ₽/месяц (40 листов/день)
Итого: 6 800 ₽/месяц

Вариант 3: Qwen3 VL (закрытый контур)

Выделенный сервер: 110 000 ₽/месяц
Итого: 110 000 ₽/месяц

*Стоимость разработки не зависит от выбранного варианта OCR. Различаются только операционные расходы.

Гарантии и поддержка

Гарантийный срок: 90 дней с даты сдачи системы
Безвозмездное устранение ошибок в гарантийный период
Передача полного исходного кода в ваш Git-репозиторий
Docker-контейнеры для развертывания
Полная техническая документация
Обучение персонала (2-часовой воркшоп)
Руководство пользователя для операторов

Экономический эффект

Экономия времени операторов:

Текущие затраты: 3-4 часа ежедневно на ручной ввод данных
После внедрения: 30-60 минут на проверку и корректировку
Экономия времени: 2.5-3.5 часа в день

Дополнительные выгоды:

Сокращение количества ошибок при вводе данных
Автоматическая проверка корректности пробега
Быстрый доступ к историческим данным
Освобождение операторов для более важных задач

Передача результатов работ

Исходный код и развертывание

Полный исходный код в ваш Git-репозиторий
Подробные инструкции по развертыванию (README)
Docker-compose для быстрого развертывания
Комментированный код по стандартам

Документация и обучение

Техническая документация (архитектура, схемы БД, API)
Руководство администратора
Руководство пользователя для операторов
2-часовой онлайн-воркшоп для персонала

Временные рамки

Общая продолжительность разработки:

Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)

Этап 1 (7 дней)

Аудит и проектирование: Анализ процессов + анализ документов + проектирование архитектуры + прототипы интерфейсов

Этап 2А (21 день) / Этап 2B (42 дня)

Ядро системы: Backend + база данных + интеграция с AI (облачный API или локальная модель) + распознавание + валидация

Этап 3 (28 дней)

Web-интерфейс: Frontend + загрузка документов + проверка и редактирование данных + выгрузка в Excel

Этап 4 (21 день)

Хранение данных: Система архивации + поиск + просмотр истории + повторная выгрузка

Этап 5А (14 дней) / Этап 5B (35 дней)

Внедрение: Тестирование на реальных данных + калибровка + развертывание + обучение персонала + передача документации

Еженедельные встречи

Каждую неделю проводятся онлайн-встречи, на которых мы демонстрируем промежуточные результаты и обсуждаем текущий прогресс

Вариант A (облачный OCR - 91 день):

День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
День 28 (4 недели): Приемка Этапа 2 — работающий backend с распознаванием и валидацией
День 56 (8 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
День 77 (11 недель): Приемка Этапа 4 — система хранения данных и архив
День 91 (13 недель): Приемка Этапа 5 — развернутая система + обученный персонал

Вариант B (Qwen3 VL - 133 дня):

День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
День 49 (7 недель): Приемка Этапа 2 — работающий backend с развернутой моделью и валидацией
День 77 (11 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
День 98 (14 недель): Приемка Этапа 4 — система хранения данных и архив
День 133 (19 недель): Приемка Этапа 5 — развернутая система + обученный персонал

Еженедельные демонстрации позволяют вам контролировать прогресс и вносить корректировки на ранних стадиях

Технологический стек

AI и распознавание

Google Gemini 2.5 Pro / Яндекс OCR / Qwen3 VL: На выбор в зависимости от требований
Промпт-инжиниринг: Специализированные промпты для извлечения данных из путевых листов
Распознавание рукописного текста: Обработка различных почерков
Извлечение структурированных данных: Парсинг чеков и путевых листов

Backend и база данных

Python + FastAPI: Основной бэкенд и REST API
PostgreSQL: Хранение документов, данных и истории изменений
Celery + Redis: Асинхронная обработка документов
OpenCV / Pillow: Предобработка изображений

Frontend (интерфейс оператора)

Vue.js 3: Современный интерфейс
Drag-and-drop загрузка: Удобная загрузка документов
Интерактивная проверка: Просмотр скана рядом с данными
Цветовая индикация: Подсветка полей по уровню уверенности
Экспорт в Excel: Выгрузка обработанных данных

Развертывание

Docker + Docker Compose: Контейнеризация системы
Linux Server: Работа на вашем сервере или в облаке
Nginx: Веб-сервер и reverse proxy
Git: Передача исходного кода в ваш репозиторий

Следующие шаги

Что нам нужно от вас

Образцы документов: 20-30 реальных путевых листов с различным качеством заполнения и почерка
Образцы чеков: 10-15 чеков заправки для настройки распознавания
Описание формата данных: Какие именно поля нужно извлекать из путевых листов
Требования к выгрузке: Желаемая структура Excel-файла для выгрузки
Выбор варианта OCR: Решение по варианту распознавания (Gemini / Яндекс / Qwen3)

Как начать работу

Согласование КП: Обсуждение и утверждение коммерческого предложения
Подписание договора: Юридическое оформление сотрудничества
Предоплата 1 этапа: 100 000 ₽ за аудит и проектирование
Передача материалов: Отправка образцов документов и описания требований
Kick-off встреча: Старт проекта и детальное обсуждение задачи