Цель проекта
Автоматизация распознавания рукописных путевых листов с проверкой корректности данных
Текущая ситуация
- Рукописное заполнение: 124 водителя заполняют путевые листы от руки с разным почерком
- Долгая обработка: Диспетчеры тратят 3-4 часа в день на разбор почерка и перенос данных
- Большой объем: 30-40 путевых листов ежедневно + чеки на заправку
- Ошибки водителей: Водители неправильно считают пробег (разница показаний спидометра)
- Постоянные уточнения: Нужно связываться с водителями, чтобы уточнить непонятные записи
- Ручная выгрузка: Все данные нужно вручную переносить в Excel
Что получите
- Автоматическое распознавание: Система сканирует путевые листы любого почерка и извлекает данные
- Распознавание чеков: Автоматическое считывание сумм и литров заправки
- Проверка корректности: Система автоматически вычисляет пробег и сверяет с данными водителя
- Алерты об ошибках: Оператор сразу видит расхождения для проверки
- Экономия времени: 30-40 листов обрабатываются за минуты вместо 3-4 часов
- Выгрузка в Excel: Одним нажатием все данные выгружаются в таблицу
- Хранение данных: Все сканы и распознанные данные хранятся 6-12 месяцев
Схема работы системы
1. Сканирование документов
Загрузка: Оператор сканирует пачку путевых листов (30-40 шт) и чеков. Файлы загружаются в веб-интерфейс системы простым перетаскиванием.
2. AI-распознавание рукописного текста
OCR-обработка: Система распознает рукописный текст с путевых листов любого почерка. Извлекаются: показания спидометра (начало/конец), пробег, данные заправки, маршрут, данные водителя.
3. Распознавание чеков
Чеки АЗС: Система автоматически считывает данные с чеков заправки: сумма, литры, дата. Данные сопоставляются с путевым листом водителя.
4. Автоматическая проверка корректности
Валидация данных: Система вычитает конечный показатель спидометра минус начальный и сравнивает с тем, что вписал водитель. При расхождении система выделяет ошибку красным алертом.
5. Проверка оператором
Визуальный контроль: Оператор видит все распознанные данные в удобном интерфейсе. Система подсвечивает поля с низкой уверенностью распознавания (60-70%) и расхождения в расчетах. Оператор проверяет визуально и корректирует при необходимости.
6. Выгрузка в Excel и хранение
Экспорт данных: После проверки оператор нажимает кнопку, и все данные выгружаются в Excel. Сканы и распознанные данные автоматически сохраняются в системе на 6-12 месяцев для возможности возврата к ним.
Варианты реализации распознавания
Мы предлагаем три варианта реализации модуля распознавания рукописного текста с различным соотношением качества, безопасности и стоимости
Вариант 1: Google Gemini 2.5 Pro
Рекомендуем
8–15 ₽ / страница
Характеристики:
- Качество распознавания: 85-90% даже на сложном почерке
- Лучшее качество на рынке для рукописного текста
- Быстрое внедрение (готовый сервис)
- Не требует дополнительных серверов
- Риск трансграничной передачи данных
Операционные расходы:
≈ 6 000 ₽/месяц
при обработке 40 листов/день
Вариант 2: Яндекс OCR
1.5 ₽ / страница
Характеристики:
- Качество распознавания: 50-60% на рукописном тексте
- Низкая стоимость обработки
- Российский сервис (нет рисков трансграничной передачи)
- Быстрое внедрение
- Потребуется больше ручной корректировки операторами
Операционные расходы:
≈ 1 800 ₽/месяц
при обработке 40 листов/день
Вариант 3: Qwen3 VL (закрытый контур)
Максимальная безопасность
Сервер 110 000 ₽/мес
Характеристики:
- Качество распознавания: 85-90% как у Gemini
- Полная конфиденциальность (данные не покидают ваш сервер)
- Можно дообучить на ваших данных для повышения точности
- Нет рисков трансграничной передачи
- Неограниченная обработка без платы за страницу
- Требуется мощный выделенный сервер
Операционные расходы:
110 000 ₽/месяц
аренда сервера (неограниченная обработка)
Ключевые модули системы
1. Загрузка и управление документами
- Web-интерфейс для загрузки отсканированных документов
- Поддержка пакетной загрузки (перетаскивание файлов)
- Автоматическое разделение многостраничных сканов на отдельные путевые листы
- Привязка чеков к соответствующим путевым листам
- Статус обработки каждого документа (загружен → обрабатывается → готов к проверке → подтвержден)
2. AI-модуль распознавания
Интеллектуальное извлечение данных:
- Распознавание рукописного текста с различным качеством почерка
- Извлечение структурированных данных из путевого листа: показания спидометра (начало/конец), пробег, маршрут, данные о водителе, информация о доставке
- Распознавание чеков заправки: сумма, литры, дата и время
- Определение уровня уверенности для каждого распознанного поля
- Подсветка полей с низкой уверенностью распознавания
3. Модуль проверки корректности
Автоматическая валидация данных:
- Проверка пробега: Система вычитает начальный спидометр из конечного и сравнивает с указанным водителем пробегом
- Сверка заправки: Сравнение данных из чеков с записями в путевом листе
- Алерты для оператора: Подсветка расхождений и потенциальных ошибок
- Логика проверки: Настраиваемые правила валидации (допустимое отклонение, критические ошибки)
4. Интерфейс оператора
Удобная работа с данными:
- Список всех сканов: После распознавания выводится список всех путевых листов
- Цветовая маркировка: Плохо распознанные листы (низкая уверенность или ошибки) выделяются цветом в списке
- Детальный просмотр: Клик по строке открывает скан рядом с распознанными данными
- Редактирование: Быстрая корректировка полей прямо в интерфейсе
- Снятие маркировки: После редактирования и подтверждения строчка перестает выделяться цветом
- Экспорт в Excel: Выгрузка всех данных в структурированном виде одним нажатием
5. Хранение данных и архив
- Хранение всех выгрузок: Каждая выгрузка сохраняется как отдельная запись с датой и временем
- Просмотр сканов: Для каждого путевого листа доступен просмотр оригинального скана
- Просмотр распознанных данных: Все извлеченные данные сохранены и доступны для просмотра
- Поиск и фильтры: Быстрый поиск по дате, водителю, номеру маршрута
- Период хранения: Все данные хранятся 6-12 месяцев (настраивается)
- Повторная выгрузка: Можно заново выгрузить любые старые данные в Excel
Этапы разработки и стоимость
Этап 1: Аудит и проектирование системы (7 дней) - 100 000 ₽
Задача: Детальный анализ текущих процессов и проектирование архитектуры системы.
- Аудит процессов: Изучение текущего workflow обработки путевых листов
- Анализ документов: Получение и изучение 20-30 реальных путевых листов с различным качеством заполнения
- Проектирование архитектуры: Разработка технической архитектуры и структуры базы данных
- Проектирование интерфейса: Создание прототипов экранов для оператора
- Формирование ТЗ: Детальное техническое задание с критериями приемки
→ Критерий приемки: Техническое задание + прототипы интерфейсов
Этап 2: Разработка ядра системы и модуля распознавания
Задача: Создание backend, базы данных и интеграция с AI для распознавания.
Вариант A: Интеграция с облачным OCR (Gemini / Яндекс OCR)
21 день - 200 000 ₽
- Backend-разработка: Python + FastAPI для обработки запросов
- База данных: PostgreSQL для хранения документов и распознанных данных
- Интеграция с облачным API: Подключение к Gemini или Яндекс OCR через готовый API
- Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
- Модуль загрузки: API для загрузки и обработки сканов
- Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
- Распознавание чеков: Извлечение данных о заправке
- Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)
Вариант B: Развертывание Qwen3 VL в закрытом контуре
42 дня - 700 000 ₽
- Backend-разработка: Python + FastAPI для обработки запросов
- База данных: PostgreSQL для хранения документов и распознанных данных
- Развертывание модели Qwen3 VL: Установка и настройка модели на выделенном сервере
- Обертка модели в API: Создание собственного API-сервиса для работы с моделью
- Оптимизация производительности: Настройка батчинга и кеширования запросов
- Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
- Модуль загрузки: API для загрузки и обработки сканов
- Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
- Распознавание чеков: Извлечение данных о заправке
- Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)
→ Критерий приемки: Работающий backend + API для загрузки документов + распознавание путевых листов и чеков + валидация данных
Этап 3: Web-интерфейс оператора (28 дней) - 400 000 ₽
Задача: Создание удобного интерфейса для работы операторов с распознанными данными.
- Frontend-разработка: Vue.js 3 для административной панели
- Загрузка документов: Интерфейс загрузки с drag-and-drop, пакетная загрузка
- Список сканов с маркировкой: Визуальное выделение плохо распознанных листов
- Просмотр и редактирование: Экран проверки данных со сканом рядом с распознанным текстом
- Цветовая индикация: Подсветка полей по уровню уверенности распознавания
- Редактирование данных: Быстрая корректировка полей прямо в интерфейсе
- Экспорт в Excel: Кнопка выгрузки подтвержденных данных
- История и архив: Просмотр обработанных документов и выгрузок
→ Критерий приемки: Полнофункциональный web-интерфейс с загрузкой, проверкой, редактированием и выгрузкой данных
Этап 4: Система хранения данных и архив (21 день) - 350 000 ₽
Задача: Разработка backend-системы хранения, архивации и работы с историческими данными.
- Расширение БД: Создание таблиц для хранения истории выгрузок, сканов и распознанных данных
- API хранения: REST API для сохранения выгрузок с метаданными (дата, время, оператор)
- Файловое хранилище: Организация хранения оригинальных сканов на сервере с индексацией
- API поиска: Реализация поисковых запросов по дате, водителю, номеру маршрута
- Механизм TTL: Настройка автоматического удаления данных по истечении срока хранения (6-12 месяцев)
- API повторной выгрузки: Функционал генерации Excel из архивных данных
- Frontend истории: Интерфейс просмотра архива и истории обработанных документов
→ Критерий приемки: Работающая система хранения с API поиска, просмотра и повторной выгрузки данных
Этап 5: Тестирование, развертывание и обучение
Задача: Финальное тестирование, развертывание на сервере и обучение персонала.
Вариант A: 14 дней - 150 000 ₽
Вариант B: 35 дней - 350 000 ₽
*Дополнительное время на тестирование и калибровку локальной модели
- Тестирование на реальных данных: Обработка 50+ реальных путевых листов из вашего архива
- Калибровка промптов: Точная настройка распознавания под ваши документы
- Настройка правил валидации: Адаптация логики проверки под ваши требования
- Развертывание на сервере: Установка системы на вашем сервере или облаке
- Передача кода: Git-репозиторий с полным исходным кодом
- Техническая документация: Инструкции по развертыванию и администрированию
- Обучение операторов: 2-часовой онлайн-воркшоп для персонала
- Руководство пользователя: Пошаговые инструкции для операторов
→ Критерий приемки: Система развернута + протестирована на реальных данных + персонал обучен + передана документация
*Общий срок разработки:
Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)
Финансовые детали
Стоимость разработки
Предоплата перед началом каждого этапа:
Вариант A: с облачным OCR (Gemini / Яндекс)
- 100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
- 200 000 ₽ — перед началом Этапа 2 (Ядро системы и распознавание - 21 день)
- 400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
- 350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
- 150 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 14 дней)
Итого: 1 200 000 ₽ | 91 день
Вариант B: с Qwen3 VL в закрытом контуре
- 100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
- 700 000 ₽ — перед началом Этапа 2 (Развертывание модели и распознавание - 42 дня)
- 400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
- 350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
- 350 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 35 дней)
Итого: 1 900 000 ₽ | 133 дня
*Работа на этапе начинается после поступления оплаты. Критерии приемки каждого этапа фиксируются в договоре.
Операционные расходы (зависят от выбранного варианта OCR)
Вариант 1: Google Gemini 2.5 Pro
- Сервер Linux: 5 000 ₽/месяц
- Google Gemini API: ≈ 6 000 ₽/месяц (40 листов/день)
- Итого: 11 000 ₽/месяц
Вариант 2: Яндекс OCR
- Сервер Linux: 5 000 ₽/месяц
- Яндекс OCR: ≈ 1 800 ₽/месяц (40 листов/день)
- Итого: 6 800 ₽/месяц
Вариант 3: Qwen3 VL (закрытый контур)
- Выделенный сервер: 110 000 ₽/месяц
- Итого: 110 000 ₽/месяц
*Стоимость разработки не зависит от выбранного варианта OCR. Различаются только операционные расходы.
Гарантии и поддержка
- Гарантийный срок: 90 дней с даты сдачи системы
- Безвозмездное устранение ошибок в гарантийный период
- Передача полного исходного кода в ваш Git-репозиторий
- Docker-контейнеры для развертывания
- Полная техническая документация
- Обучение персонала (2-часовой воркшоп)
- Руководство пользователя для операторов
Экономический эффект
Экономия времени операторов:
- Текущие затраты: 3-4 часа ежедневно на ручной ввод данных
- После внедрения: 30-60 минут на проверку и корректировку
- Экономия времени: 2.5-3.5 часа в день
Дополнительные выгоды:
- Сокращение количества ошибок при вводе данных
- Автоматическая проверка корректности пробега
- Быстрый доступ к историческим данным
- Освобождение операторов для более важных задач
Передача результатов работ
Исходный код и развертывание
- Полный исходный код в ваш Git-репозиторий
- Подробные инструкции по развертыванию (README)
- Docker-compose для быстрого развертывания
- Комментированный код по стандартам
Документация и обучение
- Техническая документация (архитектура, схемы БД, API)
- Руководство администратора
- Руководство пользователя для операторов
- 2-часовой онлайн-воркшоп для персонала
Временные рамки
Общая продолжительность разработки:
Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)
Этап 1 (7 дней)
- Аудит и проектирование: Анализ процессов + анализ документов + проектирование архитектуры + прототипы интерфейсов
Этап 2А (21 день) / Этап 2B (42 дня)
- Ядро системы: Backend + база данных + интеграция с AI (облачный API или локальная модель) + распознавание + валидация
Этап 3 (28 дней)
- Web-интерфейс: Frontend + загрузка документов + проверка и редактирование данных + выгрузка в Excel
Этап 4 (21 день)
- Хранение данных: Система архивации + поиск + просмотр истории + повторная выгрузка
Этап 5А (14 дней) / Этап 5B (35 дней)
- Внедрение: Тестирование на реальных данных + калибровка + развертывание + обучение персонала + передача документации
Еженедельные встречи
Каждую неделю проводятся онлайн-встречи, на которых мы демонстрируем промежуточные результаты и обсуждаем текущий прогресс
Вариант A (облачный OCR - 91 день):
- День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
- День 28 (4 недели): Приемка Этапа 2 — работающий backend с распознаванием и валидацией
- День 56 (8 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
- День 77 (11 недель): Приемка Этапа 4 — система хранения данных и архив
- День 91 (13 недель): Приемка Этапа 5 — развернутая система + обученный персонал
Вариант B (Qwen3 VL - 133 дня):
- День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
- День 49 (7 недель): Приемка Этапа 2 — работающий backend с развернутой моделью и валидацией
- День 77 (11 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
- День 98 (14 недель): Приемка Этапа 4 — система хранения данных и архив
- День 133 (19 недель): Приемка Этапа 5 — развернутая система + обученный персонал
Еженедельные демонстрации позволяют вам контролировать прогресс и вносить корректировки на ранних стадиях
Технологический стек
AI и распознавание
- Google Gemini 2.5 Pro / Яндекс OCR / Qwen3 VL: На выбор в зависимости от требований
- Промпт-инжиниринг: Специализированные промпты для извлечения данных из путевых листов
- Распознавание рукописного текста: Обработка различных почерков
- Извлечение структурированных данных: Парсинг чеков и путевых листов
Backend и база данных
- Python + FastAPI: Основной бэкенд и REST API
- PostgreSQL: Хранение документов, данных и истории изменений
- Celery + Redis: Асинхронная обработка документов
- OpenCV / Pillow: Предобработка изображений
Frontend (интерфейс оператора)
- Vue.js 3: Современный интерфейс
- Drag-and-drop загрузка: Удобная загрузка документов
- Интерактивная проверка: Просмотр скана рядом с данными
- Цветовая индикация: Подсветка полей по уровню уверенности
- Экспорт в Excel: Выгрузка обработанных данных
Развертывание
- Docker + Docker Compose: Контейнеризация системы
- Linux Server: Работа на вашем сервере или в облаке
- Nginx: Веб-сервер и reverse proxy
- Git: Передача исходного кода в ваш репозиторий
Следующие шаги
Что нам нужно от вас
- Образцы документов: 20-30 реальных путевых листов с различным качеством заполнения и почерка
- Образцы чеков: 10-15 чеков заправки для настройки распознавания
- Описание формата данных: Какие именно поля нужно извлекать из путевых листов
- Требования к выгрузке: Желаемая структура Excel-файла для выгрузки
- Выбор варианта OCR: Решение по варианту распознавания (Gemini / Яндекс / Qwen3)
Как начать работу
- Согласование КП: Обсуждение и утверждение коммерческого предложения
- Подписание договора: Юридическое оформление сотрудничества
- Предоплата 1 этапа: 100 000 ₽ за аудит и проектирование
- Передача материалов: Отправка образцов документов и описания требований
- Kick-off встреча: Старт проекта и детальное обсуждение задачи