AI-система распознавания путевых листов

Автоматизация обработки рукописных документов с выгрузкой в Excel

*Обработка 30-40 листов/день • Экономия 3-4 часов рабочего времени ежедневно

Цель проекта

Автоматизация распознавания рукописных путевых листов с проверкой корректности данных

Текущая ситуация

  • Рукописное заполнение: 124 водителя заполняют путевые листы от руки с разным почерком
  • Долгая обработка: Диспетчеры тратят 3-4 часа в день на разбор почерка и перенос данных
  • Большой объем: 30-40 путевых листов ежедневно + чеки на заправку
  • Ошибки водителей: Водители неправильно считают пробег (разница показаний спидометра)
  • Постоянные уточнения: Нужно связываться с водителями, чтобы уточнить непонятные записи
  • Ручная выгрузка: Все данные нужно вручную переносить в Excel

Что получите

  • Автоматическое распознавание: Система сканирует путевые листы любого почерка и извлекает данные
  • Распознавание чеков: Автоматическое считывание сумм и литров заправки
  • Проверка корректности: Система автоматически вычисляет пробег и сверяет с данными водителя
  • Алерты об ошибках: Оператор сразу видит расхождения для проверки
  • Экономия времени: 30-40 листов обрабатываются за минуты вместо 3-4 часов
  • Выгрузка в Excel: Одним нажатием все данные выгружаются в таблицу
  • Хранение данных: Все сканы и распознанные данные хранятся 6-12 месяцев

Схема работы системы

1. Сканирование документов

Загрузка: Оператор сканирует пачку путевых листов (30-40 шт) и чеков. Файлы загружаются в веб-интерфейс системы простым перетаскиванием.

2. AI-распознавание рукописного текста

OCR-обработка: Система распознает рукописный текст с путевых листов любого почерка. Извлекаются: показания спидометра (начало/конец), пробег, данные заправки, маршрут, данные водителя.

3. Распознавание чеков

Чеки АЗС: Система автоматически считывает данные с чеков заправки: сумма, литры, дата. Данные сопоставляются с путевым листом водителя.

4. Автоматическая проверка корректности

Валидация данных: Система вычитает конечный показатель спидометра минус начальный и сравнивает с тем, что вписал водитель. При расхождении система выделяет ошибку красным алертом.

5. Проверка оператором

Визуальный контроль: Оператор видит все распознанные данные в удобном интерфейсе. Система подсвечивает поля с низкой уверенностью распознавания (60-70%) и расхождения в расчетах. Оператор проверяет визуально и корректирует при необходимости.

6. Выгрузка в Excel и хранение

Экспорт данных: После проверки оператор нажимает кнопку, и все данные выгружаются в Excel. Сканы и распознанные данные автоматически сохраняются в системе на 6-12 месяцев для возможности возврата к ним.

Варианты реализации распознавания

Мы предлагаем три варианта реализации модуля распознавания рукописного текста с различным соотношением качества, безопасности и стоимости

Вариант 1: Google Gemini 2.5 Pro

Рекомендуем

8–15 ₽ / страница

Характеристики:

  • Качество распознавания: 85-90% даже на сложном почерке
  • Лучшее качество на рынке для рукописного текста
  • Быстрое внедрение (готовый сервис)
  • Не требует дополнительных серверов
  • Риск трансграничной передачи данных

Операционные расходы:
≈ 6 000 ₽/месяц
при обработке 40 листов/день

Вариант 2: Яндекс OCR

1.5 ₽ / страница

Характеристики:

  • Качество распознавания: 50-60% на рукописном тексте
  • Низкая стоимость обработки
  • Российский сервис (нет рисков трансграничной передачи)
  • Быстрое внедрение
  • Потребуется больше ручной корректировки операторами

Операционные расходы:
≈ 1 800 ₽/месяц
при обработке 40 листов/день

Вариант 3: Qwen3 VL (закрытый контур)

Максимальная безопасность

Сервер 110 000 ₽/мес

Характеристики:

  • Качество распознавания: 85-90% как у Gemini
  • Полная конфиденциальность (данные не покидают ваш сервер)
  • Можно дообучить на ваших данных для повышения точности
  • Нет рисков трансграничной передачи
  • Неограниченная обработка без платы за страницу
  • Требуется мощный выделенный сервер

Операционные расходы:
110 000 ₽/месяц
аренда сервера (неограниченная обработка)

Ключевые модули системы

1. Загрузка и управление документами

  • Web-интерфейс для загрузки отсканированных документов
  • Поддержка пакетной загрузки (перетаскивание файлов)
  • Автоматическое разделение многостраничных сканов на отдельные путевые листы
  • Привязка чеков к соответствующим путевым листам
  • Статус обработки каждого документа (загружен → обрабатывается → готов к проверке → подтвержден)

2. AI-модуль распознавания

Интеллектуальное извлечение данных:

  • Распознавание рукописного текста с различным качеством почерка
  • Извлечение структурированных данных из путевого листа: показания спидометра (начало/конец), пробег, маршрут, данные о водителе, информация о доставке
  • Распознавание чеков заправки: сумма, литры, дата и время
  • Определение уровня уверенности для каждого распознанного поля
  • Подсветка полей с низкой уверенностью распознавания

3. Модуль проверки корректности

Автоматическая валидация данных:

  • Проверка пробега: Система вычитает начальный спидометр из конечного и сравнивает с указанным водителем пробегом
  • Сверка заправки: Сравнение данных из чеков с записями в путевом листе
  • Алерты для оператора: Подсветка расхождений и потенциальных ошибок
  • Логика проверки: Настраиваемые правила валидации (допустимое отклонение, критические ошибки)

4. Интерфейс оператора

Удобная работа с данными:

  • Список всех сканов: После распознавания выводится список всех путевых листов
  • Цветовая маркировка: Плохо распознанные листы (низкая уверенность или ошибки) выделяются цветом в списке
  • Детальный просмотр: Клик по строке открывает скан рядом с распознанными данными
  • Редактирование: Быстрая корректировка полей прямо в интерфейсе
  • Снятие маркировки: После редактирования и подтверждения строчка перестает выделяться цветом
  • Экспорт в Excel: Выгрузка всех данных в структурированном виде одним нажатием

5. Хранение данных и архив

  • Хранение всех выгрузок: Каждая выгрузка сохраняется как отдельная запись с датой и временем
  • Просмотр сканов: Для каждого путевого листа доступен просмотр оригинального скана
  • Просмотр распознанных данных: Все извлеченные данные сохранены и доступны для просмотра
  • Поиск и фильтры: Быстрый поиск по дате, водителю, номеру маршрута
  • Период хранения: Все данные хранятся 6-12 месяцев (настраивается)
  • Повторная выгрузка: Можно заново выгрузить любые старые данные в Excel

Этапы разработки и стоимость

Этап 1: Аудит и проектирование системы (7 дней) - 100 000 ₽

Задача: Детальный анализ текущих процессов и проектирование архитектуры системы.

  • Аудит процессов: Изучение текущего workflow обработки путевых листов
  • Анализ документов: Получение и изучение 20-30 реальных путевых листов с различным качеством заполнения
  • Проектирование архитектуры: Разработка технической архитектуры и структуры базы данных
  • Проектирование интерфейса: Создание прототипов экранов для оператора
  • Формирование ТЗ: Детальное техническое задание с критериями приемки

→ Критерий приемки: Техническое задание + прототипы интерфейсов

Этап 2: Разработка ядра системы и модуля распознавания

Задача: Создание backend, базы данных и интеграция с AI для распознавания.

Вариант A: Интеграция с облачным OCR (Gemini / Яндекс OCR)

21 день - 200 000 ₽

  • Backend-разработка: Python + FastAPI для обработки запросов
  • База данных: PostgreSQL для хранения документов и распознанных данных
  • Интеграция с облачным API: Подключение к Gemini или Яндекс OCR через готовый API
  • Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
  • Модуль загрузки: API для загрузки и обработки сканов
  • Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
  • Распознавание чеков: Извлечение данных о заправке
  • Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)

Вариант B: Развертывание Qwen3 VL в закрытом контуре

42 дня - 700 000 ₽

  • Backend-разработка: Python + FastAPI для обработки запросов
  • База данных: PostgreSQL для хранения документов и распознанных данных
  • Развертывание модели Qwen3 VL: Установка и настройка модели на выделенном сервере
  • Обертка модели в API: Создание собственного API-сервиса для работы с моделью
  • Оптимизация производительности: Настройка батчинга и кеширования запросов
  • Разработка промптов: Специализированные промпты для точного извлечения данных из путевых листов
  • Модуль загрузки: API для загрузки и обработки сканов
  • Извлечение данных: Парсинг путевых листов (спидометр, пробег, маршрут, водитель, доставка)
  • Распознавание чеков: Извлечение данных о заправке
  • Модуль валидации: Автоматическая проверка корректности данных (пробег, сверка с чеками)

→ Критерий приемки: Работающий backend + API для загрузки документов + распознавание путевых листов и чеков + валидация данных

Этап 3: Web-интерфейс оператора (28 дней) - 400 000 ₽

Задача: Создание удобного интерфейса для работы операторов с распознанными данными.

  • Frontend-разработка: Vue.js 3 для административной панели
  • Загрузка документов: Интерфейс загрузки с drag-and-drop, пакетная загрузка
  • Список сканов с маркировкой: Визуальное выделение плохо распознанных листов
  • Просмотр и редактирование: Экран проверки данных со сканом рядом с распознанным текстом
  • Цветовая индикация: Подсветка полей по уровню уверенности распознавания
  • Редактирование данных: Быстрая корректировка полей прямо в интерфейсе
  • Экспорт в Excel: Кнопка выгрузки подтвержденных данных
  • История и архив: Просмотр обработанных документов и выгрузок

→ Критерий приемки: Полнофункциональный web-интерфейс с загрузкой, проверкой, редактированием и выгрузкой данных

Этап 4: Система хранения данных и архив (21 день) - 350 000 ₽

Задача: Разработка backend-системы хранения, архивации и работы с историческими данными.

  • Расширение БД: Создание таблиц для хранения истории выгрузок, сканов и распознанных данных
  • API хранения: REST API для сохранения выгрузок с метаданными (дата, время, оператор)
  • Файловое хранилище: Организация хранения оригинальных сканов на сервере с индексацией
  • API поиска: Реализация поисковых запросов по дате, водителю, номеру маршрута
  • Механизм TTL: Настройка автоматического удаления данных по истечении срока хранения (6-12 месяцев)
  • API повторной выгрузки: Функционал генерации Excel из архивных данных
  • Frontend истории: Интерфейс просмотра архива и истории обработанных документов

→ Критерий приемки: Работающая система хранения с API поиска, просмотра и повторной выгрузки данных

Этап 5: Тестирование, развертывание и обучение

Задача: Финальное тестирование, развертывание на сервере и обучение персонала.

Вариант A: 14 дней - 150 000 ₽

Вариант B: 35 дней - 350 000 ₽

*Дополнительное время на тестирование и калибровку локальной модели

  • Тестирование на реальных данных: Обработка 50+ реальных путевых листов из вашего архива
  • Калибровка промптов: Точная настройка распознавания под ваши документы
  • Настройка правил валидации: Адаптация логики проверки под ваши требования
  • Развертывание на сервере: Установка системы на вашем сервере или облаке
  • Передача кода: Git-репозиторий с полным исходным кодом
  • Техническая документация: Инструкции по развертыванию и администрированию
  • Обучение операторов: 2-часовой онлайн-воркшоп для персонала
  • Руководство пользователя: Пошаговые инструкции для операторов

→ Критерий приемки: Система развернута + протестирована на реальных данных + персонал обучен + передана документация

*Общий срок разработки:
Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)

Финансовые детали

Стоимость разработки

Предоплата перед началом каждого этапа:

Вариант A: с облачным OCR (Gemini / Яндекс)

  • 100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
  • 200 000 ₽ — перед началом Этапа 2 (Ядро системы и распознавание - 21 день)
  • 400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
  • 350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
  • 150 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 14 дней)

Итого: 1 200 000 ₽ | 91 день

Вариант B: с Qwen3 VL в закрытом контуре

  • 100 000 ₽ — перед началом Этапа 1 (Аудит и проектирование - 7 дней)
  • 700 000 ₽ — перед началом Этапа 2 (Развертывание модели и распознавание - 42 дня)
  • 400 000 ₽ — перед началом Этапа 3 (Web-интерфейс оператора - 28 дней)
  • 350 000 ₽ — перед началом Этапа 4 (Система хранения данных - 21 день)
  • 350 000 ₽ — перед началом Этапа 5 (Тестирование и внедрение - 35 дней)

Итого: 1 900 000 ₽ | 133 дня

*Работа на этапе начинается после поступления оплаты. Критерии приемки каждого этапа фиксируются в договоре.

Операционные расходы (зависят от выбранного варианта OCR)

Вариант 1: Google Gemini 2.5 Pro

  • Сервер Linux: 5 000 ₽/месяц
  • Google Gemini API: ≈ 6 000 ₽/месяц (40 листов/день)
  • Итого: 11 000 ₽/месяц

Вариант 2: Яндекс OCR

  • Сервер Linux: 5 000 ₽/месяц
  • Яндекс OCR: ≈ 1 800 ₽/месяц (40 листов/день)
  • Итого: 6 800 ₽/месяц

Вариант 3: Qwen3 VL (закрытый контур)

  • Выделенный сервер: 110 000 ₽/месяц
  • Итого: 110 000 ₽/месяц

*Стоимость разработки не зависит от выбранного варианта OCR. Различаются только операционные расходы.

Гарантии и поддержка

  • Гарантийный срок: 90 дней с даты сдачи системы
  • Безвозмездное устранение ошибок в гарантийный период
  • Передача полного исходного кода в ваш Git-репозиторий
  • Docker-контейнеры для развертывания
  • Полная техническая документация
  • Обучение персонала (2-часовой воркшоп)
  • Руководство пользователя для операторов

Экономический эффект

Экономия времени операторов:

  • Текущие затраты: 3-4 часа ежедневно на ручной ввод данных
  • После внедрения: 30-60 минут на проверку и корректировку
  • Экономия времени: 2.5-3.5 часа в день

Дополнительные выгоды:

  • Сокращение количества ошибок при вводе данных
  • Автоматическая проверка корректности пробега
  • Быстрый доступ к историческим данным
  • Освобождение операторов для более важных задач

Передача результатов работ

Исходный код и развертывание

  • Полный исходный код в ваш Git-репозиторий
  • Подробные инструкции по развертыванию (README)
  • Docker-compose для быстрого развертывания
  • Комментированный код по стандартам

Документация и обучение

  • Техническая документация (архитектура, схемы БД, API)
  • Руководство администратора
  • Руководство пользователя для операторов
  • 2-часовой онлайн-воркшоп для персонала

Временные рамки

Общая продолжительность разработки:

Вариант A (облачный OCR): 91 день (13 недель / 3 месяца)
Вариант B (Qwen3 VL): 133 дня (19 недель / 4.5 месяца)

Этап 1 (7 дней)

  • Аудит и проектирование: Анализ процессов + анализ документов + проектирование архитектуры + прототипы интерфейсов

Этап 2А (21 день) / Этап 2B (42 дня)

  • Ядро системы: Backend + база данных + интеграция с AI (облачный API или локальная модель) + распознавание + валидация

Этап 3 (28 дней)

  • Web-интерфейс: Frontend + загрузка документов + проверка и редактирование данных + выгрузка в Excel

Этап 4 (21 день)

  • Хранение данных: Система архивации + поиск + просмотр истории + повторная выгрузка

Этап 5А (14 дней) / Этап 5B (35 дней)

  • Внедрение: Тестирование на реальных данных + калибровка + развертывание + обучение персонала + передача документации

Еженедельные встречи

Каждую неделю проводятся онлайн-встречи, на которых мы демонстрируем промежуточные результаты и обсуждаем текущий прогресс

Вариант A (облачный OCR - 91 день):

  • День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
  • День 28 (4 недели): Приемка Этапа 2 — работающий backend с распознаванием и валидацией
  • День 56 (8 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
  • День 77 (11 недель): Приемка Этапа 4 — система хранения данных и архив
  • День 91 (13 недель): Приемка Этапа 5 — развернутая система + обученный персонал

Вариант B (Qwen3 VL - 133 дня):

  • День 7 (1 неделя): Приемка Этапа 1 — ТЗ + прототипы интерфейсов
  • День 49 (7 недель): Приемка Этапа 2 — работающий backend с развернутой моделью и валидацией
  • День 77 (11 недель): Приемка Этапа 3 — полнофункциональный web-интерфейс
  • День 98 (14 недель): Приемка Этапа 4 — система хранения данных и архив
  • День 133 (19 недель): Приемка Этапа 5 — развернутая система + обученный персонал

Еженедельные демонстрации позволяют вам контролировать прогресс и вносить корректировки на ранних стадиях

Технологический стек

AI и распознавание

  • Google Gemini 2.5 Pro / Яндекс OCR / Qwen3 VL: На выбор в зависимости от требований
  • Промпт-инжиниринг: Специализированные промпты для извлечения данных из путевых листов
  • Распознавание рукописного текста: Обработка различных почерков
  • Извлечение структурированных данных: Парсинг чеков и путевых листов

Backend и база данных

  • Python + FastAPI: Основной бэкенд и REST API
  • PostgreSQL: Хранение документов, данных и истории изменений
  • Celery + Redis: Асинхронная обработка документов
  • OpenCV / Pillow: Предобработка изображений

Frontend (интерфейс оператора)

  • Vue.js 3: Современный интерфейс
  • Drag-and-drop загрузка: Удобная загрузка документов
  • Интерактивная проверка: Просмотр скана рядом с данными
  • Цветовая индикация: Подсветка полей по уровню уверенности
  • Экспорт в Excel: Выгрузка обработанных данных

Развертывание

  • Docker + Docker Compose: Контейнеризация системы
  • Linux Server: Работа на вашем сервере или в облаке
  • Nginx: Веб-сервер и reverse proxy
  • Git: Передача исходного кода в ваш репозиторий

Следующие шаги

Что нам нужно от вас

  • Образцы документов: 20-30 реальных путевых листов с различным качеством заполнения и почерка
  • Образцы чеков: 10-15 чеков заправки для настройки распознавания
  • Описание формата данных: Какие именно поля нужно извлекать из путевых листов
  • Требования к выгрузке: Желаемая структура Excel-файла для выгрузки
  • Выбор варианта OCR: Решение по варианту распознавания (Gemini / Яндекс / Qwen3)

Как начать работу

  • Согласование КП: Обсуждение и утверждение коммерческого предложения
  • Подписание договора: Юридическое оформление сотрудничества
  • Предоплата 1 этапа: 100 000 ₽ за аудит и проектирование
  • Передача материалов: Отправка образцов документов и описания требований
  • Kick-off встреча: Старт проекта и детальное обсуждение задачи