Сбор видео и фото разных этносов

От африканских саванн до индийских мегаполисов – мы провели интернациональную кампанию по сбору данных. Преодолев языковые барьеры, технические трудности и культурные нюансы, мы получили результат, которым действительно можно гордиться.

ellipse
  • Сроки:
    1,5 месяца
  • Объем:
    300 наборов
  • Индустрия:
    Исследования в области обработки данных.
  • Задача:

    Нашему заказчику потребовались видео- и фотоматериалы с участием представителей разных этнических групп – африканцев и индийцев. Задача, на первый взгляд, казалась простой: записать, как люди произносят последовательность цифр, и сделать несколько фотографий. Но, как говорится, дьявол кроется в деталях.

    Требования к материалам:
    1. Видео: 4 видеоролика на каждого участника. Важным условием была уникальность последовательности для каждого участника.
    2. Фото: 2 фотографии каждого участника.
    3. Объем: 200 наборов с участниками из Африки и 100 наборов с участниками из Индии.
  • Решение:

    Были разработаны инструкции для участников. Однако, как показала практика, они оказались недостаточно понятными и подробными, особенно для исполнителей с разным уровнем образования и культурным бэкграундом.

    Проект был запущен на крупной крауд-платформе, мы добавили инструкции и установили вознаграждение за выполнение задания. Мы также настроили параметры проекта на платформе для более точного таргетинга на целевую аудиторию и фильтрации нерелевантных исполнителей.

    После запуска мы выявили первые проблемы:

    • Низкое качество данных: Большой объем «мусорных» данных, включая видеоролики, не соответствующие требованиям (например, видео в TikTok).
    • Сложность восприятия инструкций: Различия в культурном контексте и уровне образования участников затрудняли понимание инструкций.
    • Технические ограничения: Необходимость использования разных устройств для записи (веб-камера и телефон) тоже создавала дополнительные сложности для участников.
    Анализ проблем:
    1. Мы тщательно изучили исходные материалы и выявили основные причины проблем: нечеткие инструкции, отсутствие визуальных примеров, технические сложности для участников.
    2. Учитывая культурные особенности и возможные языковые барьеры, мы приняли решение адаптировать инструкции и коммуникацию.
    Оптимизация инструкций:
    1. Добавили в инструкции наглядные видеопримеры правильного выполнения задания, демонстрирующие требования к ракурсу, освещению и произношению.
    2. Разработали подробные пошаговые инструкции. В них мы сделали акцент на технические аспекты использования разных устройств (веб-камера и телефон).
    3. Перевели инструкции на языки, наиболее распространенные среди целевых групп участников. Это заметно уменьшило количество ошибок.
    4. Внедрили систему автоматической генерации уникальных последовательностей цифр для каждого участника. Так стало проще контролировать данные, а еще это решение исключило возможность повторений.
    5. Увеличили размер вознаграждения за выполнение задания, чтобы привлечь более ответственных и мотивированных участников.
    6. Создали канал обратной связи для оперативного решения возникающих вопросов и проблем у участников.
    Валидация данных:
    1. Мы разработали четкие критерии для проверки фото- и видеоматериалов, включая требования к качеству, содержанию и соответствию инструкции.
    2. Была организована ручная валидация всех материалов для отсеивания «мусора» и обеспечения соответствия требованиям заказчика.
    3. А еще для каждого набора мы проверяли уникальность сгенерированных последовательностей цифр.
  • Результаты:

    Благодаря комплексному подходу мы добились значительного улучшения качества данных и наверстали упущенное время.

    1. Значительное улучшение качества данных: Количество «мусора» и несоответствующих требованиям материалов значительно сократилось.

    2. Проект был закончен в срок и заказчик остался доволен результатом.

Другие кейсы

Сбор Replay-атак для кибербезопасности

В течение 26 месяцев мы ежемесячно собирали 40 000 уникальных Replay-атак для обучения Face ID-модели клиента. Через краудсорсинг и автоматизированную валидацию данных нам удалось значительно повысить точность системы в распознавании фальсификаций.

Подробнее

Разметка LiDAR для улучшения пространственной ориентации

Мы выполнили разметку облаков LiDAR для улучшения пространственной ориентации нейронной сети с 99% точностью. Это помогло клиенту увеличить производительность модели в три раза.

Подробнее
Все кейсы

Оставьте
заявку

Мы обязательно
свяжемся с вами!
Дмитрий, менеджер по работе с клиентами Дмитрий,
менеджер по работе с клиентами
Дмитрий, менеджер по работе с клиентами

    Нажимая кнопку «Оставить заявку», я даю согласие на отправку и обработку своих персональных данных

    Ваша заявка успешно отправлена!

    Мы скоро свяжемся с вами для обсуждения деталей проекта