Исследование
«Жизнь в прямом эфире»
Жизнь в прямом эфире — это не только странные стримы, расследования в социальных сетях и люди, превратившиеся в бренды. Интернет изменил жизнь миллионов, дав им возможность работать онлайн из любой точки света — и отняв последнюю надежду на стабильность. Мы исследовали удивительный мир «человеческого облака», особого способа организации труда, объединяющего разрозненных людей в мощнейший коллективный разум, и заодно попросили одну из участниц самиздата поработать неделю на одной из подобных площадок и записать свои впечатления. Вот что из этого вышло.
«Мне кажется, из всех рабских работ, которые у меня были, по оплате это всё-таки самая рабская. Кажется, меньше, чем здесь, я не зарабатывала никогда в жизни.
Я думала, что если целый день буду сидеть и постоянно обновлять, то я заработаю. Я думала, что будет прям работа-работа. А что-то не вышло.
В общей сложности я за это время получила четыре с чем-то доллара. Банан с кефиром я могу купить на четыре доллара? Время, которое ты тратишь, и деньги, которые ты получаешь… Я не знаю, как люди умудряются этим зарабатывать. Может, это потому, что у меня рейтинг не очень высокий? И мне мало заданий выпадает. Они все уходят людям с высоким рейтингом. В целом я пока себя чувствую проигравшей в этой битве. Но я думаю ещё попытаться. Не знаю, мне нужны деньги. Не, ну как кто-то зарабатывает тут семьдесят тысяч… Наверное, врёт. Прекариат всех стран, соединяйся!»
За последние несколько лет человечество научилось прогнозировать с помощью машинного обучения всё на свете и даже чуть больше: среди прочего, алгоритмам прочат светлое будущее в предсказании погоды, попыток суицида и приговоров Верховного суда США. Однако несмотря на кажущееся всемогущество искусственного интеллекта, компьютеры до сих пор часто ошибаются в простых, казалось бы, вещах, таких как расшифровка человеческой речи или категоризация картинок. Для решения подобных задач было придумано «человеческое облако»: особый вид краудсорсинга, когда сложный набор обязанностей разбивается на простые действия, которые распределяются между тысячами и миллионами участников, работающих удалённо по всему миру. Сложность заданий при этом может быть очень разной, в диапазоне от «найти номер телефона в интернете» до «написать кусок кода».
«Искусственный искусственный интеллект», как ещё иногда называют эту технологию, был придуман не вчера: профильная пресса и IT-сообщество заговорили о нём ещё в середине нулевых. В 2005 году Amazon запустил свою платформу Mechanical Turk, ставшую практически синонимом «человеческого облака»: по состоянию на 2016 год там работало полмиллиона человек, из которых около семи с половиной тысяч рассматривают его как основное место работы. Однако именно за последние несколько лет «человеческие облака» из малопонятной технологии и способа заработать на карманные расходы превратились в полноценный инструмент бизнеса. В 2014 году всего четыре компании из рейтинга Fortune 1000 использовали подобные онлайн-платформы для найма, в 2015-м их стало уже 11 %. Рассматривают такую возможность в ближайшее время ещё 5 %. В 2014 году работодатели по всему миру, по разным оценкам, потратили на оплату труда «облачных» работников от 2 800 000 000 до 3 700 000 000 долларов.
Расцвет «человеческого облака» идеально вписывается во все последние экономические, технологические и социальные тренды с модными названиями типа «гиг-экономики», sharing economy (уже 2.0!) и «постреальности». Общую суть явления можно свести к тому, что всё большую роль начинает играть временная работа, а компании всё чаще вместо постоянных сотрудников нанимают независимых подрядчиков и фрилансеров. В результате потребители получают более дешёвые и удобные сервисы (Uber, Airbnb, продолжите список), бизнес сокращает расходы и наращивает гибкость, а наёмные работники начинают чаще менять карьеру и зачастую вынуждены совмещать несколько работ: они обретают мобильность, но теряют какие-либо гарантии. Если же вы предпочитаете обходить современные технологические достижения стороной, можно и вовсе остаться за бортом. В США к участвующим в «гиг-экономике» сейчас можно отнести около трети всего экономически активного населения.
«Начала я работать. Нечаянно кликнула на первое задание, надо было смотреть видеоуроки. Там было пять страниц с видеокурсами, из них я сделала правильно только три. На остальные у меня мозгов, видимо, всё-таки не хватило. Я заработала на этом шестнадцать центов. Или четырнадцать…
Потом я заработала до двадцати центов тем, что там включаются видосы, и надо сказать, проигрываются они или нет. Эта работа стоит цент. Причём заданием считается просмотр пятнадцати видео. То есть чтобы заработать два цента, надо посмотреть тридцать видео. И ты смотришь какие-то дурацкие популярные видосы, порнуху, стримы, что-то ещё, видеоролики про то, как готовить тортики, и нажимаешь: работает или нет. И за это тебе дают ма-а-а-аленькие копеечки. Зато это задание нельзя выполнить неправильно.
Была ещё работа немного поинтереснее, с голосовыми запросами, которыми люди вызывают что-то, что им нужно в интернете. «Секс красивые пары», «готовые домашние задания», или там всякие «парабола имеет значение игрек и выходит из неё что-то нибудь там», и вот люди просят: интернет, реши мне эту задачку. Это надо слушать и расшифровывать. Иногда там просто какое-нибудь шкрябание телефона обо что-нибудь или странные нечленораздельные звуки. Но это хотя бы более интересно и оплачивается лучше. На задание уходит примерно двадцать минут, и за него тебе платят четыре цента. Всё равно маловато.
В итоге я заработала за сегодня и за вчера сорок центов, проведя на заданиях примерно три часа. Почувствовала себя рабом. Это интернет-рабство.
Но я надеюсь, что потом плата возрастёт. Пока что кроме аудио это было совсем неинтересно. То есть интересно, но интересно тем, что ты такой: „Ой, интернет, ты такой большой, столько в тебе всякого говна есть“. Но это недостаточно интересно. Ну посмотрим, что будет дальше. Надеюсь на карьерный рост».
После Amazon Mechanical Turk подобные платформы стали появляться повсеместно. WorkMarket, Upwork, FieldNation, OnForce, Freelancer.com, Proworkers, ShiftPixy, Jobr, Ciber Inc., twago, Sticky Crowd (платят за то, что отслеживают движения ваших глаз во время просмотра сайтов), People per Hour — это лишь то, что на поверхности. У подобных сервисов есть своя иерархия: например, в SuperTasker задания требуют определённой квалификации, поэтому там меньше работников, они проходят предварительный отбор, а оплата фиксирована. На верхушке пирамиды — сервисы типа MBA & Company и HourlyNerd, предоставляющие услуги «консультантов по вызову». Там же Topcoder (для программистов) и Upcounsel (для юристов). Консультанты из MBA & Company получают от 300 до 6 500 фунтов за день, дополнительные 20 % платформа берёт в качестве комиссии.
Есть подобные сервисы и в России. Самый известный из них несколько лет назад запустил Яндекс, и называется он «Толока».
Яндекс с помощью «Толоки» собирает пользовательские оценки контента, которые затем использует для обучения машинных алгоритмов. Например, исполнителю (их называют «толокерами») показывают фотографии и просят сказать, что на них изображено. В финале получается огромный массив размеченных изображений, который затем загружается в нейросеть. Машина учится на таком «эталонном» наборе и вырабатывает свой набор признаков, по которым она в дальнейшем способна сама определять, что изображено на любой предлагаемой ей картинке, даже если она не входит в этот набор. Таким образом улучшается качество поиска по изображениям.
Первые полтора года «Толока» была закрыта для внешних заказчиков, потом перешла к открытому бета-тестированию. Сейчас это уже не эксперимент, польза этого инструмента (как минимум, для самого Яндекса) доказана и осязаема. Причина, по которой сервис до сих пор работает в бета-режиме, состоит в том, что задачи других компаний отличаются от задач Яндекса. Это значит, что им может быть нужен другой инструмент формирования заданий, оценки их выполнения, возможность сегментировать исполнителей по другим критериям и правильно интерпретировать результаты труда.
Кроме того, в перспективе Яндекс хочет снизить порог входа в «Толоку» для тех заказчиков, которые мало знакомы с миром краудсорсинга, так что сервис дорабатывают ещё и с этой точки зрения.
Количество исполнителей в «Толоке» стабильно растёт. По словам разработчиков сервиса, это связано с ростом количества и разнообразия заданий — в основном, от разных команд Яндекса. Например, появляется всё больше задач, которые выполняются с помощью мобильного телефона: сфотографировать вывески, полки в магазине, проверить адрес организации. Если в декабре 2015 года толокеры выполнили 3 730 000 заданий, то в декабре 2016 — уже 5 310 000. Сейчас в «Толоке» регистрируется в среднем 20 000-25 000 новых пользователей в месяц, а общее количество регистраций перевалило за полмиллиона — ещё год назад Яндекс говорил о 270 000 пользователей.
«Сегодня я делала задания, где надо куда-нибудь пойти и что-нибудь сфотографировать. Правда, во-первых, приложение меня всё время определяет если не в Люберцах, то на Красной площади. Если я дома сижу — в Люберцах. Вышла из дома — на Красной площади. Но можно найти задания по карте, и я нашла их в ближайшем торговом центре. Они лучше оплачиваются, там уже не один цент, а целых сорок. То есть сегодня я, возможно, заработала целых два доллара семьдесят центов. Но эти задания ещё не проверены.
Моя задача состояла в том, чтобы проверить, существуют ли какие-то организации на этом месте, и если нет, то что с ними случилось. Правда, оказалось, что все организации, которые я искала, куда-то переехали. Как правило, это какая-нибудь «Компания Ладья», и вот ты ходишь по всему торговому центру, ищешь, где бы могла быть эта несчастная компания. И там надо фотографировать и предоставлять доказательства.
Самое дурацкое в этом всём то, что каждый раз нужно было снимать табличку с адресом этого торгового центра, чтоб закончить задание. То есть я не могла сфотать один раз эту табличку и ко всем заданиям приделать одну и ту же фотку. Надо было каждый раз выходить. А там прямо под табличкой стояли два охранника, и я подхожу один раз, фоткаю. Полчаса прошло — ещё раз подхожу, через полчаса ещё раз. Они такие: «Что это вы тут всё фотографируете?» Ну я начала объяснять, что вот, работаю. А они: «А что ж там, нельзя одну и ту же фотографию прикрепить?» Ну вот так вот, да, нельзя.
Ещё там оказалась очень дебильная форма. Единственным из шести-семи мест, которое действительно оказалось на месте, был банкомат. И там в форме, если организация на месте, указания: «Сфотографируйте здание. Сфотографируйте дверь с телефоном». А это банкомат! Я могу сфотографировать только банкомат! Ну я сфоткала торговый центр, на следующей поближе сняла, потом подальше. Такая вот форма. И там все поля обязательные, нельзя ничего пропустить.
И я так устала, ходила-ходила по этому торговому центру, ищешь одну штуку, другую.
Потом я пришла домой, и мне выдали новое задание — оценивать фотографии других чуваков, сделанные в заданиях типа предыдущего. Но нужно было сначала тест пройти, подходите вы для этой работы или нет. Там есть критерии оценки, и надо было определить фотографии по этим критериям. Я почти всё провалила, кроме двух-трёх.
Например, там написано: «Если фотография снята в темноте, она не подходит». А я смотрю, например: фотография снята на свету, но она нерезкая. Ну не знаю, по мне — в инструкции было написано, что если фотография нерезкая, то она не подходит. Я нажимаю: «Не подходит». А он мне такой: «Подходит». Я такая: «Я с тобой не согласна, она нерезкая, по ней ничего не понятно».
Или написано: «Если это фотография таблички или двери рядом с ней, отметьте галочку». Есть фотография таблички, двери рядом нет. Но там же написано «или», поэтому я отвечаю «да», а он пишет: «А двери-то нет». Хотя написано «или». В общем, я плохо сделала это задание, не дали мне оценивать результаты той работы, которой я до этого занималась, и у меня эти задания исчезли из предложений. Сколько в итоге получается? Я потратила три с половиной часа, заработала два доллара семьдесят центов. Это сколько, центов девяносто в час? Сейчас мой доход примерно равен доходу рабочего на китайской фабрике».
В середине прошлого года «Толоку» запустили в режиме открытой беты. Сейчас, по словам представителей Яндекса, регулярно формируют задания несколько десятков внешних заказчиков, и их количество растёт. Например, интернет-магазины привлекают толокеров для редактирования и наполнения карточек товаров и для модерации разделов. Маркетинговые агентства проводят фокус-группы: просят исполнителей проверить и оценить креатив, выбрать наиболее удачный. Мерчендайзеры и дистрибьюторы — обойти торговые точки, проверить наличие товара на полках и через мобильное приложение прислать заказчику отчёт. Отдельное место занимают команды, занимающиеся машинным обучением — как и сам Яндекс, они заинтересованы в сборе данных для обучения алгоритмов правильно классифицировать, например, изображения и текст.
Больше всего в «Толоке» исполнителей из России (около 40 %), Украины (чуть меньше 30 %) и Турции (17 %). Примерно по 5 % – из Белоруссии и Казахстана. Это прежде всего те регионы, в которых работают сервисы Яндекса. Распределение исполнителей по областям России довольно предсказуемо и напрямую связано с демографией: где больше жителей — там больше и толокеров. Лидируют Москва и Подмосковье, на втором месте — Санкт-Петербург и Ленинградская область, на третьем — Свердловская.
В руководстве заказчика написано, что «Толока не предназначена для заданий, которые могут нанести вред пользователям» — но как решается, что может нанести вред? Исполнитель может сам выбрать, какие задания он хочет выполнять, а какие — нет. Например, можно отказаться выполнять задания с возрастным ограничением 18+ или выполнять только задания на мобильном — тогда в списке доступных не будут появляться никакие другие.
Для заказчиков в «Толоке» сформировали политику по тем заданиям, которые в Толоке размещать нельзя, они описаны в специальном разделе мануала. Например, сюда относятся задания, связанные с прямой рекламой или голосованиями, с разглашением персональной информации третьих лиц, с необходимостью загружать и устанавливать на устройство исполнителя какое-нибудь программное обеспечение, с публикацией любых нарушающих законодательство материалов.
«Сегодня у меня приняли часть вчерашнего задания, одно ещё на проверке. То есть на счету у меня теперь два доллара восемьдесят центов, congratulations! Теперь я могу… что я могу купить на два доллара восемьдесят центов? Это сколько, примерно сто шестьдесят рублей? На сто шестьдесят рублей я могу купить… могу купить… я могу купить молоко и банан. И это вкусно. Или два йогурта больших. Неплохо для четырёх дней работы, да. Бананы питательные, один съешь утром — вот тебе и завтрак.
Сегодня я два раза делала задания по расшифровке аудиозаписей. В этот раз это были не домашние детские задания, а адреса типа «Вавилова, 16», «проспект Ленина, 25», вот такие записи. Ничего смешного там не было, было довольно скучно, и платят за это восемь центов. То есть уже побольше, чем два цента, но всё равно. На задание уходит где-то минут десять.
Но так, конечно, всё равно чувствуешь себя… Не знаю, есть какая-нибудь дурацкая работа, типа мыть туалеты, шить одежду для H&M. Такая, где чтобы хоть что-то заработать, надо очень много делать. То есть ты силы вкладываешь, но это труд непрофессиональный, эта работа тебе ничего не даёт. Ну, может, швейная работа даёт хоть какой-нибудь навык, а здесь какой навык? Я научусь распознавать речь через хрипы людей? То есть мне легче будет общаться с людьми, которые плохо выговаривают слова. Наверное, это единственный плюс. Странно ещё то, что вот я сегодня работала, но это не создаёт никакого ощущения труда. Может, если бы двенадцать часов поработать, это бы создало такое ощущение, но двенадцать часов расшифровывать аудиозаписи… Это довольно ужасно».
Юридическая основа отношений регулируется пользовательским соглашением, которое принимает исполнитель, а также соглашением с заказчиком. Исполнитель здесь рассматривается в роли «стороны, оказывающей услугу Яндексу, за которую он получает вознаграждение». Отношения с контролирующими органами (например, налоговой) он при этом регулирует сам. Толокер не считается сотрудником Яндекса. С другой стороны Яндекс оказывает услуги для внешних заказчиков силами исполнителей, зарегистрированных в «Толоке». То есть внешний заказчик и толокер не вступают в юридические отношения друг с другом напрямую.
В целом «Толока» действует по правилам классического marketplace, то есть исполнители не относятся к сотрудникам Яндекса — а значит, обязательств ни у кого ни перед кем нет.
Это один из главных камней преткновения в случае с «человеческим облаком»: современное трудовое законодательство никак не регулирует легальный статус таких работников. Это неизбежно приводит к возникновению конфликтов. В 2013 году платформа CrowdFlower заплатила 585 000 долларов, чтобы урегулировать иск от работников: те были возмущены, что получают меньше минимальной заработной платы, установленной в США. Несмотря на это, глобально ситуация с оплатой труда таких работников за четыре года не изменилась, законодательно они по-прежнему остаются в «серой зоне».
«Сегодня я работала три часа и заработала пятьдесят центов. Аудиозаписи — это самое весёлое, наверное, занятие. Сегодня классные были запросы, типа „русский секс“, „михаил боярский молитва“, „как понять в храме где поставить свечу за упокой“, „как обоссать русскую женщину“. Обоссать русскую женщину!. Никогда не думала, что когда люди ищут порно, они указывают национальность. То есть как секс может быть русским? Моя голова сломалась, я не понимаю.
А, ещё там был детский запрос про порно. Есть некий мультик, и есть порноигра примерно с таким же названием, и вот ребёнок зачем-то искал эту порноигру. Я уверена на 90 %, что это был именно ребёнок: дети ещё орут, когда разговаривают. Взрослые по-разному общаются со смартфоном, а дети прям такие: „Ааааа“. Ещё были интересные сообщения, типа „спасибо, яндекс“ или просто „спасибо“. Такие выражения благодарности смартфону. Иногда запросы так звучат: „А не мог бы ты, пожалуйста…“. То есть некоторые пользователи в командно-приказном тоне общаются со своим смартфоном, а есть прям вежливые.
Был ещё запрос от ребёнка, ну или от человека с детским голосом: „смотреть фильм на твой выбор“. То есть на выбор смартфона. Это довольно интересно. То есть машина — человек — общение — пожалуйста — посмотреть фильм. Интересно.
Вообще я не понимаю, как там люди зарабатывают. Пока у меня не появилось это задание с аудиозаписями, я могла делать только самую дешёвую работу. Это просматривать, работает или не работает видео. Но это невыносимо скучно, и платят за это невыносимо мало.
Ещё там есть распознавание плохих объявлений. За него тоже довольно мало платят, и довольно много надо делать. Есть объявления типа „Дочь путина попала в ДТП, осторожно смотреть онлайн“ — и это типа плохой текст. А есть какое-нибудь „я увеличил свой член с помощью вот этого метода — жми“, и это считается хорошим текстом, потому что они по-разному написаны. Если объявление написано более-менее грамотно, там не слипшиеся слова и понятно, какой продукт рекламируется, то оно хорошее.
А, нет, там не увеличение члена рекламировалось, а донорство спермы. Что-то типа „выбери самого красивого донора спермы“. Я сначала отметила как плохое, а он мне это выделил красненьким: „Понятно, что объект продажи — донор спермы. Это объявление нормальное“. Я такая: ок, как скажешь, интеллект. Ну это ещё тоже более-менее интересно, потому что там время от времени какие-то слова добавляются, и иногда они в совершенно абсурдном порядке встают, типа „подарки мужу на 14 февраля чистый холст купить ведро онлайн“. И ты такой: хорошооо…
Ещё про ведьм было. Надо было отбирать картинки, которые будут в поиске выдаваться. И есть плохие типы картинок, в которых „присутствуют ведьмы, магия, оружие, порно, образы знаменитостей“, ещё что-то. А есть хорошие. И надо было выбирать. Но ведьмы и магия меня насмешили. Интересно, а если картинки из фильма типа „Гарри Поттера“ или ещё какого-то, где магия и волшебство — они все плохие? В общем, это было странно, но забавно. Но мне не дали полное задание, потому что я не очень хорошо прошла тест.
Пару заданий у меня увели прямо из-под носа. Там действительно надо сидеть и ждать, пока что-то выйдет, и не факт, что всё в итоге получится. То есть да, тебе никто не обязан давать работу, но ты всё равно немножко ждёшь. Ну и обидно, когда сидишь-сидишь, сидишь-сидишь, а ничего не вылезает, только видео эти дурацкие за копейки».
Рабочий день
человека-облака
Алексею двадцать пять лет, он живёт в Кемерове и заочно учится в одном из крупных местных технических вузов. По его словам, к работе в «человеческом облаке» он пришёл в основном из-за денег. Зарплаты в регионе невысокие, на полноценной работе можно получать 25-30 тысяч рублей — это потолок. Работа на одной из краудсорсинговых платформ позволяет ему зарабатывать от тысячи долларов в месяц, при этом он сам регулирует свой рабочий день и занятость. Правда, для того чтобы получать эти деньги, приходится работать сразу на нескольких проектах.
Рабочий день Алексея выглядит примерно так. Он просыпается в восемь вечера, часа через три после этого начинают поступать задания: работа исключительно ночная из-за разницы во времени — Алексей сотрудничает с одной из зарубежных платформ). Можно выбирать своё собственное расписание: в любой момент перестать работать, на пару недель уйти в отпуск. Но это отразится на количестве заработанных денег.
При варианте, когда задания поступают по нескольким проектам одновременно, на выработку ночной «нормы» уходит около пяти часов. Если работа разбивается на отдельные проекты, которые идут один за другим, рабочий день увеличивается до двенадцати-тринадцати часов. При получении работы с каждой компанией подписывается договор и NDA, всё в электронном виде. Никаких гарантий работнику не предоставляется, более того, его могут уволить в любой момент без объяснения причин. Такое пару раз происходило с Алексеем: заказчику что-то не нравилось и он просто говорил «до свидания». Приходилось что-то придумывать, искать лазейки, чтобы устраиваться заново.
У Amazon Mechanical Turk есть сообщества людей, форумы, на которых общаются «туркеры». У сервиса, где работает Алексей, ничего подобного нет. Более того, это запрещено правилами площадки и подпадает под договор о неразглашении: работники не должны общаться друг с другом за пределами площадки.
Главный минус такой работы — необходимость постоянно находиться у компьютера, чтобы ловить задания. Так как никакого регламента тут нет, в один месяц может быть больше работы, а в другой меньше. По словам Алексея, в последнее время идёт устойчивая тенденция к снижению количества заданий.
«Я хотел бы сказать, что когда люди приходят на такого рода работу, они думают, что в интернете деньги прямо с небес валятся. Но это не так, это в любом случае работа, и работа не самая лёгкая. Поэтому и деньги тоже не очень-то лёгкие. Такой миф есть, но на самом деле это исключительно миф», — говорит Алексей.
«Сегодня опять была сложность с тем, что нет заданий. То есть ты можешь сидеть полчаса, и нет вообще ничего. Единственное задание, которое мне нравится, — это аннотирование аудиозаписей. Когда я делаю другие задания, я начинаю ненавидеть интернет, у меня идёт такое отвращение к нему. Особенно когда видео смотришь. Ты думаешь: „Какой мерзкий и уродливый этот мир. В каких мерзких и уродливых формах он выражается“.
При аннотированим аудиозапросов появляется такое чувство, что ты вторгаешься в чужую жизнь, как будто соприкасаешься непосредственно с человеком. Когда он говорит: „А вот, пожалуйста, на твой выбор“ — такое ощущение иногда, что он тебе это говорит. Что ты и есть Сири, которая там сидит. Вот раньше ты звонишь телефонистке, и она тебе: „Здравствуйте!“ И ты себя ощущаешь такой современной телефонисткой. А когда ты видео смотришь, ты просто окунаешься в мир какого-то абсолютно мерзкого контента, с которым в своём обычном интернет-сёрфинге никогда не соприкасаешься.
Ещё там есть форум. Можно читать, что другие пишут. Самая главная тема — „Почему у меня нет заданий?“ Другая тема — люди жалуются, что вот, вы пишете, что можно 10 долларов в день зарабатывать, а ни хуя, я зарабатываю двадцать центов за час, как из этого выйдет десять долларов? А они отвечают: вы заработали столько, столько поработали, мы вам ничем не обязаны. В таком духе ответы.
Но вообще я не оставляю надежды попробовать там зарабатывать. Сегодня смогла работать только полтора часа, заработала шестнадцать центов. Но не знаю, хочу в следующий раз прям целый день работать, восемь часов. Интересно, сколько я заработаю за восемь часов?»
Для сравнения: чтобы зарабатывать восемь долларов в час на Amazon Mechanical Turk, работнику необходимо успешно выполнить 110 000 заданий и пройти несколько квалификационных ступеней.
Дмитрий Усталов — молодой учёный из Екатеринбурга. Он исследует особенности машинного понимания текста. Один из самых важных вопросов в этой области — насколько хорошо машина различает смысловые связи между словами. Для этого удобнее всего сопоставлять качество результата с материалами «золотого стандарта» — какого-либо словаря или банка данных, обладающего известным качеством. Однако такие ресурсы доступны не всегда, особенно для русского языка, поэтому Дмитрию приходится обращаться за «мудростью толпы» на различных краудсорсинговых платформах: CrowdFlower, «Яндекс.Толоке» или Mechanical Tsar. Последнее — разработка Усталова и его коллег на собственной инфраструктуре.
По словам Дмитрия, основной тип интересующих его заданий предполагает сбор суждений людей о связях между словами: «Правда ли, что кошечка — это животное?» (разумеется!), «Какое из этих слов лишнее: лук, порей, налучник, налучь?» (порей) и так далее. Учитывая, что выполняют задания носители языка без специальной подготовки, приходится использовать максимально доступные формулировки — иначе в результате получится мусор, за который заплачены деньги.
Говоря о плюсах и минусах такого подхода, Усталов отмечает, что с одной стороны, грамотно спроектированное задание выполняется легко и быстро — это здорово экономит время. С другой, рискованно отдавать на краудсорсинг задания, требующие специальной квалификации, а не просто субъективных ощущений исполнителя. Например, популярность музыкальной группы не всегда соответствует художественной ценности её творчества.
Усталов с коллегами используют краудсорсинг с 2013 года. За второе полугодие 2016 года они потратили на оплату заданий около тысячи долларов. По словам Дмитрия, разницу в рынке микрозадач «там» и «здесь» видно очень хорошо. Здесь это в новинку: людям интересно попробовать заработать деньги в интернете, не занимаясь сомнительной деятельностью вроде кликов по баннерам и реферальным ссылкам. При этом практически любое, даже сложное, задание оказывается выполнено довольно быстро. В Индии распространён «товароцентричный» краудсорсинг, когда люди получают оплату за работу не деньгами, а товарами. На Западе работа на подобных платформах может стать основным источником дохода: существуют работающие механизмы обратной связи («Мне не нравится ваше задание») и целые системы рейтингов как исполнителей, так и заказчиков.
«Сегодня я работала в толоке восемь часов. И заработала двенадцать центов. Такой вот я успешный работничек. Собственно, заданий не было, а если были, то на один-два цента и суперкороткие. Например, дали новый тип заданий. Есть слово, и надо указать, связано ли оно по смыслу с другим, типа „анальгин — это разновидность лекарства“. Вот подобные утверждения, и надо отмечать, правильные они или неправильные. „Желание — это часть бессознательного“, такие тоже были примеры. Или с физикой какие-то связанные были. Иногда смешные попадались, типа «слово — это разновидность слова». И ты такой сидишь и думаешь: ну как бы тебе сказать...
Ещё было задание с картинками, и картинки у меня не подгружались. Приходилось открывать их в отдельной вкладке. Это занимало кучу времени, и я одно задание не успела сделать — просто на секунду опоздала, и всё. Задания ограничены по времени. Я прям уже последнюю фотку нажала, и не осталось секунд, и он мне не засчитал выполнение. В общем, не очень интересный день был: столько времени, а ничего не заработала».
Наступит ли момент, когда компьютеры окончательно научатся выполнять всю эту работу, и человеку не останется в ней места? Оценки людей нужны для настройки любых алгоритмов, для обучения которых нельзя получить данные другим способом. Например, натренировать компьютер играть в какую-нибудь игру можно без человеческих оценок, потому что результаты игры компьютера с самим собой могут использоваться в качестве оценок для дальнейшего обучения (у специалистов это называется reinforcement learning, «обучение с подкреплением»). Для того чтобы компьютер учился рисовать картины в стиле Ван Гога, оценки тоже не требуются: эталонные картины, которые нужны для обучения, уже нарисовал сам Ван Гог. Но есть много задач, для которых готовых данных для обучения алгоритмов попросту не существует, и люди помогают их формировать.
Локально, в рамках каждой отдельной задачи, процесс сбора оценок конечен. Например, если собрать нужную базу данных размеченных фотографий и обучить с её помощью нейронную сеть узнавать, что изображено на картинке, то для этой конкретной задачи оценки людей уже не нужны. Но глобально человеческий труд перестанет быть нужным только тогда, когда у программистов закончатся идеи для автоматизации новых процессов. Как считают представители Яндекса, вряд ли это произойдёт в скором будущем, так что толокеры, туркеры и другие микротаскеры без заданий не останутся.
P.S.: Незадолго до публикации этого текста Алексей сообщил самиздату, что платформа, где он работает, закрыла регистрацию и приостановила набор новых пользователей. Причиной стало падение объёмов работы.