Антон Носик: Иск о мертвых душах: анкета №15 000 001
Любопытный иск принят на неделе к рассмотрению Южным окружным судом Нью-Йорка.Истец по имени, скажем, Шон МакДжинн требует 5 миллионов долларов компенсации с крупнейшей в мире службы онлайновых интернет-знакомств Match.com — за то драгоценное время, которое он, согласно жалобе, потратил впустую, пытаясь возбудить интерес к своей персоне со стороны других подписчиков сервиса.
[cut]
Тут можно было бы, конечно, предположить, что окружной судья просто рассмеется парню в лицо и скажет с отеческой назидательностью: «Может, ты просто рожей не вышел, сынок, если никто на нее до сих пор не клюнул?» Но Шон МакДжинн не так прост, и иск его основан на некоторых статистических данных, которые сама служба знакомств о себе сообщает.
В базе платного сервиса Match.com присутствует 100 миллионов анкет, заполненных с начала нынешнего столетия. Из них 15 миллионов анкет «активны», т.е. их владельцы время от времени заходят на сайт под своими регистрационными данными. А платных пользователей сервиса, имеющих полный доступ ко всем его функциям, на сегодняшний день насчитывается 1 миллион 350 тысяч. Тут выходит некоторая нестыковочка, на которую и опирается иск. Выходит, что подписчик выложил регистрационный взнос (от 17 до 35 долларов в месяц, в зависимости от срока абонемента) за обещание доступа к анкетам 100 миллионов потенциальных партнеров, а на практике 85% из них — мертвые души. Изучение их анкет и вступление с ними в переписку — заведомо пустая трата времени, поскольку они давно уже на этот сайт не заглядывают и писем оттуда не читают. Но анкеты их по-прежнему доступны для просмотра: их можно смотреть и изучать, в них можно влюбиться, их владельцам можно писать письма на сайте Match.com. Поскольку владельцы сервиса знают об этой особенности его базы заранее, Шон МакДжинн обвиняет их в сознательном обмане потребителя.
Цель подобных исков, как правило, не в том, чтобы их выиграть, а в том, чтобы напуганный репутационным ущербом ответчик поскорей предложил жалобщику мировую. Той же цели служит и требование к суду признать иск коллективным (дающим любому другому пользователю сервиса право на автоматическую компенсацию от Match.com на тех же основаниях, без нового рассмотрения по существу). Перед лицом такой угрозы редкий топ-менеджер не задумается об отступном. Особенно если речь идет о бизнесе, которому репутация столь важна. Платный сервис знакомств все свои деньги зарабатывает на вере потенциального подписчика в шанс найти партнера; претензии МакДжинна для этой веры могут оказаться убийственны. Независимо от того, существует ли в реальности разница между выбором из 100 или полутора миллионов анкет, с точки зрения целей и задач службы знакомств.
Как уже догадался читатель, ни иск МакДжинна, ни его личность у автора этих строк большой симпатии не вызывает. Но тему сутяга поднял интереснейшую, над которой многие светлые умы в Интернете и за его пределами бьются уже не первое тысячелетие. При наличии теоретической возможности выбора из бесконечного числа вариантов (а 15 миллионов потенциальных партнеров на одну человеческую жизнь — это ль не бесконечность?!) можно ли вычислить или эмпирически нащупать некий оптимальный размер генеральной совокупности, гарантирующей на выходе счастье каждому, кто в ней порылся? Еще до расцвета интернетовских служб знакомств об этом спорили создатели поисковых машин. Одни похвалялись сотнями миллионов проиндексированных документов в своей базе, другие упирали на алгоритм, без которого и из сотни находок трудно выудить одну, заветную.
Самое удивительное, что правота обеих позиций многократно и прилюдно доказана в эксперименте. Значимость алгоритмов подтверждена всей практикой поисковиков. Там даже до третьей страницы находок добирается ничтожное меньшинство пользователей (основной массе хватает первого десятка). А значимость массива собранных данных иллюстрирует нам любой сервис т. н. коллаборативной фильтрации (будь то Amazon.com, Ozon.Ru, Last.FM или ИМХОнет): чем больше накопленная база знаний о пользователях, тем точнее основанные на ней рекомендации. При малой выборке любому слушателю Десятникова подсунут в «смежные вкусы» Диму Билана (ибо тоже русская музыка), а покупателю Сорокина посоветуют вдогонку Минаева (ибо бестселлер). И этот опыт подсказывает иррациональную правоту сутяги МакДжинна: никогда нельзя исключить, что настоящая любовь его жизни скрывалась именно за анкетой номер 15 000 001.