Какова вероятность повторного преступления, или Уравнение правосудия
Алгоритм не может вынести приговор. Он не умеет сопоставлять доводы защиты и обвинения, анализировать доказательства, ему не понять, осознал ли подсудимый свою вину. Не ждите, что в обозримом будущем он заменит судью. Но что он может, как ни трудно в это поверить, — так это рассчитать риск повторного преступления, исходя из персональных данных человека. А поскольку суд нередко принимает решение на основании оценки вероятности того, что подсудимый вернется на путь преступления, иметь такую опцию весьма полезно.
Персональные данные и расчеты применяются в судействе уже почти столетие, впервые это начали делать в Америке еще в двадцатых годах прошлого века. При тогдашней американской системе подсудимых обычно приговаривали к максимальной мере наказания, они сколько-то отсиживали, после чего их отпускали «под честное слово»*. На основании этого закона десятки тысяч заключенных выходили из тюрем раньше срока. Одни благополучно исправлялись, другие — нет. Но все вместе они представляли собой идеальный материал для эксперимента в естественных условиях, а вопрос был поставлен так: можно ли предсказать, нарушит ли заключенный взятые на себя обязательства?
Знакомьтесь — Эрнст Уотсон Берджесс, канадский социолог из университета Чикаго, хлебом не корми — дай составить прогноз. Берджесс был убежденным сторонником количественного анализа общественных явлений. Чего только он не прогнозировал за свою многолетнюю практику — от последствий выхода на пенсию до счастливых браков, — а в 1928 году впервые предложил эффективный метод оценки риска преступных действий, основанный не на интуиции, а на результатах измерений.
Берджесс собрал самые разнообразные сведения о трех тысячах обитателей иллинойсской тюрьмы и сформулировал двадцать один фактор, от которых, по его мнению, «возможно, зависит» вероятность нарушения условий условно-досрочного освобождения. Учитывались, в частности, вид правонарушения, срок пребывания в тюремной камере и социальный тип заключенного; с присущей социологу начала ХХ века деликатностью он выделил социальные типы — например, «бродяга», «пьяница», «бездельник», «деревенщина» и «иммигрант».
Каждому заключенному Берджесс поставил оценку от 0 до 1 по каждому пункту. Если сумма была достаточно велика — от 16 до 21, — то вероятность рецидива преступления Берджесс оценивал как низкую. Те, кто набрал низкие баллы — не больше 4, — по его мнению, наверняка нарушили бы правила условно-досрочного освобождения.
Когда все участники эксперимента вышли на свободу и при желании могли бы нарушить установленный законом порядок, у Берджесса появился шанс проверить достоверность своих прогнозов. Для столь примитивной методики он добился поразительной точности прогнозирования. В группе низкого риска 98% осужденных успешно выдержали весь срок, в то время как две трети преступников из группы высокого риска сорвались. Оказалось, что даже самые приблизительные статистические модели позволили дать более точные прогнозы, чем это делали люди.
Однако у модели Берджесса нашлись и критики. Скептики спрашивали, все ли факторы, которые давали надежду на счастливый исход условно-досрочного освобождения, применимы всегда и везде? У них были свои резоны: не думаю, что определение «деревенщина» оказалось бы полезным при прогнозировании рецидивов преступлений в криминогенной среде неблагополучных городских кварталов. Другие ученые упрекали Берджесса за то, что он использовал все доступные ему данные, но не проверял, насколько они релевантны. Подвергали сомнению и сам метод оценки заключенных — в общем, это было всего лишь облеченное в формулы мнение специалиста. Тем не менее точность его прогнозов произвела столь сильное впечатление, что к 1935 году в иллинойсской тюрьме комиссия по условно-досрочному освобождению уже пользовалась его методикой. А к концу ХХ века математические модели, созданные на основе метода Берджесса, уже пошли в ход во всем мире.
Вернемся в наши дни — в залах судебных заседаний работают новейшие алгоритмы оценки рисков, куда более тонкие, чем первые схемы Берджесса. Оказывается, они не только облегчают работу комиссии по условно-досрочному освобождению, но и помогают определять, кого из заключенных можно освободить под поручительство и подбирать для них коррекционные программы, а в последнее время еще и подсказывают судьям, какой приговор вынести. Базовый принцип все тот же — загружается информация о подсудимом (возраст, история судимостей, тяжесть совершенного правонарушения и так далее), а на выходе получаем ответ на вопрос, насколько рискованно отпустить его на волю.
Как работают такие программы? Если не вдаваться в детали, в самых эффективных современных программах используется так называемый «метод случайного леса» (random forests), основанный на простейшей, в общем‑то, идее. Обычное дерево решений.
*Впервые условно-досрочное освобождение начали применять во Франции в 1700-х годах — осужденного выпускали на волю, если он обещал больше не совершать преступлений.
Оформить предварительный заказ книги можно по ссылке