«Полный бред!»: книга об искусстве сомнения «Полный бред!»: книга об искусстве сомнения

«Полный бред!»: книга об искусстве сомнения

Как распознать некорректную информацию в отчетах, графиках и новостях

Фантастический флер вокруг слов «искусственный интеллект» и «большие данные» подстегивает экономическую активность и вдохновляет сценаристов, но одновременно путает законодателей и стимулирует безосновательные ожидания и безответственные исследования. Карл Бергстром, эволюционный биолог и профессор Вашингтонского университета, и Джевин Уэст, доцент Информационной школы Вашингтонского университета, написали книгу о том, как развивать критический взгляд на реальность, какими признаками обладает дезинформация и чем грозят недостоверные данные.

Основные тезисы


Социальные сети, новости, отчеты ваших сотрудников полны чуши. Это не значит, что друзья или коллеги ежедневно врут вам. В отличие от прямой лжи чушь часто звучит правдоподобно, про нее нельзя однозначно сказать, ложь это или реальность в искаженном виде. Чушь использует язык науки и статистики, графики и сложные термины, поэтому так легко запутаться, не подумав о корректности подхода или релевантности исходных данных.

Когда вам сообщают о том, что средний рост мужчин — 170 см, стоит выяснить, откуда взялись эти цифры. Насколько полной была выборка, сколько человек было в ней, как мерили их рост? Авторы объясняют базовые операции измерения, различия между понятиями «связь», «корреляция» и «причинность», основные принципы работы с информацией и подробно разбирают проблемы искажения данных при их визуализации и обработке. Книга показывает, как некорректная диаграмма может вводить в заблуждение или неполные исходные данные приводят к формально правильным, но по сути неверным выводам в работе ИИ-систем. «Исследовать тонкости контроля над алгоритмами может быть скучнее, чем сочинять билль о правах роботов или изобретать способы спасти человечество от восстания суперинтеллектуальных машин, как в «Терминаторе», — признаются Бергстром и Уэст. — Но чтобы решить проблемы, которые ИИ ставит перед нами прямо сейчас, нам нужно понимать данные и алгоритмы, которые мы уже используем для решения более банальных задач». Среди этих задач (на самом деле совсем не банальных) — распознавание образов, о механизме которого доступно рассказывается в главе «Как машины видят».

Цитаты

Машинное обучение и искусственный интеллект всецело зависят от данных, которые они используют. С хорошими данными вы можете разработать, например, замечательно эффективный алгоритм для перевода с одного языка на другой. Но не существует волшебного алгоритма, способного превращать свинец в золото. Плохие данные ничем не компенсируешь. Тот, кто говорит вам иное, несет чушь.

В большинстве случаев нам не нужно детально разбираться в алгоритме обучения. Также нам ни к чему понимать, как устроена программа, которую он генерирует. (В так называемых моделях глубокого обучения никто, включая создателя алгоритма, на самом деле не понимает, как работает сгенерированная им программа.) Все, что вам нужно, чтобы найти проблемы, — проанализировать обучающий набор данных и метки, которые скармливают алгоритму.

Ни один алгоритм, каким бы логически надежным он ни был, не может преодолеть ошибку, заложенную в обучающих данных. Пионер компьютерных технологий Чарльз Бэббидж еще в XIX веке высказался по этому поводу: «Меня дважды спрашивали: „Скажите, мистер Бэббидж, если вы поместите в машину неправильные числа, выдаст ли она правильный ответ?..“ Я не способен представить, какая каша в голове могла бы породить подобную идею».


Зачем мне читать эту книгу?


«Полный бред!» — настольная книга для начинающего аналитика данных и любого, кто хочет научиться выделять достоверные сведения в потоке информации, которую ежедневно обрушивают на пользователей социальные сети и медиа.

Бергстром К., Уэст Дж. Полный бред! Скептицизм в мире больших данных. М.: Манн, Иванов и Фербер, 2022.