
Раз в неделю мне приходит один и тот же вопрос: «у вас AI хуже человека или лучше?». Я уже устал отвечать «зависит», и решил, что проще один раз честно расписать, где зависит и от чего. За последние полгода я переслушал десятки книг в обеих озвучках — иногда один и тот же роман в живой и в AI-версии, чтобы поймать ощущение в моменте.
Никто не выигрывает по всем пунктам. Дальше — по категориям, в которых разница реально слышна.
Что AI делает лучше
Скорость, и это серьёзно. Студийная запись романа на 300 страниц — это две-четыре недели работы диктора. AI выкатывает ту же книгу за вечер. Разница не в «удобнее», а в том, что появляется целый класс книг, которые раньше озвучивать никто не брался — фанфики, малотиражные авторы, переводы из ниш. Они теперь существуют в аудио. Это качественный сдвиг, не количественный.
Стоимость. Простая студийная начитка — от нескольких десятков тысяч рублей. AI — порядок дешевле. Это меняет, кто вообще может позволить себе аудиоверсию книги. Раньше — крупные издательства. Теперь — любой автор, у которого есть pdf и желание.
Кастинг персонажей. В живой озвучке роскошь — два диктора, один мужчина, одна женщина. Три — большая редкость. AI берёт сколько надо, и не закатывает глаз, когда узнаёт, что в книге двенадцать персонажей. На фэнтези и детективах это не «приятный бонус», это меняет, как воспринимается диалог.
Стабильность. Живой диктор может устать в конце главы, перегнуть эмоцию или, наоборот, недодать. AI читает первую и сотую страницу одинаково. Иногда это плюс — особенно если книга длинная, а слушаешь в дороге, и ровный темп комфортнее.
Правки. Нашёл опечатку? У AI это перерендер двух предложений, минуты. У живого диктора — заново выехать в студию, переписать, свести с остальным аудио. Я как-то наблюдал, как поправка одной фамилии у живого диктора заняла неделю.
Что человек пока делает лучше
Интонация «между строк». AI читает то, что написано. Хороший диктор — то, что автор имел в виду. Тонкая ирония, скрытое раздражение, нежность сквозь сарказм — всё это AI забирает только частично, и в качественной литературе разница ощутима.
Выживание в нештатной ситуации. Латинская фраза в середине русского текста, неожиданное слово на иврите, японское имя — живой диктор подойдёт творчески. AI может прочитать «amor vincit omnia» по русским буквам, и это смешно ровно один раз.
Комедия. Самое слабое место AI на сегодня. Тайминг шутки — это пауза, которая длится на полсекунды дольше нужного, а потом обрывается одним словом. Это интуиция актёра, и AI её пока не воспроизводит. Юмористические книги в AI-озвучке проседают, и я лично воздерживаюсь их рекомендовать.
Поэзия. Там, где важен размер и ударения, расставленные по смыслу, а не по словарю, живой диктор опережает. AI стал лучше, но Пушкина в живом исполнении я бы выбрал.
Актёрская игра в сильных сценах. Когда персонаж плачет, рычит, шепчет в ужасе — хороший диктор делает мурашки. AI делает «технически грамотно». Разница маленькая, но она есть.
Где сравнение ничего не показывает
Есть категории, где спор «AI vs человек» вообще не имеет смысла — слишком близко.
Бизнес-книги, попсайенс, саморазвитие — AI и средний живой диктор тут одинаковы. Иногда AI лучше: не устаёт, не спотыкается, не заваливает интонацию на длинных предложениях.
Классику средний диктор не вытягивает — слышно, что читает по обязанности. Топовый диктор делает это так, что ради него и слушаешь. AI — стабильно хорошо. То есть в среднем он переигрывает «среднего» и проигрывает «топовому».
Детская литература — зависит. С искренним голосом живой диктор лучше. Без — AI с настроенным «тёплым» голосом стабильно приемлем.
Триллеры и детективы — спорно. AI ровнее, не пережимает напряжение. Живой даёт глубину. Кому что важнее.
Я провёл слепой тест
Не научный, а на друзьях, для интереса. Брал трёхминутный отрывок современной русской прозы, делал две версии — AI и живой профессиональный диктор. Включал друзьям подряд, не предупреждая.
Из двадцати человек большинство (четырнадцать) уверенно различить не смогли. Четверо угадали правильно, но сами говорили, что не уверены. Двое ошиблись — приняли AI за человека.
Это не доказательство, это снимок состояния. Разница в 2026 — тонкая, и слышат её далеко не все. Раньше она ловилась с первой секунды.
Простой принцип выбора
Не «AI или человек», а «что именно мне нужно сделать».
AI хорошо подходит:
- Фанфики и свои рукописи, которые иначе никто бы не озвучил.
- Нон-фикшн, бизнес, саморазвитие.
- Подкасты-чтения и аудиоверсии лонгридов.
- Переводы малоизвестных авторов.
- Личные проекты — дневники, мемуары, письма.
Живого диктора имеет смысл звать на:
- Бестселлеры с серьёзным аудиобюджетом.
- Детские книги для массового рынка.
- Поэзию.
- Комедийную прозу.
- Юбилейные издания, где озвучка — часть подачи.
Для подавляющего большинства того, что люди реально хотят слушать, в 2026 AI уже достаточен. Для остального — живой диктор оправдывает свои деньги. И это нормально, что они соседствуют — раньше не было выбора, теперь он есть, и пользуются им по-разному.
В 2020 я бы не написал такой текст. В 2028, скорее всего, его придётся переписать ещё раз.