Лорел — Йенни
Наткнулась на интересную штуку в начале лета, а потом еще в Людвигочатике меня об этом спросили. Наконец руки дошли рассказать о любопытном эффекте «Лорел — Йенни».
Итак, в интернете появилась трехсекундная запись, на которой мужчина произносит одно слово. Половина народу слышит слово как Lorel, а вторая половина — как Yenny. (История с бело-золотым и синим платьем повторяется.)
Рассказываю, почему так происходит.

Каждый звук языка, который мы произносим, прежде всего является колебанием воздуха, как и любой другой звук (долгий «донннн» от удара металлической палкой по трубе или противный скрежет, когда вот гвоздем по стеклу). Воздух выталкивается из легких и проходит через речевой тракт — это все полезное для речепроизводства, что есть у нас в горле и во рту. Для разных звуков мы меняем форму горла, используем язык, смыкаем губы, прижимаем губы к зубам и делаем еще много всякого. По дороге иногда добавляется тон (то есть голос — у гласных он есть и у звонких согласных).
Все эти штуки влияют на физические свойства звука. Чтобы ясно их представить, звук переводят в визуальное изображение и получают веселые картинки — спектрограммы. На них обычно видны форманты — резонансные частоты, наиболее сильные для речевого тракта данной формы. Идет звук с определенными частотами из легких, гортань начинает колебаться. Совпадающие частоты усиливаются, получается резонанс — готова форманта. Форманты на спектрограммах — очевидные такие полоски. Они нумеруются от самой нижней вверх — первая, вторая, третья и так далее.
Так вот, наш мозг отличает один звук от другого в том числе по формантным частотам.

Но засада в том, что у некоторых звуков эти отличительные признаки, форманты, очень похожи. Например, [l] и [j] имеют третью форманту в районе 2500 Гц, а вторую — где-то около 700 Гц или ниже. У [o] и [e] высота формант разная (400 и 800 Гц против 400 и 1800 Гц), но она может меняться из-за того, что в речи мы произносим звуки слитно. Это называется коартикуляцией. Из-за коартикуляции форманты могут сливаться, съезжать — и то, как воспримет звук наш мозг, зависит от того, какие форманты он посчитает первой и второй. Так же похожи звуки, обозначаемые r и n. Первый — не согласный, а особый американский [o] с дополнительной артикуляцией, [n] — носовой, тоже близкий к гласным звук. А с [i] та же история, что и с [l] и [j].

То, как мы слышим это слово, зависит от тренировки слуха (в распознавании разных частот) и особенностей восприятия звуков мозгом (перцепции). Можно потренировать слух и научиться управлять слуховым восприятием (реально работает!).
Также спасибо за материал N + 1.