gatoazul (gatoazul) wrote,
gatoazul
gatoazul

Почему иностранная речь кажется белибердой

Потому что она иностранная, разумеется. Но вот почему в ней нельзя даже вычленить отдельные слова? Если, например, смотреть американское кино, то в нем можно расслышать только "окей" и "фак". Все остальное сливается в невразумительный поток.

Ответ простой: потому что в живой речи слова действительно не отделяются друг от друга. Пробелы на письме - это выдумка писцов, чтобы читать было удобней. Паузы в речи, конечно, имеются - в конце концов надо же когда-то набирать воздуха, но они стоят на границе не слов, а некоторых кластеров слов - обычно это главное слово кластера с примыкающими к нему зависимыми - определениями, местоимениями, артиклями. Более-менее заметные паузы есть только между такими кластерами - и между предложениями, потому что слова из разных предложений всегда относятся к разным кластерам.

Эту неприятную новость впервые узнали еще в 60-х - когда начали пытаться распознавать живую речь. Оказалось, что проблема сегменатации слов очень-очень непростая.

Как же ее решает наш мозг? Несколькими способами одновременно. Во-первых, в каждом языке есть особые интонации, так сказать, музыка речи, которая подсказывает, где что. Во-вторых, в построении слов всегда есть определенные закономерности - обычно стечения гласных или согласных, или же отсутствие таких стечений. В-третьих, мозг знает все слова, которые говорятся. Ну и в-четвертых, с задачей сегментации незнакомых слов мозг не всегда и справляется - особенно при плохом качестве звука.

Все эти способности вырабатыватся в детстве с помощью самонастраивающихся алгоритмов. Когда же вы слушаете чужую речь, у вас просто нет соответствующей программы для ее распознания. Ее можно выработать, как мы все знаем, но с трудом - путем предъявления мозгу огромного количества образцов для анализа, убедив его при этом, что это вам очень нужно.

Собственно, так же эта задача решается сейчас компьютерами - только без мотивации, поскольку машина и так делает все, что ей прикажут. Натаскивают нейронную сеть или систему, накапливающую статистику, на большом массиве живой речи.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 13 comments