gatoazul (gatoazul) wrote,
gatoazul
gatoazul

Category:
По научно-популярным книжкам давно кочует одна идея. Дескать, для компьютерного перевода с одного языка на другой надо ввести язык-посредник: простой, логичный, без исключений. Тогда не нужно делать модули перевода каждого языка на каждый, что резко сокращает объем работы.

Уверен, что идея эта была впервые придумана еще в 50-х, а потом переоткрывалась не раз. Только что-то я ни разу не слышал, чтобы она использовалась хоть в одной реальной системе.

Очевидно, потому, что она слишком отдает гуманитарщиной и на практике бесполезна. Та часть ее, что нужно промежуточное представление, вполне здравая, но та, что это представление должно быть изложено на каком-то языке, как раз не годится.

Потому что язык исходно - это интерфейс общения с внешним миром, подогнанный под ограничения звуковой передачи (в частности, последовательного сообщения). Для представления информации он неудобен и в голове человека после прием перекодируется в какой-то внутренний формат хранения, уже не связанный с конкретной формой звуков, слогов и, в общем-то, слов. Любой язык слишком высокоуровнев и и требует ее дополнительного разбора.

Точно так же в компьютере гораздо удобнее держать представление сказанного чисто в формате каких-то организованных данных.

Примерно в таком духе:

Мама мыла раму:

pred[ref198](ref12, ref47) + [прошедшее время]

где pred198 - ссылка на словарную статью предиката "мыть", ref12 и ref47 - ссылки на статьи слов "мама" и "рама", пометка о прошедшем времени является атрибутом всего предложения, которое может передаваться в следующие для анализа, а пометка pred говорит о том, что "мыть" является главным предикатом предложения, его основой, и именно от него зависят два остальных слова.

Соответственно, из такой конструкции можно перевести предложение на другой язык, подставив соответствующие слова из другого языка, добавив синтаксическое выражение зависимости слов от предиката, соответствующее этому языку, и указание на прошедшее время.
Subscribe

  • Основной инстинкт

    Сын - год. На детской площадке перед ним кокетничают девочки двух-трех лет. Как правило, они залазят на горку, когда он стоит внизу и действуют по…

  • Под вагоном территория

    Как вы думаете, как украинская власть представляет себе свою страну? Хотя бы чисто географически. Ответить на этот вопрос несложно, поскольку есть…

  • Ложные друзья переводчика

    По американским воззрениям экономика состоит из трех частей: state sector - государственные предприятия, public sector - очень дохлая прослойка типа…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 27 comments

  • Основной инстинкт

    Сын - год. На детской площадке перед ним кокетничают девочки двух-трех лет. Как правило, они залазят на горку, когда он стоит внизу и действуют по…

  • Под вагоном территория

    Как вы думаете, как украинская власть представляет себе свою страну? Хотя бы чисто географически. Ответить на этот вопрос несложно, поскольку есть…

  • Ложные друзья переводчика

    По американским воззрениям экономика состоит из трех частей: state sector - государственные предприятия, public sector - очень дохлая прослойка типа…