Современное рабочее место переводчика. Технологические обеспечения перевода и использования интернета

Faq 19.06.2019
Faq

Данная работа посвящена изучению использования информационных технологий в переводческой деятельности.

На современном этапе переводческой деятельности особую значимость приобретает проблема использования инновационных технологий. К числу таковых по большей части относятся информационные и коммуникационные технологии.

За последние десять-пятнадцать лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись письменного перевода научно-технической, официальной и деловой документации. Сегодня, как правило, уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает от переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, и при этом удовлетворять принятым в данной стране стандартам. От переводчика требуется также умение эффективно использовать ранее выполненные заказы на ту же тему, а работодатель, в свою очередь, рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментов текста. Эти условия можно соблюсти лишь в том случае, если переводчик не только в совершенстве владеет родным и иностранным языком и глубоко изучил выбранную предметную область, но и уверенно ориентируется в современных компьютерных технологиях.

Таким образом, ИТ породили новую культуру передачи информации в электронном виде с одновременным значительным увеличением ее объемов. Под воздействием этого, а также с расширением международного сотрудничества существенно увеличилось количество информативных (нехудожественных) переводов в области науки, техники, экономики, юриспруденции и т.д. Изменился и сам характер процесса перевода, возникла необходимость повысить эффективность ПД за счет использования современных компьютерных технологий. Из изложенного выше можно сделать вывод о несомненной актуальности настоящей тематики.

Целью исследования является изучение возможностей оптимизации процесса перевода средствами ИКТ.

Достижение поставленной цели предполагает решение следующих конкретных задач:

1. Разработать универсальную модель цикла работы над переводом с использованием ИТ, описывающую последовательность действий, необходимых для квалифицированного выполнения и последующего сопровождения заказа на письменный перевод.

2. Проанализировать особенности использования ИТ в «переводческой деятельности»;

3. Провести анализ эффективности использования ИТ в переводческой деятельности и определить, способен ли компьютерный перевод заменить традиционный;

4. На основе полученных результатов дать прогностическую оценку перспектив развития ИТ в переводческой деятельности.

Объектом исследования являются этапы ПД, в частности непосредственно этап перевода и редактирования.

Предметом исследования выступает эффективность использования ИТ в ПД, в частности машинного перевода для осуществления перевода.

Научная новизна исследования заключается в попытке установить значимость использования ИТ в современной переводческой деятельности, определить степень влияния ИТ на качество перевода, разработать универсальную модель цикла работы над переводом с использованием ИТ.

Практическая ценность заключается в оптимизации процесса перевода средствами ИКТ и в результатах эффективности того или иного ПО в ПД, которые могут быть использованы при написании магистерской и в последующей переводческой деятельности.

Обоснованность и достоверность полученных результатов обеспечиваются согласованностью их с фундаментальными положениями дидактики и методики переводческой деятельности; логической структурой исследования; выбором методов исследования, адекватных цели и задачам работы; практической апробацией; внедрением результатов исследования в переводческую практику.

Согласно данным Европейского союза, к 2020 году 90% всех профессий в Европе будут связаны с информационными технологиями. Впрочем, уже сейчас они проникают в самые разные области науки, техники и являются составляющей частью практически любой деятельности.

Востребованность перевода в сфере информационных технологий тоже растет. Она совсем не ограничивается одним только переводом руководств для пользователя и технических описаний. Перевод в сфере информационных технологий включает в себя локализацию программного обеспечения, сайтов, мобильных приложений и компьютерных игр, проекты, связанные с внедрением Интернета вещей и многое другое.

Чем отличается перевод в сфере информационных технологий?
Прежде всего, обилием аббревиатур и сокращений.
Наличием специализированной терминологии, которая, к тому же, постоянно обновляется, ведь вся сфера ИТ стремительно растет и развивается.
Особой стилистикой, характерной только для этой отрасли.

Недавно мы сняли новый бесплатный видеоурок о переводе в сфере ИТ. Его можно посмотреть здесь:

Хотите попробовать свои силы в этом виде перевода? Хотите приобрести новые знания и навыки работы с текстами этой тематики?

Добро пожаловать на наш новый курс «Основы перевода в сфере информационных технологий»!

Для кого этот курс?
Начинающие и практикующие переводчики, желающие получить, систематизировать и/или дополнить свои знания в области ИТ-перевода.

Расписание:
Дата начала – ориентировочно июнь 2019 г .
Количество занятий – 8.
Периодичность занятий – 1 раз в неделю.
Дни и время – уточняются .

Преподаватель курса – , переводчик-фрилансер, преподаватель, независимый консультант по ИТ-переводу и локализации с 15-летним опытом работы в этой сфере.

Краткая программа курса:
1. Знакомство и введение. ИТ-терминология
2. Основы ИТ для пользователей
3. Перевод описаний программного обеспечения
4. Интернет: браузеры, Word Wide Web, протоколы передачи данных и т.д.
5. Аппаратное обеспечение: компьютеры и серверы, сетевое и телекоммуникационное оборудование, мобильные устройства
6. Антивирусное ПО, ИТ для бизнеса и перспективные направления в сфере ИТ
7. Введение в локализацию программного обеспечения
8. Перевод в сфере ИТ как бизнес, обзор отрасли, положение переводчика в отрасли.

Стоимость курса: 6000 или 8400 рублей в зависимости от выбранного .

Что входит в стоимость?
Обучение по заявленной программе с выполнением домашнего задания, полный комплект раздаточных материалов с видеозаписями всех вебинаров (высылаются всем в течение суток после лекции, независимо от присутствия на занятии), экзамен в конце курса, а также сертификат в электронном виде, высылаемый после обучения по эл. почте.

Как можно записаться на курс «Основы перевода в сфере информационных технологий»?
Чтобы записаться на курс «Основы перевода в сфере информационных технологий», нажмите на одну из кнопок «Записаться» или на и заполните заявку. Мы свяжемся с вами.

Транскрипт

1 романо-германской филологии РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ СД.Ф.4.3 Новые информационные технологии профессиональной переводческой деятельности для специальности Перевод и переводоведение курс 4 семестр 7 зачет практические занятия 18 часов самостоятельные занятия 82 часа Всего часов 100 Составитель: к.ф.н., доцент Шишигина О.Ю. Кемерово 2014

2 Рабочая программа дисциплины «Новые информационные технологии профессиональной переводческой деятельности» (цикл СД) составлена в соответствии с Государственным образовательным стандартом высшего профессионального образования второго поколения по специальности «Перевод и переводоведение».

3 1. Пояснительная записка Актуальность дисциплины «Новые информационные технологии профессиональной переводческой деятельности» обусловлена компьютеризацией текстовой деятельности, в т.ч. переводческой, и расширением технических возможностей осуществления перевода в последние десятилетия. Цель освоения дисциплины «Новые информационные технологии профессиональной переводческой деятельности» состоит в формировании и развитии у студентов практических навыков использования новых информационных технологий и Интернет-ресурсов в профессиональной переводческой деятельности. Дисциплина «Новые информационные технологии профессиональной переводческой деятельности» изучается в рамках цикла СД.Ф.4.3 в 7 семестре 4 курса. Общая трудоемкость дисциплины составляет 100 часов, из них 18 аудиторных, 82 самостоятельная работа. При изучения дисциплины «Новые информационные технологии профессиональной переводческой деятельности» используются компетенции, сформированные у обучающихся в результате освоения дисциплины «Теория перевода» (СД.Ф.1). Студенты должны владеть навыками работы на компьютере, знать и уметь использовать приемы лингвистического и информационного поиска в сети Интернет. Знания и навыки, приобретенные обучающимися в результате освоения дисциплины «Новые информационные технологии профессиональной переводческой деятельности», необходимы для изучения дисциплин «Перевод документации физических и юридических лиц» (ОПД.В.3), «Практический курс перевода» (СД.Ф.2), а также для прохождения переводческой практики в 8 и 9 семестрах. 2. Тематический план Название и Объем часов содержание Аудиторная работа Самосто Формы разделов, тем, Общий Практические орные работа Лаборат ятельная контроля Лекции модулей Дневная форма обучения 1 Истоки новых информационных технологий в переводе Опрос по заданиям 2 Лингвистические основы информационных технологий в переводе Опрос по заданиям

4 3 Область практической реализации информационных технологий 4 Системы машинного перевода 5 Автоматические переводные словари 6 Память переводов (Translation memory) 7 Современные интернет-ресурсы в работе переводчика 8 Эргономика труда переводчика Опрос по заданиям Постредактирование машинного перевода. Анализ ошибок Поиск переводных эквивалентов в электронных словарях Сравнительная характеристика ТМинструментов Обзор переводческих ресурсов сети Интернет, контрольный перевод Оценка и планирование рабочего места Формы контроля Формой промежуточного контроля является постредактирование машинного перевода и анализ ошибок, допущенных машинным переводчиком. Формой итогового контроля является зачет, включающий в себя контрольный перевод текста с использованием всех возможных информационных технологий и электронных ресурсов переводчика, изученных за время освоения дисциплины. 3. Содержание дисциплины Тема 1. Истоки новых информационных технологий в переводе Основные компоненты современных информационных технологий в переводческом бизнесе: 1) информационно-справочная база (электронные словари, справочники, энциклопедии, нормативно-терминологические

5 источники); 2) средства накопления, архивирования, поиска и восстановления фрагментированных переводов (системы «памяти переводов»); 3) средства подготовки, форматирования и конвертирования текстовых данных; 4) средства локализации текстов переводов и др. Первые опыты машинного перевода. Джорджтаунский эксперимент. Опыты автоматического перевода в СССР. Классификация систем машинного перевода Ларри Чайлдса: FAMT (fullyautomated machine translation), HAMT (human-assisted machine translation), MAHT (machine-assisted human translation). Социальные, лингвистические и технические факторы взаимодействия человека и ЭВМ. Появление первых автоматических переводных словарей. Новая концепция перевода, основанного на примерах (Макото Нагао). Зарождение систем класса «память переводов» (Translation Memory). Тема 2. Лингвистические основы информационных технологий в переводе Перевод как аналитико-синтетический процесс (анализ-трансфер-синтез). Основные теоретические модели перевода (О. Каде, А.Ф. Ширяев и др.). Оценка перевода с учетом факторов, определяющих успех в коммуникации. Роль прагматического компонента в классификации видов перевода (опыт Бюро переводов Комиссии Европейского Сообщества). Тема 3. Область практической реализации информационных технологий Лингвистический ингредиент промышленной продукции. Влияние роста объемов и изменения характера промышленного производства на переосмысление организационных процессов в переводческом бизнесе и автоматизацию труда переводчика. Проблема достижения функциональной равнозначности перевода. Проблема адаптации текста перевода в другой языковой среде и культуре. Локализация перевода. Тема 4. Системы машинного перевода Системы машинного перевода и Интернет. Система машинного перевода как лингвистический процессор: системы прямого типа, трансферные системы и системы семантического типа. Типология ошибок при работе систем машинного перевода. Эквивалентные, вариантные, трансформационные соответствия на лексическом, морфологическом, синтаксическом и текстовом уровне. Краткая характеристика систем машинного перевода PROMT и SYSTRAN. Проблема определения целесообразности использования машинного перевода. Основные преимущества и недостатки машинного перевода. Тема 5. Автоматические переводные словари

6 Лексический состав и объем традиционных и автоматических переводных словарей. Определение индекса надежности (кода качества, весового коэффициента). Основная единица традиционных и автоматических переводных словарей. Динамичность как главная черта автоматических словарей. Преимущества использования автоматических переводных словарей. Сравнительная характеристика многоязычных электронных словарей ABBYY Lingvo, Multitran, Multilex. Анализ их преимуществ и недостатков. Тема 6. Память переводов (Translation memory) Принципы работы ТМ-инструментов. Характеристика программы Translator s Workbench (возможные настройки и ситуации для перевода). Функция терминологического обеспечения на примере программы Multiterm. Сервисная программа Winalign. Программа TagEditor. Преимущества и недостатки использования ТМ-инструментов (на примере TRADOS, Deja Vu, Wordfast). Трудности при работе с ТМ-инструментами. Тема 7. Современные интернет-ресурсы в работе переводчика Характеристика функций и возможностей переводческих Интернет-сайтов, порталов, форумов, баз данных и т.д. (и др.). Использование языковых корпусов в работе переводчика (на примере корпусов Corpus of Contemporary American English, British National Corpus, Национального корпуса русского языка). Тема 8. Эргономика труда переводчика Проблема нормирования переводческого труда. Понятие эргономичности рабочего места. Организация рабочего места переводчика. Основные требования к аппаратным средствам рабочего места переводчика. Эргономическое уравнение: нейтральная поза + свободное движение + время для восстановления сил комфортная работа на компьютере, не причиняющая вреда здоровью. Соблюдение режима труда и отдыха, питания и гигиены.

7 4. Учебно-методическое обеспечение по дисциплине 4.1 Список основной учебной литературы 1. Гаврилов М. В. Информатика и информационные технологии.- М.: Юрайт, с. 2. Зубов А. В. Информационные технологии в лингвистике.- М.: Academia, c. 3. Семенов А. Л. Современные информационные технологии и перевод.- М.: Издательский центр «Академия», с. 4.2 Список дополнительной учебной литературы 1. Акопян А.В. Программы профессионального перевода.- М., Пушнов И.А., Семенов А. Л., Убин И. И. Перевод: проблемы и решения.- М.: Всероссийский центр переводов науч.- техн. лит. и документации, с. 3. Соловьева А. В. Профессиональный перевод с помощью компьютера.- СПб.: Питер, с. 4.3 Интернет-ресурсы Энциклопедии Encyclopaedia.com (Encyclopaedia Britannica (The Probert Encyclopaedia (Словари Multilingual dictionaries (OneLook Meta-Dictionary (Roget"s Thesaurus (The American Heritage Dictionary (The Wordsmyth Thesaurus () Лингвистические ресурсы ((((((((Переводческие ресурсы Bible (

8 Biographies (E-books (English (UK) political speeches (English (US) government press briefings (European legal documents in 11 languages (Онлайновые переводчики Babelfish translator (Freetranslation translator (Systran translator (Wordfast translation memory (Wordlingo translator (Форумы и порталы Aquarius (ATANET conference on translation and interpreting (Город переводчиков (Думать вслух (Proz.com - Translators Forum (Эргономика (5. Формы текущего, промежуточного и рубежного контроля 5.1. Вопросы и задания для индивидуальной и самостоятельной работы Тема 1. Истоки новых информационных технологий в переводе 1. Охарактеризуйте три этапа в истории развития машинного перевода. 2. Перечислите информационные технологии, значимые для переводческого бизнеса. 3. Что нового внесли автоматические переводные словари в идеологию автоматизации переводческой деятельности? Тема 2. Лингвистические основы информационных технологий в переводе 1. По каким параметрам перевод относят к аналитико-синтетическому процессу? 2. Каковы коммуникативные особенности перевода как аналитикосинтетического процесса? 3. Охарактеризуйте основные теоретические модели перевода. Тема 3. Область практической реализации информационных технологий 1. Дайте определение лингвистического ингредиента товарной продукции.

9 2. Чем обусловлена необходимость локализации и каково ее назначение? 3. В чем причины стереотипности современной текстовой информации? Тема 4. Системы машинного перевода 1. Дайте характеристику трех основных типов систем машинного перевода. 2. Назовите основные типы ошибок машинного перевода. 3. Переведите небольшой текст (1200 знаков) с помощью любой онлайновой системы машинного перевода (например, google translator), отредактируйте полученный перевод и объясните допущенные ошибки. Тема 5. Автоматические переводные словари 1. Назовите основные проблемы формирования современного словаря. 2. Назовите преимущества электронных словарей по сравнению с традиционными. 3. Каковы наиболее значимые средства повышения гибкости автоматического словаря? Тема 6. Память переводов (Translation memory) 1. Опишите принципы работы ТМ-инструментов. 2. Охарактеризуйте четыре ситуации перевода с применением ТМинструмента. 3. Посетите web-сайты основных производителей ТМ-инструментов и дайте сравнительную оценку их возможностей. Тема 7. Современные интернет-ресурсы в работе переводчика 1. Зарегистрируйтесь на основных переводческих сайтах (форумах, порталах) и дайте оценку их функций и возможностей. 2. Что такое языковой корпус и каковы принципы его создания и работы? 3. Покажите возможности использования языкового корпуса в переводческой деятельности на примере конкретных корпусов, доступных в режиме онлайн. Тема 8. Эргономика труда переводчика 1. Спроектируйте рабочее место переводчика с учетом санитарных норм и правил. 2. Дайте критическую оценку своего рабочего места и определите, соответствует ли оно результатам, полученным при выполнении первого задания. 3. Охарактеризуйте основные параметры эргономического уравнения и их влияние на производительность труда и состояние здоровья переводчика.

10 5.2. Примерный перечень вопросов к зачету 1. Истоки новых информационных технологий в переводе. 2. Перевод как аналитико-синтетический процесс. 3. Область практической реализации информационных технологий. 4. Локализация перевода. 5. Системы машинного перевода и Интернет. 6. Система машинного перевода как лингвистический процессор: системы прямого типа, трансферные системы и системы семантического типа. 7. Типология ошибок при работе систем машинного перевода. 8. Краткая характеристика систем машинного перевода PROMT и SYSTRAN. 9. Автоматические переводные словари: лексический состав и объем. 10. Преимущества использования автоматических переводных словарей. 11. Характеристика многоязычных электронных словарей ABBYY Lingvo, Multitran, Multilex (их преимущества и недостатки). 12. Истоки ТМ-инструментов. 13. Принципы работы ТМ-инструментов. 14. Характеристика программы Translator s Workbench (возможные настройки и ситуации для перевода). 15. Функция терминологического обеспечения на примере программы Multiterm. 16. Сервисная программа Winalign. 17. Преимущества и недостатки использования ТМ-инструментов (на примере TRADOS, Deja Vu, Wordfast). 18. Трудности при работе с ТМ-инструментами. 19. Современные интернет-ресурсы в работе переводчика. 20. Эргономика труда переводчика. Организация рабочего места переводчика.


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ для обучающихся по образовательной программе высшего профессионального образования подготовки магистров 45.04.01 Филология Профиль подготовки:

Белгосуниверситет (название высшего учебного заведения) УТВЕРЖДАЮ Ректор (название высшего учебного заведения) (подпись) (И.О.Фамилия) (дата утверждения) Регистрационный УД- /р. Теория и практика машинного

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Алтайский государственный педагогический университет» (ФГБОУ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Филиал федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Кемеровский государственный университет»

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ, ХРАНЕНИЯ И ПЕРЕДАЧИ ФИЛОЛОГИЧЕСКОЙ ИНФОРМАЦИИ для обучающихся по образовательной программе высшего профессионального образования подготовки

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Алтайский государственный педагогический университет» (ФГБОУ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Кафедра

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный лингвистический

Учреждение образования «Брестский государственный университет имени А.С. Пушкина» УТВЕРЖДАЮ Ректор учреждения образования «Брестский государственный университет имени А.С. Пушкина» М.Э. Чесновский 2011

Содержание 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПРОГРАММЫ... 3 2. ЦЕЛЬ ПРОГРАММЫ... 3 3. ПЛАНИРУЕМЫЕ РЕЗУЛЬТАТЫ ОБУЧЕНИЯ... 3 4. СОДЕРЖАНИЕ ПРОГРАММЫ... 5 4.1. Планируемый календарный учебный график... 5 4.2. Рабочие

Елабужский институт Казанского федерального университета ПЕРЕВОДЧИК В СФЕРЕ ПРОФЕССИОНАЛЬНОЙ КОММУНИКАЦИИ Дополнительная образовательная программа Елабуга 2016 Дополнительная образовательная программа

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный лингвистический университет» РАБОЧАЯ

ПННПУ Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Пермский национальный исследовательский

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ государственное образовательное учреждение высшего профессионального образования «Мурманский государственный гуманитарный университет» (ГОУВПО МГГУ) РАБОЧАЯ ПРОГРАММА

Нормативные документы Министерства образования РФ. Приказы О ПРИСВОЕНИИ ДОПОЛНИТЕЛЬНОЙ КВАЛИФИКАЦИИ "ПЕРЕВОДЧИК В СФЕРЕ ПРОФЕССИОНАЛЬНОЙ КОММУНИКАЦИИ" ВЫПУСКНИКАМ ВУЗОВ ПО СПЕЦИАЛЬНОСТЯМ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ЮЖНО-УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КАФЕДРА ЛИНГВИСТИКИ И МЕЖКУЛЬТУРНОЙ КОММУНИКАЦИИ СОГЛАСОВАНО: Зав. кафедрой лингвистики и межкультурной коммуникации УТВЕРЖДАЮ:

Основы лингвистического обеспечения АСОИУ Лекция 1 Компьютерная лингвистика К.т.н., доцент Филиппович Анна Юрьевна Лингвистика Лингвистика (от лат. lingua - язык) это наука о языке. Лингвистика = языкознание

«ЭЛЕКТРОННЫЕ ЛЕКСИКОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ» КАК УЧЕБНАЯ ДИСЦИПЛИНА ДЛЯ СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ УНИВЕРСИТЕТОВ Е. Е. ИВАНОВ МГУ им. А. А. Кулешова, Могилёв Подготовка филологов, преподавателей

Технологии и программные продукты компании ПРОМТ На сегодняшний день компания ПРОМТ обладает колоссальным технологическим багажом, что позволяет разрабатывать системы перевода с различными функциональными

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Социально-психологический

Системы автоматического (машинного) перевода текста История, основные сведения, описание. Лекция 10 Лингвистическое обеспечение АСОИУ К.т.н., доцент Филиппович Анна Юрьевна Автоматический (машинный) перевод

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный лингвистический университет» РАБОЧАЯ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный лингвистический университет» РАБОЧАЯ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный лингвистический

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Алтайский государственный педагогический университет» (ФГБОУ

Министерство общего и профессионального образования Российской Федерации УТВЕРЖДАЮ Первый заместитель министра В.М.ЖУРАКОВСКИЙ 1997 г Государственный образовательный стандарт высшего профессионального

Программа дисциплины "Перевод текстов общественно-политического характера"; 35.2 Лингвистика; старший МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное учреждение

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное учреждение высшего профессионального образования "Казанский (Приволжский) федеральный университет" Отделение

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Мурманский государственный гуманитарный университет» (ФГБОУ ВПО

Частное образовательное учреждение высшего образования «ЗАОКСКИЙ ХРИСТИАНСКИЙ ГУМАНИТАРНО- ЭКОНОМИЧЕСКИЙ ИНСТИТУТ» Кафедра лингвистики и гуманитарно-социальных дисциплин УТВЕРЖДАЮ Заведующий кафедрой лингвистики

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО- СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ»

ЭЛЕКТРОННЫЙ НАУЧНЫЙ ЖУРНАЛ «APRIORI. CЕРИЯ: ГУМАНИТАРНЫЕ НАУКИ» WWW.APRIORI-JOURNAL.RU УДК 371.123 6 2016 ИСПОЛЬЗОВАНИЕ ЭЛЕКТРОННЫХ СЛОВАРЕЙ И СИСТЕМ АВТОМАТИЧЕСКОГО ПЕРЕВОДА ДЛЯ ФОРМИРОВАНИЯ ПЕРЕВОДЧЕСКОЙ

Дополнительная образовательная программа «ПЕРЕВОДЧИК В СФЕРЕ ПРОФЕССИОНАЛЬНОЙ КОММУНИКАЦИИ» ОБЩАЯ ХАРАКТЕРИСТИКА ОБРАЗОВАТЕЛЬНОЙ ПРОФЕССИОНАЛЬНОЙ ПРОГРАММЫ ПОДГОТОВКИ ПЕРЕВОДЧИКА В СФЕРЕ ПРОФЕССИОНАЛЬНОЙ

Разработчик Кузнецова И.А. стр. 1 из 8 Версия 1 1.Пояснительная записка 1.1 Требования к студентам Для успешного усвния дисциплины «Автоматизированная обработка текстовых массивов» необходимы знания по

Учреждение образования «Белорусский государственный университет информатики и радиоэлектроники» УТВЕРЖДАЮ Проректор по учебной работе и менеджменту качества Е.Н. Живицкая 24.12.2015 Регистрационный УД-2-371/р

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное учреждение высшего профессионального образования "Казанский (Приволжский) федеральный университет" Отделение

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

Министерство образовани ФЕДЕРА Ц Ш и науки россш ской Федеральное государственное бюджетное образовательное учреждение высшего профессион пъного образов ания московский государственный лингвистический

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Алтайский государственный педагогический университет» (ФГБОУ

Министерство образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования «Южно-Уральский государственный университет» РАБОЧАЯ ПРОГРАММА Наименование

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Алтайский государственный педагогический университет» (ФГБОУ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный лингвистический университет» РАБОЧАЯ

2 Всего Лекции Всего Кол-во недель, в течение которых реализуется курс Лабораторные Практические Лабораторные Консультации РГР Курс. проекты (Курс. работы) Контрольные работы Иное ЦТ Структура дисциплины

МИНИСТЕРСТВО ОБРАЗОВАНИ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский государственный лингвистический университет

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

Федеральное государственное образовательное учреждение высшего профессионального образования «Алтайская государственная академия культуры и искусств» Институт дополнительного образования «УТВЕРЖДАЮ» Проректор

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

Учреждение образования "Белорусский государственный экономический университет" УТВЕРЖДАЮ Ректор Учрежд ия образования ""Белорусск ~ осударственный ~)sz!й университет" В.Н.Шимов " 6 ".. 009 r. РТио~ Удtr:.1-1-;;

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ В ОБРАЗОВАНИИ УДК 81"322 ББК 81.184 ОБУЧЕНИЕ СТУДЕНТОВ-ПЕРЕВОДЧИКОВ РАБОТЕ С ЭЛЕКТРОННЫМИ РЕСУРСАМИ КАК ОСНОВА ИХ БУДУЩЕЙ КОНКУРЕНТОСПОСОБНОСТИ И УСПЕШНОСТИ Шовгенина Евгения Александровна

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Новокузнецкий

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Новокузнецкий

В учебном пособии представлены основные теоретические положения переводческой деятельности как аналитико-синтетического процесса. Излагаются принципы компьютеризации текстовой деятельности. Рассматриваются теоретические основы практики использования современных информационных технологий письменного перевода. Наряду с лингвистическими проблемами затрагиваются наиболее актуальные организационные вопросы переводческой деятельности.
Для студентов старших курсов переводческих факультетов, слушателей системы повышения квалификации переводчиков, а также специалистов, заинтересованных в самостоятельном развитии навыков практического перевода.

Первые опыты машинного перевода.
Кропотливый труд переводчика, перенасыщенный множеством рутинных монотонных операций, в сочетании с творческой идеей переводческой деятельности, требующей интеллектуального подхода, всегда был в центре внимания революционеров науки и технологии.

Сразу же с появлением одной только идеи электронной вычислительной машины зародилась мечта о ее использовании в качестве электронного переводчика. Уже в 1946 г. эта мечта получила свое реальное воплощение в трудах американских ученых У. Уивера и А.Д. Бута. Они предлагали различные способы использования вычислительных машин для перевода текста с одного языка на другой. Очередным стимулом для развития научных исследований в области машинного перевода стала декларативная работа У. Уивера «Translation», опубликованная в 1949 г. В прогностическом плане ее автор обосновал возможность и целесообразность создания систем машинного перевода на базе ЭВМ.

Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Современные информационные технологии и перевод, Семенов А.Л., 2008 - fileskachat.com, быстрое и бесплатное скачивание.

  • Перевод, Теория, практика и методика преподавания, Латышев Л.К., Семенов А.Л., 2003
  • Учебник персидского языка для I года обучения, Иванов В.Б., Абольхасани 3., 2014
  • Основы языкознания для школьников, 5-8 классы, Факультативный курс, Методическое пособие, Дроздова О.Е., 2016

Следующие учебники и книги.

Информационные технологии в переводческой деятельности: преимущества, возможности - страница №1/1

М. В. Умерова

ГУ–ВШЭ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ: ПРЕИМУЩЕСТВА, ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ, ПЕРСПЕКТИВЫ РАЗВИТИЯ

The paper intends to explore modern systems of machine translation. Traditionally translation programs are divided i nto two types: ruled-based and example-based. Example-based systems work on the translation memory principle which prevails in modern computer programs applied for translation.
Сегодня к сфере информационных технологий в переводческой деятельности относят электронные словари, терминологические базы данных, справочники и энциклопедии, а также специальные программы, позволяющие осуществлять компьютеризированный (или машинный) перевод. Рассмотрим основные существующие на сегодняшний день прикладные программы, обеспечивающие компьютерный перевод текстов (Computer-Aided Translation).

Традиционно системы машинного перевода делятся на две категории: основанные на правилах (rule-based) и основанные на примерах (example-based). В первых глубже проработана грамматика, они в большей степени учитывают различные правила. Системы второго типа – самообучающиеся, они строятся на динамическом порождении языковых правил для конкретных текстовых примеров. Границы между системами example-based и rule-based не достаточно четкие, т.к. в обеих используются словари и правила работы с этими словарями. На сегодняшний день наиболее распространенной системой, построенной по принципу example-based является система TRADOS, работающая главным образом на примерах, практически без использования грамматических правил. Такого рода программы называются Translation Memory (TM-tools).

ТМ-инструменты позволяют сохранять в базе данных параллельные предложения: предложение из оригинала и его перевод. В базе данных могут сохраняться и более объемные текстовые фрагменты, но автоматически фиксируются именно предложения (программа обрабатывает текстовые фрагменты от точки до точки). В первый же момент начала работы над переводом предложения программа автоматически проверяет имеющуюся базу данных на наличие такого же или аналогичного предложения и предлагает уже имеющийся перевод. Таким образом, со временем база данных расширяется, что особенно быстро происходит в переводческих центрах, где работает большое количество переводчиков, осуществляющих множество переводов. Большинство таких программ устанавливаются как на персональном компьютере, так и применяются для сетевого использования. Использование общей базы данных всеми переводчиками позволяет выработать единый переводческий стиль всего переводческого агентства. Режим редактирования позволяет исправлять ошибки и исключить их повторение в дальнейших переводах.

Программы категории ТМ предоставляют функцию терминологического обеспечения, т.е. при обнаружении слова или словосочетания, помеченного в предыдущих переводах как термин, программа обращает внимание переводчика на этот фрагмент и предлагает уже имеющийся вариант перевода. Таким образом, принцип единства терминологии может выдерживаться всеми переводчиками агентства. Сегодня существуют готовые терминологические базы, которые могут предоставляться заказчиком перевода в виде дополнительного блока для имеющейся у переводческого агентства программы. Это позволяет ускорить процесс перевода и улучшить его качество.

Система TRADOS предназначена для больших переводческих центров, где накопилось много параллельных текстов. Она позволяет не переводить дважды одно и то же предложение, а находит аналогичное предложение в базе параллельных текстов и выдает уже сделанный когда-то перевод. При больших массивах однотипных текстов такой подход весьма эффективен. Понятие массива документов важно для машинного перевода. Большинство специалистов сходится во мнении, что машинный перевод возможен только для прикладных (технических) текстов, которые могут быть заданы определенными, зачастую просто гигантскими массивами. Художественная литература, при переводе которой приходится решать проблему выбора контекстуального значения многозначного слова, переводить игру слов, контаминированную речь, метафоры, аллюзии и другие стилистические приемы, не будет переводиться компьютером адекватно, по крайней мере, в обозримом будущем.

На российском рынке машинных переводчиков немного, и лидером среди них является система PROMT. По некоторым оценкам PROMT занимает до 95% рынка машинного перевода в России, причем его позиции сильны не только у нас, но и в Европе. PROMT – коммерческая разработка, поэтому внутренние алгоритмы программы недоступны широкому кругу исследователей. С этой точки зрения программа представляет собой, в некотором роде, «черный ящик», содержимое которого невозможно подвергнуть анализу. Но, с достаточной степенью уверенности, можно утверждать, что система использует двуязычные словари, снабженные необходимой лингвистической информацией: морфологической, синтаксической, семантической. Программа умеет отделять однозначные слова от многозначных, после чего однозначные слова переводятся по спискам эквивалентов. Для перевода многозначных слов используются специальные контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на предмет наличия или отсутствия контекстных определителей значения.

Известный ученый-лингвист Ю.Н.Марчук, чьи работы уже стали классикой прикладной лингвистики, уделяет немало внимания проблеме разрешения лексической многозначности при машинном переводе, которая разрешается с помощью обнаружения в тексте определяющих перевод многозначного слова лексических, синтаксических и морфологических детерминант. На сегодняшний день существует большое количество работ, посвященных закономерностям эксплицирования лексики, синтаксиса и семантики в рамках конкретных подъязыков, обладающих собственными лексическими, структурными, синтаксическими и семантическими особенностями.

Ю.Н.Марчук объясняет низкое качество переводов, выдаваемых многими системами машинного перевода тем, что конечный переводной текст рассматривается большинством разработчиков как композиция или сумма переводов его отдельных частей (подобно общеизвестному свойству порождения крупных единиц из более мелких). Но перевод не обладает этим свойством, и из корректных переводов отдельных частей текста нельзя автоматически получить правильный перевод всего текста в целом. Решение данной проблемы Ю.Н.Марчук видит в точном учете специфических особенностей предметного поля и лингвистического состава конкретных подъязыков (т.е. областей, заведомо существенно меньших, чем вся система естественного языка). Для таких языковых общностей как подъязыки возможно определять значение отдельных языковых единиц таким образом, что их совокупность (линейная комбинация) не противоречит идее цельного текста как такового. На этой теоретической основе и возникла идея создания контекстологических словарей для определенных типов текстов в рамках определенных семантических полей и подъязыков, которые сегодня помимо контекстов употребления включают и толкование. Контекстологические словари дают возможность создавать многоязычные терминологические базы данных для широких предметных областей.

Таким образом, контекстологический подход синтезирует две главные тенденции прикладного описания лексики – словарно-центрическую и текстоцентрическую. На текстоцентрическом подходе основаны многие действующие системы машинного перевода: основой описания лексики являются вспомогательные словари-конкордансы, которые возникают в результате анализа больших текстовых массивов. Основное значение здесь имеют текстовые употребления слова, т.е. совокупность его конкретных значений в данном типе текстов. В более ранних системах машинного перевода контекстологический словарь объединялся со специальным алгоритмом, который осуществлял запросы по каждому многозначному слову на наличие контекстных детерминант. Современные языки программирования позволяют реализовывать систему словаря, не соединяя его со специальной алгоритмической процедурой. На сегодняшний день существуют и другие способы разнообразной реализации словаря в компьютерной программе.

Наиболее важным результатом использования контекстологических словарей является эффективное решение проблемы лексической многозначности, ведь уже давно доказано, что именно лексические значения слов передают основную часть семантической информации предложения и текста в рамках дискурса определенной предметной области.

На сегодняшний день разработчики системы машинного перевода PROMPT предлагают интегрированную версию, объединяющую системы PROMT XT Professional и TM TRADOS. Алгоритм совместной работы этих двух систем выглядит следующим образом: сначала система TRADOS анализирует переводимый документ и выявляет сегменты, перевод которых отсутствует в базе или процент его совпадения с базой ниже заданного. Выявленные текстовые сегменты передаются в PROMT XT Professional для дальнейшего машинного перевода. Чтобы повысить качество осуществляемого перевода, пользователю необходимо предварительно настроить систему: выделить тематику переводимого документа, что подключит к работе специализированные словари и обеспечит единство терминологии во всем документе. Переведенные компьютером текстовые сегменты пополняют базу Translation Memory с пометкой о том, что они были созданы PROMT. При дальнейшей работе с документом в системе TRADOS пользователю остается только отредактировать их и сохранить в базе Translation Memory. Результатом совместного использования систем становится не только перевод документа, но и соответствующая база Translation Memory, которую можно использовать в последующих переводах.

Сегодня учебные программы большинства языковых вузов и факультетов предусматривают лекции о существующих системах машинного перевода, но далеко не во всех вузах есть возможности для ознакомления студентов с электронными переводчиками на практике. Так с 2005 года системы перевода PROMT и TRADOS поставляются в некоторые российские вузы (РГГУ, РГПУ им. Герцена и другие). Университеты разрабатывают спецкурсы по обучению работе с компьютерными системами перевода.

Разработчики предлагают очередную обновленную версию X-Translator Revolution, которая функционирует на основе нового ядра перевода, что значительно улучшило качество переводов. Программа предусматривает возможность работы с шестью европейскими языками в различных комбинациях. Есть специальное приложение для перевода сообщений в программе ICQ. Возможности перевода специализированных текстов расширены за счет выпуска новых словарей по тематикам «Коммерция», «Наука», «Техника», общий словарный запас которых составляет более 250 тысяч слов и словосочетаний. Подключение словарей позволяет улучшить качество переводов контрактов, финансовых документов, научных статей, технической документации. В качестве достоинства продукта разработчики выделяют привычный для большинства пользователей интерфейс в стиле Microsoft Office 2003, а также возможность перевода электронной почты и веб-сайтов в режиме онлайн.

Помимо коммерческих разработок в области машинного перевода есть и так называемые академические. Наиболее авторитетной является система ЭТАП, работающая для комбинации русского и английского языков. Для России данная система имеет такое же значение, как ставшая классическим примером система Systran для всего мира. ЭТАП положила начало целому научному направлению, ставшему основным в российских академических разработках в области машинного перевода. Технологии системы ЭТАП (в отличие, например, от PROMT) описывались в открытых публикациях. Сравнивая эти две системы, кандидат технических наук А.Сокирко в своих публикациях оценивает результаты работы PROMT как большую ориентированность на смысловую ясность перевода в ущерб его грамматической правильности в силу того, что PROMT ориентирован на конечного потребителя. Создатели ЭТАПА, как считает А.Сокирко, напротив, уделяют много внимания грамматической правильности перевода, т.к. ЭТАП является академической разработкой и ориентирован именно на корректность полученного результата. Попытка синтезировать эти два подхода (смысловая ясность и грамматическая правильность) была предпринята группой «Диалинг» (www . aot . ru ), которая вела разработки по созданию программы машинного перевода. Данная программа отличается наличием в ней так называемого поверхностно-семантического модуля, в основе разработки которого лежит процедура семантического анализа, хорошо известная в языкознании. Алгоритмическая реализация семантического анализа осуществляется не через привычное для лингвистов толкование, а с помощью графов (т.н. семантических деревьев), в узлах которых стоят слова или единицы, равные словам по объему. Отношения графа задаются перечнем и называются семантическими отношениями (например, отношения субъект – объект, субъект – аспект и т.п.). А.Сокирко показывает, как для каждого предложения входного текста выстраиваются свои собственные семантические структуры, на базе которых осуществляется машинный перевод. Приведем пример графа из статьи А.Сокирко:


Подобные графы могут включать не только слова, но и устойчивые словосочетания и обороты, абстрактные связки, жесткие синтаксические группы (например, «двадцать два мальчика») и т.п. На базе таких семантических структур перевод осуществляется следующим образом: по русской семантической структуре выстраивается такая же английская, с английскими словами и словосочетаниями в узлах, затем по семантической структуре синтезируется цепочка английских слов, что представляет собой многоэтапный процесс, требующий определенных временных затрат. Поэтому одним из слабых мест данной системы является медленная скорость перевода.

Белорусские лингвисты А.Чистяков и А.Скребнев в своих работах уделяют особое внимание еще одной системе, в которой процесс автоматического перевода построен на математической логике и статистическом вычислении вероятности. Разработки в этом направлении, основы которых были заложены известным ученым Францем-Иосифом Охом, ведутся уже более 15 лет. Сегодня на рынке доступен один коммерческий продукт этого направления – программа автоматического перевода Language Weaver. В данной программе не используются никакие словари, содержащие готовые к употреблению лексические и грамматические данные. Программа использует только параллельные тексты (аналогичный принцип используется в Translation Memory Tools), причем объем текстов очень значителен. Программа анализирует оригиналы и переводы, где встречается отрезок текста, схожий с тем, который сейчас необходимо перевести. Сопоставив множество вариантов переводов, программа выбирает тот, который использовался чаще всего. Таким образом, программа фиксирует степень вероятности, с которой, скорее всего, следует переводить данный отрезок текста, постепенно эта степень вероятности приближается к стопроцентной. При этом отпадает необходимость загружать специализированные словари (преимущество статистического метода перед трансформационными программами), т.к. программа сама генерирует постоянно используемый словарь, который ориентирован на данного конкретного пользователя. Создатели программы утверждают, что на сегодняшний день их система обеспечивает более высокое качество перевода по сравнению с другими системами машинного перевода.

Текст, подготовленный для перевода в программе Language Weaver, может быть представлен в различных форматах текстовых и даже звуковых файлов. Собранные параллельные тексты распознаются, и происходит их совмещение на уровне предложения для создания параллельного текстового корпуса. Этот текстовый корпус обрабатывается с помощью подпрограммы Language Learner, которая определяет вероятность того или иного перевода и составляет вероятностный словарь, шаблон или правило, т.е параметры перевода. Созданные параметры используются статистическим переводчиком-декодером при переводе новых текстов.

На нынешнем этапе разработки программа работает не полностью самостоятельно. Конечный вариант оценивает переводчик и выбирает из предложенного программой набора то предложение, которое наиболее соответствует по своей коммуникативной эквивалентности оригиналу. В последующих переводах выбранное предложение используется программой как шаблон или образец.

Данная система наиболее ярко представляет собой образец развития искусственного интеллекта и уподобляется авторами процессу овладения естественным языком ребенком: вначале ребенок срисовывает буквы и слова, не понимая их значения, а затем переходит к осмысленному переписыванию слов и выражений. Таким образом, данная система машинного перевода работает не с языковым материалом (значениями отдельных слов и словосочетаний, синтаксическими правилами), а с прецедентными текстами, т.е. со смыслами высказываний, представляющими собой элементы межкультурной коммуникации. При такой работе с текстами происходит трансформация языковой оболочки смысла как культурного явления, а не самого слова как явления языкового.

Как считают авторы, с увеличением технической мощности компьютеров увеличатся возможности обработки параллельных текстов, и компьютер сможет более или менее самостоятельно устанавливать интертекстуальные связи. Возможно, что в классических текстах обнаружатся математические законы построения. В частности, еще в прошлом веке возникли разделы математики, описывающие произведения Моцарта и Бетховена математическими формулами. Возможно, компьютер сможет работать и с такими паралингвистическими знаковыми системами как интонации и мимика.

Если в будущем будет решена проблема автоматической проверки адекватности перевода, то компьютер станет полностью самообучающейся системой, способной не только переводить, но и, в каком-то смысле, порождать тексты, в зависимости от того, какой «культурный багаж» будет в нем заложен в виде параллельных текстов.

На сегодняшний день компания Language Weaver выпускает очередные обновленные версии машинного перевода, в частности версию SMTS 4.2. В отличие от других электронных переводчиков SMTS (Statistical Machine Translation Software) использует методы статистического анализа, описанного выше, для изучения предложений, фраз и конструкций и выбирает наиболее подходящий вариант перевода среди множества доступных.

Используемая в программе поддержка вывода данных в формате TMX (Translation Memory eXchange) упрощает обмен информацией между SMTS и другими системами машинного перевода. В программу встроен фильтр, который позволяет переводить документы Microsoft Office (MS Word, Excel и PowerPoint) и выводить результаты перевода в оригинальном формате.

Таким образом, многие современные исследователи приходят к выводу, что качество машинного перевода будет совершенствоваться. Большинство специалистов по информационным технологиям сходятся во мнении, что адекватный перевод любого типа тестов, самостоятельно выполненный машиной, станет реальным через 50-70 лет с развитием возможностей искусственного интеллекта.

Литература:


  1. Марчук Ю.Н. Компьютерный перевод многозначных слов, 2000. www.philol.msu.ru

  2. Семенов А.Л. Основы общей теории перевода и переводческой деятельности. – М.: Издательский центр «Академия», 2008.

  3. Сокирко А. Будущее машинного перевода. // Компьютера №21, 5.06.2002.

  4. Чистяков А., Скребнев А. Компьютерный перевод как инструмент межкультурной коммуникации. – Витебск, 2005.


Рекомендуем почитать

Наверх