Top Banner
Г— ---------------------------------------- 1 у 1 т 11/Ж1 1 в*ч11'"^ п « *5$М 0202-2400 структурная | и прикладная 1 лингвистика 1 !»««*«• В** «• •» « «««« *•« 1 1
12

О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ● ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Mar 29, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Г— ----------------------------------------

(Г 1 у 1 т 11/Ж1 1 в*ч 11'"̂ п «*5$М 0202-2400

структурная |и прикладная 1лингвистика 1

! » « « * « • В** «• •» ««««« *•«

1 1

Page 2: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

ЛЕНИНГРАДСКИЙ ОРДЕНА ЛЕНИНА И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени А. А. ЖДАНОВА

СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА

Межвузовский сборник

В ы п у с к !

Филологический факультет СПбГУ К а ф е д р а

математической лингвистики

С. Л Ф а

ИЗДАТЕЛЬСТВОЛЕНИНГРАДСКОГО УНИВЕРСИТЕТА ЛЕНИНГРАД, 1978

Page 3: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Печатается по постановлениюРедакционно-издательского совета Ленинградского университета

Сборник «Структурная и прикладная лингвистика» содержит статьи, охватывающие широкий круг проблем современной теорети­ческой и прикладной лингвистики. На материале русского, англий­ского, немецкого и других языков рассматриваются актуальные во­просы семантики предложения, теории синтаксиса, проблемы изуче­ния связного текста. Сборник содержит ряд статей, посвященных применению математических методов в языкознании, исследованию статистических закономерностей как современных, так и древних текстов. Значительное место занимают материалы по проблемам лингвистического обеспечения автоматизированных информационных систем и систем управления, по вопросам научно-технической лекси­кографии.

Сборник рассчитан на филологов, специалистов по общему язы­кознанию, прикладной лингвистике и информатике.

Отв. редактор проф. А. С. Герд.

Издательство Ленинградского университета. 1978 г.

Page 4: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

ОТ РЕДАКТОРА

Среди различных общих: проблей структурной, прикладной и математической лингвистики в последние годы все более' от­четливо намечается поворот к собственно прикладной лингви­стике, к комплексным программным проблемам лингвистиче­ского обеспечения автоматизированных информационно-поиско­вых систем и систем управления (ИПС, АСУ, ОАСУ), к пробле­матике оптимизации различных звеньев автоматической обра­ботки текста, моделирования искусственных форм интеллекта* автоматического распознавания речи.

Современная прикладная лингвистика все более очерчива­ется как теория и практика автоматической обработки текстов научно-технических и текстов деловых документов, как практи­ческое лингвистическое направление, связанное с переработ­кой текстов в ЭВМ с обязательным последующим- промышлен­ным и производственным освоением и корректировкой получен­ных результатов.

Решение именно этих более общих проблем требует даль­нейшего изучения языка научной и технической литературы, деловых документов, вопросов стандартизации и унификации терминологии, теории научно-технической лексикографии, типо­логии научно-технических словарей, разработки различных ви­дов алгоритмов индексирования и автоматического анализа текстов и математического обеспечения решаемых задач.

В аспекте общелингвистическом большинство этих вопросо» связано прежде всего с дальнейшей разработкой проблем се­мантики, синтаксиса, лексикографии, формальных грамматик.

3

Page 5: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Первый выпуск сборника «Структурная и прикладная лин­гвистика» содержит статьи, написанные учеными кафедры ма­тематической лингвистики Ленинградского университета, а так­же и других вузов.

В I разделе сборника рассматриваются вопросы преиму­щественно теоретического характера, связанные с разработкой актуальных проблем семантики, синтаксиса, связного текста и психолингвистики. Во II разделе ряд статей посвящен приме­нению статистических методов к синхроническим и диахрони­ческим фактам языка, в III разделе освещаются различные во­просы собственно прикладной лингвистики (научно-техническая лексикография, создание информационно-поисковых тезауру­сов, лингвистические проблемы создания информационных си­стем разного типа, программированное обучение языку).

Page 6: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Н. Д. КРЕМНЕВА

О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ

Сопоставительное изучение грамматических микросистем ведется как в структурно-типологическом плане,1 так и в пла­не функционирования (индуктивно-характерологический тип ра­бот).2 В исследованиях второго рода практикуется несколько способов сопоставительного анализа: работа с одноязычными текстами разного функционального стиля, не тождественными по смыслу; работа с разноязычными текстами одного и того же функционального стиля, не тождественными по смыслу; тесты, проводимые с носителями языка на пересказ текста; тесты, предусматривающие пересказ иностранного текста на языке носителей, и др.

По сравнению с перечисленными способами сопоставления обращение к п а р а л л е л ь н ы м т е к с т а м является более экономичным (сравнительно с трудоемким тестированием), бо­лее надежным (сравнительно с работой над не тождественны­ми по смыслу текстами) и более целенаправленным (сравни­тельно с работой над текстами разного стиля). Подобно любому другому исследованию, работа сопоставительного характера может осуществляться применительно к задачам как анализа (грамматика восприятия), так и синтеза (грамматика порож­дения). При условии, что внимание исследователя межъязыко­вых соответствий сосредоточено на проблемах анализа, основ­ной результат должен выражаться: а) в установлении для каж­дого из языков некоторого перечня функциональных инвариан­тов и б) в расшифровке многозначных языковых форм, т. е. омонимичных (относительно выделенных инвариантов) средств выражения. Предположим, что в русский перечень инвариан­тов вошли значения настоящего конкретного действия (Нк),

1 См., например: Т и п о л о г и я каузативных конструкций. Л., 1969.2 См., например: Г и н з б у р г Р. С., X и д е к е л ь С. С. Сопоставитель­

ное изучение языков и практика преподавания. Самарканд, 1970.

146

Page 7: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

настоящего обычного, повторяющегося действия (Но), буду­щего и прошедшего конкретного процесса (Бк и Пк). Все эти- значения могут быть выражены одной и той же формой — фор­мой настоящего времени несовершенного вида, например: «Про­филактический осмотр производится два раза? в год» (Но);. «З авер ш аетс я строительство второго корпуса» (Нк); «В буду­щем квартале цех переходит на новую технологию» (Бк); «В го­ды войны он р аб о тает корреспондентом, а затем — редактором»- (Пк.). Таким образом, форма настоящего времени несовершен­ного вида представляет 4 омонима с точки зрения предложен­ного описания видо-временной информации.

В случае, когда исследование ориентировано на проблемы; с и н т е з а , основная задача состоит: а) в установлении длякаждого из языков такого числа перечней языковых вариаций,, которое соответствует количеству выделенных для данного язы­ка инвариантов (т. е. имеются в виду списки синонимичных от­носительно данного инварианта средств выражения; например:, значение Бк в испанском языке может быть передано с по­мощью 6 форм: Ри1иго 31шр1е, СопсНсюпа1 З1гпр1е, Ргезеп1е,. Ргезегбе бе БиЬрпБуо, а также личной формой глагола гг в Ргезеп1е или 1треНес1о плюс предлог «а» плюс инфинитив;: таким образом, с точки зрения предложенного инварианта эти 6 форм представляют собой перечень синонимов),, и б) в фор­мировании ограничений, накладываемых на функционирование вариаций (синонимов) нормами употребления. Ограничения в функционировании вариаций могут быть сформулированы в ви­де трех групп правил, согласно которым: 1) из синонимического ряда, соответствующего данному инварианту, исключаются еди­ницы, н е д о п у с т и м ы е в условиях данного контекста (пра­вила строятся на выделении типов контекста), — речь идет о< соотношении языковой нормы с нормой речи; 2) из синоними­ческого ряда соответствий, допустимых данным контекстом!, вы­бираются те, употребление которых обусловлено; н р и в ы ч- н ыми у с т а н о в к а м и , людей, говорящих на данном языке (путем статистических наблюдений над частотностью вариан­тов, реализующих данный инвариант) — речь идет о факторе «предпочтения»,3 проявляемого на уровне языка; 3) из синони­мического ряда соответствий с одинаковой степенью предпоч­тения на уровне языка выбираются те, которые поддерживают п р и в ы ч н о е (для речи на данном языке) р а с п р е д е л е н и е этих соответствий в связном тексте (путем статистических на­блюдений над очередностью и интервалами в употреблении ва­риантов, реализующих данный инвариант) — в данном- случае имеет место предпочтение на уровне речи.

3 Об опыте включения этого фактора в синтаксическую модель анализа! см.: Ц е й т и н Г. С. Методы синтаксического анализа, использующие пред­почтение языковых конструкций, — В- кн,: Международный семинар по ма­шинному переводу. М., 1975. .

10' 147

Page 8: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

Что касается разработки правил первой группы, то по этому вопросу имеется обширная литература (главным образом учеб­ная),4 так что обращение к параллельным текстам носит пре­имущественно контрольный характер. Например, значение Бк в придаточном предложении времени может быть передано на испанском языке только с помощью Ргезеп1е бе ЗиЬщпбуо, а в некоторых придаточных дополнительных — либо формой СопсИсюпа1 51тр1е, либо описательной конструкцией с глаго­лом 1Г в 1трегГес1о.

Построение правил второй и третьей групп, на первый взгляд, никак не связано с сопоставлением, поскольку речь идет о выявлении автономных закономерностей, упорядочивающих текст каждого конкретного языка в отдельности.5 Тем не менее для правил второй группы необходимо иметь в виду следующее: преподавательская и переводческая практика накопила по дан­ному вопросу большой опыт, ценность которого уже вполне осознана,6 однако трудно отыскать изложение соответствующе­го конкретного материала. С учетом этого обстоятельства изу­чение параллельных текстов представляется если не единствен­ным, то, во всяком случае, самым действенным способом выяв­ления языковых фактов указанного типа. Например, видовое значение повторности действия может быть передано на испан­ский язык либо чисто лексическим способом (бе пиеуо 'снова’), либо лексико-грамматическим (глагол уо1уег плюс предлог «а» плюс инфинитив), но второй способ предпочтительнее (но гру­бым подсчетам в пропорции 4: 1). Правила третьей группы также целесообразно строить с привлечением иноязычных текс­товых аналогов, так как при этом размежевание закономернос­тей, общих для сравниваемых текстов, и закономерностей ло­кального свойства происходит в наиболее корректных условиях. То, что в испанских текстах на 27 личных глагольных форм приходится 21 неличная, 29 отглагольных существительных и 3 —4 именных сказуемых (подсчет также очень приблизитель­ный), представляется их локальным свойством. Однако то, что и в испанских, и в русских текстах практически не встречается употребление трех и более неличных форм подряд (при отсут­ствии между ними сочинительной связи), заставляет предполо­жить проявление некоей универсалии.

Из всей проблематики, касающейся функционирования лич­ных видо-временных форм в русском и испанском языках, осве­щается следующий аспект: использование видо-временных форм

4 См., например: А р у т ю н о в а Н. Д. Трудности перевода с испанско- •го языка на русский. М., 1965.

5 П и о т р о в с к и й Р. Г., Т у р ы г и н а Л. А. Антиномия «язык — речь» •и статистическая интерпретация нормы языка. — В кн.: Статистика речи и автоматический анализ текста. Л., 1971.

6 См., например: Г а к В. Г. Русский язык в сопоставлении с француз­ским. М., 1975.

448

Page 9: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

русского глагола при формировании содержательных выводов из текста (на материале сравнения с испанским языком). Та­ким образом, 1) описание данных форм ограничивается распо­знаванием их значений; 2) испанский язык не является ни вход­ным, ни выходным объектом сопоставления, а выступает лишь в роли инструмента для более глубокого изучения фактов рус­ского языка; 3) под содержательными выводами понимаются выводы, представляющиеся существенными для функциониро­вания информационно-логической системы типа «запрос — от­вет».7 Это значит, что задача распознавания значений, заклю­ченных в анализируемой форме, в свою очередь сводится к рас­познаванию возможностей для извлечения содержательных вы­водов из речевой ситуации реализованной с помощью данной формы. Так, например, из сообщения Е1 сПгеНог Ьа рГап!еасГо !а сиезВбп бе . .. ‘Директор поставил вопрос о . . . ’ следует: «На момент речи этот вопрос ме снят с повестки дня» (благодаря форме Рге1егИо РегГес(о).

К началу сопоставительного анализа в перечень видо-вре­менных значений, предлагаемых для внутренней структуры рус­ских нехудожественных текстов, в числе других входили: Ног Нс (настоящее потенциальное, настоящее свойства), Нк, Пд (прошедшее конкретного факта, аорист), Нр (прошедшее ре­зультативное, перфект). В испанский перечень, кроме этих зна­чений, вошли еще ряд «кандидатов» в инварианты, среди кото­рых остановимся на Нп (настоящее продолженное) — глагол' е${аг в Ргезеп{е плюс герундий, Пи (прошедшее итоговое) — глагол ез1аг в Рге1егйо 51гпр1е плюс герундий или же форма Рге^егИо 31гпр]е и Пн (прошедшее начинательное) — глаголы ропегзе и есЬагзе плюс предлог «а» плюс инфинитив или же форма Рге^егИо $1шр1е.

Рассмотрим типы содержательных выводов для какого-то од­ного инварианта, например Пд. На этапе I было выделено три типа выводов. Первый тип связан с возможностью констатации существования всех компонентов ситуации. Например, из сооб­щения: В 1959 го д у в Ж е н е в е сост оялась кон ф ер ен ц и я п а зд р а в о о х р а н е н и ю следуют выводы: сущ ест вовала Ж е н е в а , с у ­щ ест вовала к он ф ерен ц и я , сущ ест вовало зд р а в о о х р а н е н и е и т. д.. Временное значение инварианта определяет «план прошед­шего».

Второй тип выводов связан с возможностью замены каждо­го из компонентов ситуации соответствующим «квантором» един­ственности: по кр а й н ей м е р е одн аж ды и м ела место к о н ф ер ен ­ция; по кра й н ей м ер е в одн ом месте и м ел а место к о н ф ер ен ц и я ; по кра й н ей м е р е о д н а кон ф ерен ц и я б ы л а п о свя щ ен а з д р а в о -

7 И л ь и н Г. М., Л е й к и н а Б. М., Н и к и т и н а Т. Н., О т к у п щ и ­к о в а М. И., Ф и т и а л о в С. Я. Лингвистический подход к задаче построе­ния информационной системы. М., 1971.

149

Page 10: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

охранению и -т. д. Временное значение инварианта определяет «план прошедшего», а видовое (при отсутствии специального по­казателя кратности) указывает на единичность действия. Тре­тий тип выводов связан с наличием в инварианте информации >о начале и конце действия: конференции не было какое-то вр е­мя до 1959 года и какое-то время после него. Здесь также су­щественны и временное и видовое значение инварианта.

Рассмотрим дополнительный материал, полученный в ходе систематизации испанских параллелей, или версий. Первое, что обратило на себя внимание, — довольно распространенное г(в обоих языках) выделение того или иного компонента высказы­вания при помощи предикативной конструкции (Е га еп е1 1959 сиапёо секЬго... и «Это в Женеве в 1959 году состоялась...» ). Так был выявлен еще один тип выводов, связанный с возмож­ностью обобщения каждого из компонентов высказывания путем введения родо-видовых понятий: «Женева — это город, в кото­ром в 1959 году состоялась конференция», 1959 год — это да ­та конференции, состоявшейся в Женеве», «Конференция — это мероприятие.. .» и т. д. Сами по, себе эти выводы существенны, «днако инвариант Пд никакой роли в их формировании не яграет. Сравним: Ж енева — это город, гд е было (есть, будет) много музеев.

Вторым типом версий, также распространенным в обоих •языках, является добавление глаголов мочь, уметь, удаваться :{«В мае экспедиция вернулась в город»— Еп е1 тауо рийо ое- .шг а Мозсй). Отсюда была выведена возможность формирова­ния следствия с неким признаком «успеха» в осуществлении упомянутого действия: «В 1959 году в Женеве смогла состоять­ся (удалось провести). ..» . Ведущую роль в формировании это­го типа выводов играет видовое значение инварианта — инфор­мация о свершившемся факте. Тем не менее, видимо, нецелесо­образно учитывать данный признак в строящемся варианте грамматики, принимая во внимание, что его информативная ^функция сводится скорее к актуализации сообщения, чем к со­держательной стороне, поскольку этот вывод представляется не чем иным, как «усиленным» вариантом самого сообщения. И, •наконец, еще одно р е ше н и е — понимать инвариант Пд как информацию не об отсутствии перфектного значения, а только ю допустимости его отсутствия, поскольку различение безуслов- шой и возможной результативности требует последующего «зна­ния» и потому представляется неосуществимым на внешнем •уровне: если Пр (Конференция проведена) означает ‘цель вы­сказывания -— обратить внимание на результат действия’, то из •Пд Конференция была проведена (состоялась) следует ‘возмож- (но, что цель высказывания — обратить внимание на результат’ .

Таким образом, при формировании перечня инвариантов роль основного дифференциального признака выполняют набо­ры содержательных выводов, а сами наборы корректируются с

.150

Page 11: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

помощью изучения иноязычных версий одного и того же текста. В ходе наблюдений над функционированием видо-временных форм в русско-испанских параллельных текстах наметились следующие выводы.

I. Значение продолженности, длительности с равной часто­той либо передается на русский язык (лексическими средства­ми), либо игнорируется: «Аналогичные научные коллективысоздаются в Чехословакии и Венгрии» — Зе ез1ап сгеапйо. ог§апоз сгепШшоз зппПагез еп СНесоз1оVа^и^а у Нипдпа, но «В ГДР и Болгарии создаются государственные службы со­циального прогнозирования» — Тап1о еп 1а КБА сото еп Ви1- §апа, е1 Ез1ас1о о г^ ат га з е т с ю з бе ргеушюп зоаа1. Учиты­вая отсутствие грамматических показателей продолженности в русском языке, а также практическую «несущественность» дан­ного значения для содержательных выводов, приходим к реше­нию не включать его в перечень русских инвариантов.

И. Значение подытоженное™ находит в русском языке регу­лярную аналогию в типе словообразования (ограничительный способ действия: проработать, постоять). На этом основании было бы логично включить данное значение в грамматику внут­ренней структуры, если бы не два убедительных контрдовода: отсутствие последовательного отражения этого значения при переводе в обоих направлениях («Три месяца шли эксперимен­ты» — Е1 ехрептеп!о йш д Дез тезез, но «В таких условиях группа проработала сорок восемь дней»— Е1 §гиро 1гаЬа]аЬа аз1 48 (Паз) и сомнения в практической значимости содержа­тельных выводов из этого значения (с позиций поставленной за­дачи). В итоге значение подытоженное™ также признается из­быточным.

III. Значение начинательности в испанском языке имеет два (помимо лексического) способа выражения: лексико-граммати­ческий (Еп1опсез зе ризтегоп а ехр1огаг ге^юпез уестоз — «То­гда начали разведку прилегающих районов») и грамматиче­ский (Ба гасНо НаЫд а 1аз 10 — «Радиопередачи начались в 10 часов»). В русском языке также наблюдаем регулярную аналогию; а) в типе словообразования (начинательный способ действия: заговорить, поплыть) и б) в описательной конструк­ции с глаголом стать («Расходы стали увеличиваться» — Ёоз §аз1оз епгрегагоп а сгееег). Учитывая наличие в обоих языках грамматического или полуграмматического оформления данного значения, существенность данного значения для содержатель­ных выводов и интересы экономного представления информа­ции, следует ввести это значение в перечень элементов, описы­вающих внутреннюю структуру русских нехудожественных тек­стов (т. е. в инвентарь грамматических средств глубинного син­таксиса). Кроме того, такое же решение (теперь уже в целях •соблюдения принципа единообразия в оформлении функцио­нальных аналогий) предлагается принять и в отношении двух

Page 12: О МЕТОДИЧЕСКОМ АСПЕКТЕ РАБОТЫ С ПАРАЛЛЕЛЬНЫМИ ТЕКСТАМИ ●  ON METHODICAL ASPECT WHILST WORKING ON PARALLEL TEXTS

других фазовых глаголов: продолжать и кончать, несмотря на их более низкую встречаемость и отсутствие в русском языке нелексических показателей данных значений.

IV. Формальное различение значений Но и Нс достаточно затруднено как в'русском языке, так и в испанском, так как для этого требуется обращение к широкому контексту, в данное время не предусматриваемое. Сравним: По утрам эти больные хорошо едят (зная о том, что больных кормят каждый день, мы интерпретируем эту фразу как каждое утро все имеющиеся в наличии больные хорошо едят, т. е. как Но) и По утрам боль­ные хорошо встречают гостей (зная о том, что гости приходят не всегда утром и приходят не ко всем, интерпретируем эту фразу как если к кому-то из больных по утрам приходят гости, то эти больные встречают гостей хорошо, т. е. Нс). Учитывая это обстоятельство, а также явную близость содержательных выво­дов из обоих значений (указание на кратность действия), пред­лагается для первичной модели внутренней структуры описан­ного типа ограничиться только одним значением, а именно Но, понимая регулярность действия либо как относительную (Нс), либо как абсолютную (собственно Но) в зависимости от предыдущего значения.

В результате получаем скорректированный фрагмент рус­ского перечня инвариантов: Но, Нк, Пд, Пр, Пн, Пп. (прошед­шее продолжения), По (прошедшее окончания).

152