Глава 1. обзор литературы
Выпускная работа по «Основам информационных технологий»
Магистранта кафедры теоретического и славянского языкознания Прижитомской Татьяны Петровны Руководители: доктор филологических наук профессор Мечковская Н.Б. старший преподаватель Апанасевич Т.А. Минск 2010 ОГЛАВЛЕНИЕ список обозначений к выпускной работе.. 3 реферат "возможности применения ит в лингвистике". 4 Введение. 4 глава 1. обзор литературы.. 7 глава 2. основные лингвистические программы и ресурсы, представленные в сети интернет. 12 2.1. Программы анализа и лингвистической обработки текстов. 12 2.2. Программы для автоматической обработки текстов. 13 2.3. Программы преобразования текстов. 13 2.4. Психолингвистические программы.. 14 глава 3. использование некоторых лингвистических программ в исследовании русскоязычных и англоязычных искусствоведческих текстов. 17 заключение. 26 список литературы к реферату. 27 предметный указатель к реферату. 29 интернет-ресурсы в предметной области исследования.. 30 действующий личный сайт в WWW... 33 граф научных интересов.. 34 тестовые вопросы по основам информационных технологий.. 36 презентация магистерской диссертации.. 37 список литературы к выпускной работе.. 38 приложение.. 41
Список обозначений к выпускной работе АОТ – автоматическая обработка текста АПТ – автоматическое понимание текста БД – база данных ДО – дистанционное обучение ИТ – информационные технологии КЛ – компьютерная лингвистика МП – машинный перевод ПЛ – прикладная лингвистика реферат Введение Становление современного информационного общества приводит к коренным изменениям во всех сферах жизни и деятельности человека. В сознании людей все больше утверждается мысль о том, что "будущий стратегический потенциал общества будут составлять не вещество и энергия, а информация и научные знания" [4, с. 3], что "мощь любого государства будет определяться не уровнем развития промышленности, новизной и эффективностью ее технической базы, а уровнем информатизации общества" [5, с. 9]. В недалеком будущем реально защищенным в социальном плане может быть лишь только широкообразованный человек, способный гибко перестраивать направление и содержание своей деятельности в связи со сменой технологий или требований рынка. В наши дни владение ИТ становится в один ряд с такими качествами, как умение читать и писать. Сегодня специалист с высшим образованием должен "свободно ориентироваться в мировом информационном пространстве, иметь необходимые знания и навыки поиска, обработки и хранения информации с использованием современных ИТ, компьютерных систем и сетей" [4, с. 3]. С вступлением общества в век компьютерных технологий появилась возможность более эффективной обработки и представления информации. Это позволило эффективно хранить и обрабатывать большие потоки информации. Но на современном этапе развития информационной культуры общества знания устаревают очень быстро, и человек вынужден учиться всю жизнь. Огромный объём знаний, накопленный человечеством, заставляет искать иные подходы к организации процесса обучения. Как отмечают в своей статье "Филология и современные информационные технологии (К постановке проблемы)" К.В. Вигурский и И.А. Пильщиков, "осознание фундаментальной роли информации в общественном развитии и огромные темпы роста ИТ обусловили необходимость формирования особой информационной культуры личности. Для использования новых компьютерных технологий в жизни требуется новое мышление, которое должно воспитываться у ребёнка с младших классов. Развитие и широкое внедрение информационных технологий воздействует на все сферы современной жизни, включая экономику, политику, науку и образование" [2]. ИТ – "этосовокупность методов и программно-технических средств, объединенных в технологическую цепочку, обеспечивающею сбор, обработку, хранение, распределение и отображение информации с целью снижения трудоемкости процессов использования информационных ресурсов" [6]. Сегодня использование ИТ значительно увеличивает эффективность функционирования любой сферы человеческой деятельности. Лингвистика не является исключением. Какими бы далекими областями, на первый взгляд, ни казались ИТ и лингвистика, неоспоримая связь между ними подтверждается хотя бы фактом существования компьютерной лингвистики (КЛ ) – "направления в прикладной лингвистике, ориентированного на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также всей сферы применения компьютерных моделей языка в лингвистике и смежных дисциплинах" [7]. Более того, если учесть, что главным предметом исследования в лингвистике являются тексты и что именно современные ИТ открывают новые возможности для обработки и анализа текстов и предоставляют разнообразные средства создания, распространения, поиска и учета текстовой информации, связь и взаимодействие этих двух сфер становятся еще более очевидными. Сказанное выше объясняет актуальность темы данной работы. Ее целью является анализ возможностей и эффективности применения ИТ в лингвистике в целом и в исследовании автора, связанном с изучением искусствоведческих текстов на английском и русском языках, в частности. Для достижения поставленной цели необходимо решить следующие задачи. · Сделать обзор литературы, посвященной применению ИТ в лингвистике. · Охарактеризовать основные лингвистические программы и ресурсы, представленные в сети Интернет. · Рассмотреть те программы и ресурсы, которые целесообразно использовать при исследовании искусствоведческих текстов. В связи с тем, что в ходе исследования необходимо изучить разнообразную литературу, делая при этом определенные выводы из прочитанного, освоить специфику использования различных программ обработки текстов, показывая их эффективность на конкретных примерах и сравнивая между собой, в работе применяются методы анализа, синтеза, дедукции, индукции, сравнения. Общая концепция работы состоит в том, чтобы, ознакомившись с литературой по теме и основными лингвистическими программами, понять, каким образом и насколько эффективно можно использовать ИТ непосредственно при обработке текстов искусствоведческой проблематики, и выяснить, имеют ли полученные с помощью ИТ языковые данные научную ценность для магистерской диссертации. глава 1. обзор литературы Среди существующих литературных источников, посвященных применению ИТ в лингвистике, стоит отметить следующие: "Информационные технологии в лингвистике" А.В. Зубова [4], "Основы искусственного интеллекта для лингвистов" А.В. Зубова и И.И Зубовой [5], "Автоматическое понимание текстов: системы, модели, ресурсы" Н.Н. Леонтьева [8], "Новые информационные технологии и лингвистика" Р.К. Потаповой [12], "Компьютерная обработка лингвистических данных" А.В. Всеволодовой [3]. В учебном пособии "Информационные технологии в лингвистике" А.В. Зубов определяет прикладную лингвистику (ПЛ ) как особую область лингвистики, "которая осуществляет реализацию лингвистических знаний с целью решения всякого рода практических задач" [4, с. 6], а также как "раздел языкознания, в котором разрабатываются методы решения практических задач, связанных с оптимизацией использования языка как важнейшего средства человеческой коммуникации" [4, с. 7]. Затем автор дает определение ИТ как "совокупности законов, методов и средств получения, хранения, передачи, распространения, преобразования информации с помощью компьютеров" [4, с. 8]. Кроме того, А.В. Зубов конкретизирует определение понятия "ИТ" по отношению к лингвистике и замечает, что ИТ в лингвистике – "этосовокупность законов, методов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров" [4, с. 8]. Далее автор перечисляет задачи прикладной лингвистики, среди которых: · создание систем искусственного интеллекта; · создание систем автоматического перевода; · создание систем автоматического аннотирования и реферирования текстов; · создание систем порождения текстов; · создание систем обучения языку; · создание систем понимания устной речи; · создание систем генерации речи; · создание автоматизированных информационно-поисковых систем; · создание систем атрибуции и дешифровки анонимных и псевдоанонимных текстов; · разработка различных баз данных для гуманитарных наук; · разработка различного типа автоматических словарей; · разработка систем передачи информации в сети Интернет и т.д. Интересно отметить, что А.В. Зубов также вводит понятия "лингвистической информации" и "лингвистической информатики". Так, под лингвистической информацией он понимает множество определенным образом связанных сведений, данных, понятий о языке и правилах его функционирования, отраженных в нашем сознании и влияющих на наше речевое поведение. А лингвистическая информатика – это "наука, изучающая законы и методы организации и переработки с помощью компьютера лингвистической информации" [4, с. 12]. В книге А.В. Зубова также освещаются такие вопросы, как: · основные составляющие ИТ (структура ИТ, методы решения задач с помощью ИТ, алгоритм и его свойства, способы записи алгоритмов, аппаратное и программное обеспечение ИТ); · общие принципы решения лингвистических задач методом моделирования; · ИТ в обработке текстов (автоматическое чтение текста, системы автоматического реферирования и аннотирования текстов, машинный перевод текстов); · ИТ в обучении языкам (создание технологии компьютерного обучения, компьютерные программы индивидуализированного обучения языкам, дистанционное обучение иностранным языкам); · БД и лингвистические информационные ресурсы (способы организации БД, системы управления БД, терминологические словари, письменные текстовые массивы) · основы компьютерных телекоммуникаций (компьютерные сети, глобальная сеть Интернет). Важно отметить, что изложение материала в пособии построено таким образом, что лингвисту становится понятно, что знание компьютера, умение обращаться с ним не требует усвоения основ математики, что каждый филолог может стать основным участником работ по созданию компьютерных систем обучения, систем автоматического анализа и синтеза текстов, систем автоматического поиска, аннотирования, реферирования и перевода текстов. В учебном пособии "Основы искусственного интеллекта для лингвистов" А.В. Зубов и И.И. Зубова заостряют внимание на том, что "необходима глубокая интеграция ИТ с лингвистическими и психологическими знаниями в рамках искусственного интеллекта" [ 5, с. 10], что "современное состояние исследований по искусственному интеллекту характеризуется нарастанием интереса к этой проблеме со стороны специалистов широкого профиля, в том числе и лингвистов" [5, с. 10]. Система искусственного интеллекта понимается как "компьютерная система, способная получать результаты, которые традиционно рождаются в процессе интеллектуальной творческой деятельности человека" [5, с. 10]. По мнению авторов, введение в вузах специализаций, направленных на изучение возможностей компьютеров в обработке речи и текстов ("Прикладная лингвистика", "Компьютерная лингвистика", "Автоматическая обработка естественного языка", "Компьютерное обучение языкам", "Лингвистика и новые ИТ") является необходимым условием дальнейшего развития информационного общества. В книге рассматриваются следующие проблемы: · интеллект и искусственный интеллект, основные задачи искусственного интеллекта, системы общения с компьютером на естественном языке; · экспертные системы, основные этапы их создания; · системы обработки связанных текстов, теоретические аспекты порождения текстов, системы порождения прозаических текстов (пословиц, поговорок, загадок, технических описаний, рекламных текстов, рассказов, романов), системы порождения русских стихотворных текстов; · система машинного перевода текста как система искусственного интеллекта. Таким образом, А.В. Зубов и И.И. Зубова предприняли попытку показать роль языка в создании систем искусственного интеллекта, моделирующих отдельные функции человека и помогающих ему в решении многих необходимых задач. В то же время результаты работы описанных в пособии естественно-языковых систем показывают, что они еще достаточно далеки от реальных текстов, создаваемых человеком. Отличительной особенностью данного пособия является его практическая направленность, благодаря которой читатель-лингвист при наличии желания сам сможет создавать модели порождения текстов, подобные описанным в книге. Учебное пособие Н.Н. Леонтьева "Автоматическое понимание текстов: системы, модели, ресурсы" обобщает опыт создания российских и зарубежных систем, реализующих АПТ. Эти сложные интеллектуальные системы выделяются из множества систем, в которых просто используется автоматическая обработка текста (АОТ), поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия – идея "мягкого" понимания текста. Представлена экспериментальная лингвистическая система ПОЛИТЕКСТ, осуществляющая гибкое соединение лингвистических и предметных знаний. К системам, реализующим АПТ, автор относит "системы машинного перевода, системы автоматического индексирования, системы информационного анализа массивов официальных документов и текстов СМИ, фактографические системы, системы общения на естественном языке с БД и другие сложные интеллектуальные системы" [8, с. 10]. Наибольший интерес в книге представляют следующие аспекты: · Взгляд "сверху" на системы АПТ (основные задачи и классы систем АПТ, модель "мягкого понимания" текста). · Машинный перевод как среда создания систем АПТ (классификация систем МП, лингвистическое обеспечение систем МП). · Компонент первичного анализа текста, компоненты морфологического и синтаксического анализа, локальный семантический анализ текста, глобальный семантический анализ и сжатие текста. · Системы генерации текста. · Корпусная лингвистика и другие лингвистические ресурсы для АПТ. Учебное пособие "Новые информационные технологии в лингвистике" Р.К. Потаповой посвящено современным проблемам использования новых ИТ в лингвистике и лингвистическом образовании. С учетом специфики данного аспекта знаний в пособии нашли отражение такие направления, как динамика становления интеллектуальных систем обучения, компьютеризация обучения в гуманитарных областях знаний (включая иностранный язык), назначение, специфика и концепция дистанционного обучения (ДО), гипертекст в лингвистике, новые ИТ и лингводидактика, автоматизированные обучающие системы. Под ДО Р.К. Потапова понимает "одно из новых направлений ИТ в образовании, которое связано с внедрением компьютерных сетей при передаче данных и позволяет осуществлять обучение независимо от расстояния" [12, с. 270]. А под информатизацией лингвистического образования понимается "внедрение таких средств и методов обучения языковой и межкультурной коммуникации, которые основаны на использовании новых ИТ для погружения в аутентичную языковую и культурную среду" [12, с. 273]. Автор книги замечает, что новые ИТ открывают широкие перспективы для разработки и эксплуатации новых образовательных технологий, направленных на создание представительных корпусов текстов, электронных словарей разных типов, справочных таблиц, текстовых массивов, а также программных электронных продуктов (анализирующих, синтезирующих, обучающих программ). К числу электронных продуктов лингвистического профиля Р.К. Потапова, например, относит различные типы электронных словарей, системы автоматизированного перевода, гипертекстовые системы энциклопедического типа, электронные БД, экспертные лингвистические системы, обучающие программы. В пособии А.В. Всеволодовой "Компьютерная обработка лингвистических данных", наряду с базовыми понятиями, методами и приемами использования средств вычислительной техники, рассмотрены передовые информационные и коммуникативные технологии глобальных компьютерных сетей; изложены основные направления фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления, обработки знаний и самых современных ИТ; рассмотрены типичные и специальные приложения КЛ. Значительное место автор отводит классификации лингвистических программ, детальному описанию их свойств и назначения, для чего размещает в Приложении Каталог лингвистических программ и ресурсов. Данный каталог взят из Русской виртуальной библиотеки. Программы, представленные в нем, будут рассмотрены в следующей главе. Таким образом, упомянутые выше и многие другие существующие пособия и книги, посвященные взаимодействию ИТ и лингвистики, свидетельствуют об актуальности данной проблемы, а также о повышенном внимании к ней как со стороны специалистов в сфере ИТ, так и со стороны филологов.
Популярное: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (177)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |