| на главную | карта сайта | контакты |

РКА на FACEBOOK WEB-СООБЩЕСТВО РКА RJoC - ЖУРНАЛ РКА

НОВОСТИ
О РКА
КАЛЕНДАРЬ
ПРОЕКТЫ
БИБЛИОТЕКА
ИМЕНА
ПАРТНЕРЫ


ПОИСК На сайте
В Яndex


АРХИВ
НОВОСТЕЙ

2016 г.

  01-12

2015 г.

  01     02   05 - 06

2014 г.

  01     02     03     04   05     06     07     08   09-12

2013 г.

  01     02     03    04   05     06     07    08   09     10     11    12

2012 г.

  01     02     03     04   05     06     07     08   09     10     11     12

2011 г.

  01     02     03     04   05     06     07     08   09     10     11     12

2010 г.

  01

2009 г.

  01     02     03     04   05     06     07  -  08   09 -  10     11     12

2008 г.

  01  -  02     03 - 04   05     06     07    08   09     10     11 - 12

2007 г.

  01     02     03     04   05     06     07     08   09     10     11     12

2006 г.

  01     02     03     04   05     06     07     08   09     10     11     12

2005 г.

  01     02     03     04   05     06     07     08   09     10     11     12

 2004 г.

  01     02     03     04   05     06     07     08   09     10     11     12

 2003 г.

  03     04     05     06   07     08     09     10   11     12



Яндекс цитирования
 

ОРГАНИЗАЦИЯ УЧЕБНОГО ВЗАИМОДЕЙСТВИЯ С КОМПЬЮТЕРНОЙ СИСТЕМОЙ ТИПА "DATA MINING" В ПРОЦЕССЕ ИЗУЧЕНИЯ ЯЗЫКА ПРОБЛЕМНОЙ ОБЛАСТИ
(на примере системы "Текст Аналист" )

Крюкова О. П.
(Москва, Россия)

Статья опубликована : Социальная коммуникация в современном мире. Modern Social Communication / Сборник материалов российско-американской научной школы-семинара, 14-18 июня, 2004. - М.:ООО "Принт-Медиа", 2004. - 58 с. - С. 22-26

    Abstract
    The author discusses new opportunities created by systems of data mining for teaching foreign languages. There are evident advantages: one can save time working with minimal amounts of information in summaries, look through the vocabulary of the problem area using semantic nets and thematic trees. However, there are also problems. Acquisition of information depends to a great extent on the representation of frames - concepts or categories which man uses for processing, storage and retrieval of information. Frames mostly form background knowledge of man and are not found in the text often enough for the computer to mine them out. And Text analyst partly explicitly represents them in the results of data mining. This can be overcome: in Text Analyst there is a facility of editing semantic and thematic trees. The manual work can improve logical text organization and its automatic processing.

В настоящее время развивающееся научное направление искусственного интеллекта позволяет создавать компьютерные системы для автоматизации интеллектуальной работы человека с текстовой информацией на различных иностранных языках. К такого рода системам относятся и системы типа "Data mining" и рассматриваемая нами система Текст Аналист. Основной их функцией является языковая обработка текста для автоматического реферирования, вычленения ключевых слов и построения семантических сетей и тематических деревьев. Последнее дает возможность пользователю исследовать проблемную область путем поиска и навигации информации по выделенным компьютером словам. При этом можно увидеть их употребление в контекстах словосочетания, предложения и более крупных единицах текста. Операция просмотра слов через употребления в контекстах с учетом того фактора, что это слова, извлеченные из больших массивов текста, и составляет суть "Data mining", что буквально означает "выкапывание информации".

На больших объемах текстовой информации вручную это делать с такой скоростью и на различных языках невозможно. Получая такую информацию, пользователь может значительно ускорить процесс изучения новой для него проблемной области на иностранном языке, минимизируя объем читаемого материала, поскольку можно читать не основной текст, а реферат. При этом при автоматическом реферировании сжатие информации с сохранением основного содержания достигается примерно в 5 раз. Кроме того, большую помощь в исследовании проблемы оказывает наличие получаемых также автоматически ключевых слов семантических сетей и тематических деревьев с индексами их веса в тексте. Используя полученный индекс слов, можно просматривать их в различных контекстах употребления.

Для лингвиста - преподавателя, осуществляющего работу по структурированию и моделированию проблемной области для создания электронного учебно - методического материла система Текст Аналист могла бы быть ценным инструментом в такой разработке. Условием ее такой реализации является то, что при анализе текста, как и при его синтезе в работе пользователя с компьютером должно присутствовать фреймовое представление знаний. Наличие фреймов в интерфейсе компьютерной системы и в учебной среде в любой другой форме принципиально важно, поскольку именно это дает возможность пользователю - учащемуся увидеть философски и прагматически целое естественно - языковое и компактное представление модели проблемной области, которое и станет операционным во всех видах учебной и практической деятельности по анализу и синтезу текста.

Что при этом подразумевается под понятием "фрейм"? Мы исходим из определения, которое начало складываться в лингвистике и компьютерных науках уже давно (в 70- 90 годы), и продолжает развиваться в настоящее время. Фрейм (от англ. "рамка") - иерархически организованная структура, которая состоит из слов- понятий или "концептов" естественного языка. Возможность построения фрейма является результатом исторического процесса накопления человечеством знаний в слове - понятии, определяемом как итог познания. Структура фрейма - результат обработки и деления концепта в соответствии с его собственной полевой структурой значения, отражающей это развитие. В рамках данной структуры концепты соотносятся друг с другом в отношении "род-вид". Нижние уровни фрейма содержат "слоты", которые заполняются конкретной или искомой информацией. Последнее релевантно в том случае, если фрейм выполняет функцию "выводной" или дедуктивной модели для решения задач вероятностными и логико - лингвистическими методами. Экспликация содержания концепта путем его структурной обработки- деления и вывода конкретной информации - единиц таксономического уровня в слотах является эксплицитным представлением знаний, необходимым пользователю или учащемуся для обеспечения и управления знаниями в самостоятельной работе и решении задач.

Какие фреймы могут при этом использоваться и почему?

1. Онтологический фрейм, когда модель проблемы может просматриваться через призму категориального аппарата, восходящего к Аристотелю и получившему представление почти во всех грамматиках языка. Интерпретация реальной действительности предстает как языковая картина мира в определении его через понятия именования предметных имен, свойств, состояний, действий и др.

2. Фрейм прагматический, от греч. "pragma" - дело, действие, понятие "прагматика" определяется через понятие практическая деятельность, и все, что для нее ценно, исходя из породившего такое понимание этого термина философского направления, где действие и деятельность рассматриваются как наиболее важные проявления человека (См. работы Пирса, Дьюи, Джемса и др.). Для становления прагматического фрейма важен также и вклад психологии и лингвистики, которые дали свою трактовку деятельности на собственном материале. Языковая картина мира в данном фрейме может получить трактовку в системе таких понятий, как субъект деятельности, предмет и объект, адресат, цель средства, результат и др.

Полезным представляется также и традиционный синтаксический фрейм: подлежащее, сказуемое, определение, дополнение, обстоятельство. Раскрытие его на материале конкретной проблемной области должно продемонстрировать типичные словосочетания в функциональном аспекте.

Очевидно, что определенная часть такой лингвистической работы будет проделана ручным способом, поскольку машинный способ обработки не сможет извлечь из текста фреймов, если их ключевые понятия не содержатся в тексте. Однако такая работа представляется оправданной, поскольку она даст глубокую проработку языка проблемной области и как терминосистемы, и как системы подъязыка, важную и для пользователя, и для лингвиста - преподавателя, и исследователя, создающего комфортные для учащегося возможности изучения (чтения, разучивания, коммуникации, исследования) в компьютерной среде.

    Литература:

  1. Грицанов А.А. Прагматизм // Новейший философский словарь. Минск: Изд-во В.М. Скакун. - 1998, 540 с.
  2. Золотопуп О.Н., Колос В.В. Фрейм. // Компьютерная технология обучения. Словарь - справочник. Киев: "Наукова думка", 1992, 591 с.
  3. Касевич В.Б. Язык и знание. Язык и структура знания. - М.: Ин-т языкознания АН СССР, 1990, 189 с.
  4. Колос В.В. Язык представления знаний // Компьютерная технология обучения. Словарь - справочник. Киев: "Наукова думка", 1992, 624 с.
  5. Крюкова О.П. Интегрированная лингводидактическая технология. Автореферат дисс. на соискание ученой степени доктора филологических наук. М., 1998.
  6. Кубрякова Е.С. О понятиях места, предмета и пространства. // Логический анализ языка . Языки пространств. М.: Языки русской литературы, 2000, с. 84-92.
  7. www.TextAnalyst.ru

скачать статью в формате word Статья в Word

    Сведения об авторе:

    КРЮКОВА Ольга Павловна
    д.ф.н., профессор,
    зав. кафедрой английской филологии
    Российский государственный социальный университет,
    Москва
    e-mail: krukova-op@narod.ru



Вернуться в БИБЛИОТЕКУ Вернуться на главную страницу

 
Copyright © 2002-2015, Российская коммуникативная ассоциация. All rights reserved.
При использовании информации гиперссылка на www.russcomm.ru обязательна. Webeditor
::Yamato web-design group::