Tasks of author attribution of text in the aspect of gender (on interdisciplinary interaction of linguistics and computer science)
The paper discusses the interdisciplinary interaction of linguistics and computer science in connection with solving the tasks of author attribution of the text in the aspect of gender. The problem areas of theory and practice of authorship expertise are defined. Since the problem of attribution of the author of the text is now addressed and resolved mainly on the material of works of art, we should solve the question of how these techniques will work if to use them on text material of other styles and discourses. There is a need to develop the problem of combining qualitative and quantitative methods of analysis and definition of the type of language units, statistical analysis of which is sufficient to identify the text. The paper points out common problem areas of gender linguistics and authorship expert works that need solutions. The authors emphasize the importance of involving findings of authorship expertise experiences in the paradigm of gender research, especially on unreflected formal attributes of the speech itself, as these are great signs of the opposition of male and female speech behaviour. There is a need in quantitative verification of features of "typical male" and "typical female'' speeches selected by qualitative methods. Authorship expertise requires active use of latest gender researches in the analysis. The solution of the complex tasks stated in the paper on theoretical and practical problems will be carried out in an interdisciplinary project performed by a team of authors from the Department of Complex Information Security of Computer Systems of Tomsk State University of Control Systems and Radioelectronics and the Department of General, Slavic-Russian Linguistics and Classical Philology of Tomsk State University. A research program was designed aimed at identifying the impact on the effectiveness of the applied methods of author attribution settings of 1) areas of communication, 2) length of the fragments of communication, and 3) ratio of detected asemantic and semantic units of text structures. Solution of the problems of authorship expertise requires a special empirical basis of research. The objectives of the first phase of the project are: 1) creation of a corpus of text of various discourses and marking it in accordance with the tasks of authorship expertise (in the first phase to form a corpus of short electronic messages is planned and its linguistic marking), 2) expansion of the list of features used to identify gender and studies on determining their information capacity for the problem, which will lead to the expansion of the functionality of the software complex "Avtoroved", 3) study of meta-classifiers in order to improve the accuracy of identification of the author of the text, 4) justification of the results by mathematical and contemporary linguistic methods, 5) synthesis of the previously obtained models and techniques to identify the author of the text.
Keywords
автороведческая экспертиза,
гендерная лингвистика,
междисциплинарные методы исследования,
информатика,
лингвистика,
authorship expertise,
gender linguistics,
interdisciplinary methods of research,
gender specification of author of textAuthors
Rezanova Zoya I. | Tomsk State University; Tomsk Polytechnic University | resso@rambler.ru; resso@mail.tsu.ru |
Romanov Alexandr S. | Tomsk State University of Control Systems and Radioelectronics | alexx.romanov@gmail.com |
Meshcheryakov Roman V. | Tomsk State University of Control Systems and Radioelectronics | mrv@ieee.org |
Всего: 3
References
Марков А.А. Об одном применении статистического метода // Известия Императорской Академии Наук. Сер. VI. 1916. Т. X, № 4.
Хмелев Д.В. Распознавание автора текста с использованием цепей А.А. Маркова // Вестник МГУ. Сер. 9: Филология. 2000. № 2. С. 115-126. URL: http://www.philol.msu.ru/~lex/khmelev/published/vestnik/vestnik2000.html
Шевелев О.Г. Разработка и исследование алгоритмов сравнения стилей текстовых произведений : автореф. дис.. канд. техн. наук. Томск, 2006.
Романов А.С., Мещеряков Р.В. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интел лектуальные технологии: По материалам ежегодной Междунар. конф. «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). М. : РГГУ, 2009.
Кирилина А.В. Гендер: лингвистические аспекты. М., 1999.
Горошко Е.И., Кирилина А.В. Гендерные исследования в лингвистике сегодня // Гендерные исследования. Харьков, 1999. № 2. С. 234-241.
Земская Е.А., Китайгородская М.А., Розанова Н.Н. Особенности мужской и женской речи // Русский язык и его функционирование. М. : Наука, 1993. C. 90-136.
Анищенко А.В. О гендерных особенностях реализации эмоциональных реакций // Гендер: Язык, Культура, Коммуникация : материалы Тре тьей Междунар. конф. 27-28 ноября 2003 г. М., 2003. С. 18-19.
Борисова Е.Г. Употребление междометий в речи женщин и мужчин // Гендер: Язык, Культура, Коммуникация : материалы Третьей Между нар. конф. 27-28 ноября 2003 г. М., 2003. С. 18-19.
Лорбер Дж, Фаррелл С. Принципы гендерного конструирования // Хрестоматия феминистских текстов. Переводы / под ред. Е. Здравомыс-ловой, А. Темкиной. СПб. : Дмитрий Буланин, 2000. С. 187-192.
Горошко Е.И. К вопросу о соотношении количественных и качественных методов анализа данных в лингвистической гендерологии // Ген-дер: Язык, Культура, Коммуникация : материалы Третьей Междунар. конф. 27-28 ноября 2003 г. М., 2003. С. 35-36.
Горошко Е.И. Судебно-автороведческая классификационная экспертиза: проблема установления пола автора документа // Зб. науково-практичних матерiалiв конференци «Теорiя та практика судово! експертизи i кримшалктики». Харюв : Право, 2003. Вип. 3. URL: ТЕКСТО
Вул С.М., Горошко Е.И. Судебно-автороведческая классификационная диагностика: установление половой принадлежности автора доку мента // Современные достижения науки и техники в борьбе с преступностью : материалы науч.-практ. конф. Минск, 1992. С. 139-141.
Вул С.М., Мартынюк А.Л. Теоретические предпосылки диагностирования половой принадлежности автора документа // Современное со стояние и перспективы развития традиционных видов криминалистической экспертизы. М., 1987. С. 105-112.
Романов А.С., Мещеряков Р.В. Определение пола автора короткого электронного сообщения // Компьютерная лингвистика и интеллекту альные технологии: По материалам ежегодной Междунар. конф. «Диалог» (Бекасово, 25-29 мая 2011 г.). М. : Изд-во РГГУ, 2011. Вып.
Романов А.С., Мещеряков Р.В. Идентификация авторства коротких текстов методами машинного обучения // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Междунар. конф. «Диалог» (Бекасово, 26-30 мая 2010 г.). М. : Изд-во РГГУ,
Кузниченко Л.В. Проблемы теории и практики судебно-автороведческой классификационной экспертизы. URL: http://www.law.edu.ru/doc/document.asp?docID=1308749. 2008 (Харьковский НИИСЭ).
Романов А.С. Структура программного комплекса для исследования подходов к идентификации авторства текстов // Доклады Томского государственного университета систем управления и радиоэлектроники. 2008. Ч. 1, № 2(18). С. 106-109.
Романов А.С., Шелупанов А.А., Мещеряков Р.В. Разработка и исследование математических моделей, методик и программных средств ин формационных процессов при идентификации автора текста. Томск : В-Спектр, 2011.