Новые научные методы для исследования библиотечной отрасли | Библиосфера. 2012. № 5.

Новые научные методы для исследования библиотечной отрасли

Описан опыт работы двух научных организаций с записями о публикациях сотрудников в базах данных (БД) Web of Science (WoS), Scopus и Российский индекс научного цитирования (РИНЦ). Уделено внимание собственным разработкам по применению необработанных данных, извлеченных из этих БД, позволяющим в автоматизированном режиме оперативно отслеживать основные библиометрические индикаторы по конкретной персоналии и организации в целом.

New scientific methods to investigate library branch.pdf Последние годы в информационной практике все больший интерес вызывают информетрические исследования. Отчасти это связано с тем, что накоплены колоссальные объемы библиографической информации различного вида, требующей качественно новых форм аналитико-синтетической обработки, отчасти – с более открытым и публичным доступом к наукометрическим БД, некоторые из которых бесплатны. Для облегчения работы с записями из БД их разработчики стараются внедрять новые инструменты, позволяющие конечным пользователям быстро получать как необработанную информацию, так и готовые данные в виде различных библиометрических показателей. В настоящей статье описывается опыт работы двух научных библиотек с записями о сотрудниках в БД WoS, Scopus и РИНЦ. Внимание уделено как встроенным в эти БД инструментам анализа данных, так и собственным разработкам по применению необработанных данных, извлеченных из WoS, Scopus и РИНЦ. Выбор именно этих БД продиктован тем, что в них хорошо охвачены дисциплины, являющиеся профильными для тех институтов, в которых проводились данные библиометрические исследования. С другой стороны, БД WoS рекомендована Министерством образования и науки для оценки результативности научной деятельности организаций Российской академии наук (РАН). Хорошей альтернативой WoS для российской науки явля-ется Scopus, поскольку предлагает более широкий охват российских журналов. Относительно РИНЦ заметим, что, по нашим наблюдениям, эта БД охватывает до 98% всех публикаций [1]. Целью нашей работы стало создание технологического комплекса, позволяющего, насколько это возможно, в автоматизированном режиме оперативно отслеживать основные библиометрические индикаторы по конкретной персоналии и организации в целом. Актуальность работы продиктована неудовлетворительным отражением во всех трех БД информации об организациях, при том что аналогичная ситуация наблюдается в зарубежных научных учреждениях [2, 3]. На наш взгляд, при текущем состоянии БД аналогичную работу необходимо проводить в каждом научном институте, от которого требуют библиометрические показатели вышестоящие инстанции или которому они необходимы для решения внутренних задач. Web of Knowledge (WoK) Сразу обратим внимание на тот факт, что поиск и по автору, и по организации в WoK недоработан. Предлагаемых опций для разграничения авторов с одинаковыми фамилиями/инициалами недостаточно для комфортной и точной работы с записями. Поиск по организации (адресу) в принципе возможен, однако требует создания очень сложного запроса, в который следует включать все возможные названия организации (их может быть несколько десятков). Но даже в этом случае результаты поиска не гарантируют полноту информации. Для частичного решения этих задач недавно был запущен сервис My ResearcherID. Он разработан для авторов статей и дает им возможность редактировать информацию о своих профилях. Примечательно, что авторы могут добавлять в свой профиль статьи, отсутствующие в БД WoK. В настоящий момент сервис тестируется, при этом выстроенный автором список его статей в My ResearcherID не коррелирует с самой БД WoK (на него дается лишь ссылка под первым авторским множеством). Между тем WoK анонсировал в будущем использовать данные авторских правок в основных БД [4]. В идеале для сбора наиболее полной информации о публикациях как сотрудников, так и организации в целом необходимо располагать информацией обо всех публикациях организации за все время ее существования. В этом случае достаточно единожды проверить список всех работ на наличие или отсутствие в WoK и выписать все идентификаторы статей (Accession Numbers). Затем эти идентификаторы ввести в расширенный запрос, и получить полный список публикаций организации. Следующим шагом, направленным на поддержание списка в актуальном состоянии, становится рассылка (Alert), созданная для каждого автора, работающего в организации. При индексировании статьи БД информация о ней направляется работнику библиотеки по электронной почте, после чего необходимо добавить идентификатор статьи в общий список идентификаторов организации. Акцентируем внимание именно на отработке полного списка статей при работе с любой БД, поскольку авторы в публикации зачастую указывают головную организацию, вообще не указывают ее или указывают другую организацию, в которой также числятся. Scopus Разработчики Scopus предлагают пользователям более широкий и, на наш взгляд, более продуманный инструментарий по работе с публикациями. В этой БД нет сервиса, схожего с My ResearcherID, однако хорошо развита система обратной связи, функционирующая через веб-интерфейс, электронную почту, а также в режиме онлайн. Пользуясь указанными каналами связи с технической поддержкой Scopus, авторы могут вносить изменения в свои профили, объединять их и удалять ошибочно приписанные им работы. Изменения вступают в силу в течение 3 недель. Так решается проблема множественности авторских профилей, причем обновленная информация отражается, в отличие от WoS, в самой БД. Аналогичные изменения, касающиеся организации в целом, могут вносить, пользуясь теми же инструментами, авторизованные представители организации. Таким образом, отработав список статей организации и объединив все варианты названий научного учреждения, можно создать единый профиль и впоследствии при необходимости дополнять его вручную. Заметим, что внесенные изменения будут доступны всем пользователям Scopus, а не только тем, у кого есть идентификаторы статей для расширенного поиска (как в случае с WoS). При работе со Scopus возможно и описанное нами для WoS создание сложного запроса по идентификаторам статей. Следует отметить, что в Scopus идентификатор статьи следует искать в адресной строке, поскольку, в отличие от WoS, он не указывается в явном виде, хотя сложный запрос по нему составить можно. РИНЦ Работа с БД РИНЦ в большой степени схожа с работой с БД WoS. Отличительная особенность РИНЦ – отсутствие авторских множеств. Однако оборотной стороной этого является большое количество статей, не отнесенных ни к одному автору. Для поиска и атрибуции своих статей создана надстройка Science Index, преследующая те же функции, что и My ResearcherID. Надстройка Science Index позволяет автору после прохождения регистрации редактировать информацию о своих публикациях. Отличительными особенностями выступает то, что работа возможна лишь с публикациями, проиндексированными в РИНЦ, а также то, что внесенные изменения будут отражены в самой БД, а не в отдельном списке. С одной стороны, это положительное свойство программы, с другой же, по нашим наблюдениям, ввиду недоработок системы возможны манипуляции с записями БД, как то: присваивание автором публикаций своих однофамильцев и цитирования к работам однофамильцев. Список организаций в РИНЦ также на первый взгляд однозначный, поскольку введена процедура регистрации организаций авторизованными представителями. Между тем бóльшая часть работ, как и в случае с авторами, не отнесена к организации, причем заявленный инструмент приписывания статьи организации через авторские профили не функционирует. Отметим анонсированную осенью 2012 г. возможность платного редактирования профиля организации ее авторизованным представителем. На момент написания статьи авторам еще не удалось протестировать заявленный сервис, но примечательно само его появление [5]. В зарубежных БД возможен импорт записей о публикациях во множестве различных форматов, что удобно для последующей обработки с помощью стороннего или собственного программного обеспечения. Обращение с данными из РИНЦ предполагает большой объем ручной обработки. В заключение обратим внимание, что рассмотренный программно-технологический комплекс находится в опытно-промышленной эксплуатации с конца января 2011 г. Данные, получаемые из WoS, Scopus и РИНЦ, полностью интегрированы в собственную БД трудов сотрудников Института нефтегазовой геологии и геофизики (ИНГГ) и Информационно-поисковую систему «Геология и геофизика» [6, 7]. Работа с БД Scopus прошла апробацию на полномасштабной отработке профиля организации в Государственном научном центре вирусологии и биотехнологии «Вектор» и ИНГГ СО РАН.

Ключевые слова

технологии обработки данных, библиометрический анализ, анализ цитирования, data processing technologies, bibliometric analysis, citation analysis

Авторы

ФИООрганизацияДополнительноE-mail
Мазов Николай АлексеевичИнформационно-библиотечный центр Института нефтегазовой геологии и геофизики им. академика А. А. Трофимука Сибирского отделения Российской академии науккандидат технических наук, заведующий Информационно-библиотечным центром Института нефтегазовой геологии и геофизики им. академика А. А. Трофимука СО РАН, тел.: (383) 333-22-16MazovNA@ipgg.sbras.ru
Гуреев Вадим НиколаевичГосударственный научный центр вирусологии и биотехнологии «Вектор»инженер информационно-аналитического отдела Государственного научного центра вирусологии и биотехнологии «Вектор», тел.: (383) 363-47-86gureyev@vector.nsc.ru
Всего: 2

Ссылки

Гуреев В. Н., Мазов Н. А. Изучение информационных потребностей ученых с использованием библиометрического анализа для оптимизации комплектования // Библиосфера. – 2012. – № 4. – С. 57–66.
Raan A. F. J. van. The use of bibliometric analysis in research performance assessment and monitoring of interdisciplinary scientific developments // Technikfolgenabschätzung – Theorie und Praxis. – 2003. – Bd 1. – S. 20–29.
Bibliometrics Publication Analysis as a Tool for Science Mapping and Research Assessment 2008. – URL: http://ki.se/content/1/c6/01/79/31/introduction_to_bibliometrics_v1.3.pdf (дата обращения: 12.10.2012).
ResearcherID integration with Web of Science (2012) : resource doc. – URL: http://wokinfo.com/5DAF/ (дата обращения: 10.07.2012).
Информационно-аналитическая система SCIENCE INDEX. – URL: http://elibrary.ru/projects/science_index/ science_index_org_info.asp (дата обращения: 12.10.2012).
Мазов Н. А. Оценка потока научных публикаций академического института на основе библиометрического анализа цитирования // Информационные технологии в гуманитарных исследованиях. – Новосибирск, 2011. – № 16. – С. 25–30.
Мазов Н. А., Гуреев В. Н. Проблемы идентификации метаданных в наукометрических базах данных Web of Knowledge, Scopus и РИНЦ на примере профилей авторов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса : 19-я междунар. конф. «Крым 2012» (2–10 июня 2012 г., г. Судак) : тр. конф. – М., 2012. – С. 1–4. – CD-ROM.
 Новые научные методы для исследования библиотечной отрасли | Библиосфера. 2012. № 5.

Новые научные методы для исследования библиотечной отрасли | Библиосфера. 2012. № 5.