Оглавление

Методичка

Часть 3. Поиск и анализ научной литературы

3.1. Где искать статьи и патенты

Новые идеи для исследований не берутся из воздуха или какого-то метафизического общего информационного континуума, а формулируются на основе наблюдений. Наблюдать что-то можно в собственной лаборатории, на конференциях в докладах других учёных, а также читая научные статьи по вашей тематике. Более того, если идея пришла в голову, нельзя тут же приступать к экспериментам. Сначала стоит проверить, не сделал ли это кто-то до вас, с помощью поиска по базам опубликованных статей и патентов.

Общенаучные базы статей

Google Scholar — если вы решили загуглить свой вопрос, то делайте это в Академии Гугл. Здесь можно найти статьи, книги, диссертации и другие работы, размещенные на различных сайтах. Кстати, через него можно найти полные версии некоторых статей, к которым нет доступа.

Internet Archive Scholar — пожалуй, крупнейшая база статей с доступом к текстам. Опять же, там можно поискать полные версии статей, недоступные на сайте издательства.

ScienceDirect — база данных от издательства Elsevier, включающая статьи практически по всем областям наук.

SpringerLink — база статей и книг издательства Springer-Verlag по различным областям наук.

Web of Science — мультидисциплинарная база данных, которая включает журналы по естественным, социальным и гуманитарным наукам, позволяющая отслеживать цитирования (то есть используется для наукометрии). С недавних пор принадлежит Clarivate. Откровенно говоря, для меня интерфейс стал абсолютно непонятным, и я перестала туда заходить, кроме случаев, когда мне нужно указать ссылку на профиль автора при заполнении анкет.

Scopus — ещё одна база данных от Elsevier, содержащая рефераты статей и инструменты для анализа цитирования. Была создана как альтернатива Web of Science. В базу данных Scopus входят далеко не все журналы, и поэтому принято считать, что индексация в этой базе — один из показателей качества журнала и публикации. Доступ к Scopus для российских учёных сейчас закрыт.

eLIBRARY — база русскоязычных статей. Из-за отсутствия какого-либо отбора, помимо хороших статей, содержит кучу трешанины, которую обозревает канал КРИНЖ.

КиберЛенинка — ещё одна база русскоязычных статей, предоставляющая доступ к полным текстам работ. Придерживаются концепции открытой науки, за что им большое спасибо. С недавнего времени работают и с англоязычными статьями.

Отраслевые базы статей

PubMed — основная база работ по естественным наукам и медицине. Содержит миллионы статей и книг, так что, чтобы что-то найти, придётся научиться правильно составлять строку поиска.

IEEE Xplore — база статей, материалов конференций, технических стандартов по информатике, электротехнике и электронике, а также в смежных областях.

JSTOR — электронная библиотека статей, книг и первоисточников по гуманитарным и социальным наукам.

Cochrane Library — база результатов клинических исследований и систематических обзоров в области здравоохранения и медицины. Номер 1 в доказательной медицине. Если вы хотите узнать, работает ли очередной фуфломицин — смотрите там.

PsycINFO — база статей, книг и диссертаций в области психологии и социальных наук.

MedLine — база статей по медицине. Не содержит полных текстов, но содержит ссылки на внешние ресурсы.

ERIC — база статей, отчётов, диссертаций в области образования, предназначенная в первую очередь для преподавателей.

arXiv , bioRxiv , PsyArXiv — базы данных, содержащие препринты (то есть ещё не опубликованные версии) статей. В первом случае — по физике, математике и информатике, во втором — по биологии и медицине, в третьем — по психологии.

Базы патентов

Google Patents. Куда же без гугла. Отличная платформа, включает как российские, так и зарубежные патенты. Можно добавить галочку на поиск в google scholar и одновременно искать не только патенты, но и статьи. Очень удобно, если хочется быстренько прикинуть насколько идея оригинальная и не изучил ли её кто-то другой.

Федеральный институт промышленной собственности (ФИПС). База российский патентов и заявок на патенты. Поисковая строка организована не очень удобно, но с поллитрой разобраться можно.

PATENTSCOPE глобальная база данных Всемирной организации интеллектуальной собственности. Здесь можно найти международные патенты, а также национальные патенты, в том числе и российские. Хотя с последними достаточно не густо, по моему случайному запросу ничего отечественного не нашлось, хотя гугл справился и нашёл аж 19 патентов.

Евразийское патентное ведомство. База патентов стран участниц евразийской патентной конвенции, а именно Азербайджана, Армении, Белоруссии, Казахстана, Кыргызстана, России, Таджикистана и Туркменистана. Есть бесплатный и платный доступ, но для поверхностного анализа гостевого режима вполне достаточно.

Espacenet. Ещё одна база патентов со всего мира, на этот раз от Европейского патентного ведомства. Находит например китайские патенты на языке оригинала, а вот с российскими справляется не очень хорошо.

И ещё несколько национальных патентных баз:

Ведомство США по патентам и товарным знакам USPTO - база патентов США

Японская платформа патентной информации J-PlatPat - база патентов Японии

Корейская информационная служба по правам интеллектуальной собственности KIPRIS - база патентов Кореи

В базах полные версии статей не всегда доступны бесплатно, и я давала советы о том, как преодолеть эти трудности на канале АДовый рисёрч

шурик:

А что мне делать в этих базах данных? Просто вбивать свой вопрос?

АД:

Нет, в этих базах пока что нельзя общаться как с нейросетями, так что придётся вносить туда ключевые слова. Например, если интересно узнать изучал ли кто-то влияние фаз луны на настроение, то в поиск нужно вбить слова "фаза луны" и "настроение". Но так система может выдать много разного мусора, поэтому лучше всего будет уточнять поиск с помощью операторов

3.2. Как правильно искать статьи

По моим наблюдениям только 1 человек из 10 использует операторы при поиске в различных системах, а многие даже и не подозревают об их существовании. Но при правильном использовании оптимизация поискового запроса с помощью различных операторов позволяет очень легко отделять зёрна от плевел. Они в основном очень похожи во всех базах данных, поэтому здесь я постараюсь написать основные и дать скорее общие рекомендации по поиску.

Итак, операторы - это специальные команды или символы, которые позволяют уточнить запрос во вселенную.

Например, нас интересуют котики, тогда в строке поиска мы вбиваем слово "котик"

Оператор OR

Но котиков-то можно назвать по-разному. Кошка, кот, котэ, киска, кисуня, котёнок и так далее. И чтобы учесть все эти варианты написания можно воспользоваться оператором OR. Например,

котик OR кот OR киса

Оператор AND

Допустим, нас интересуют только рыжие котики, а другие - нет. Тогда можно воспользоваться оператором AND и поиск будет выдавать запрос где есть и котики, и рыжие. Например

рыжий AND (котик OR кот OR киса)

Заметьте, всю часть после AND я заключила в скобки, иначе система будет считывать только одно слово идущее за AND, а не разные его вариации. И также стоит помнить, что большинство систем по умолчанию ставит AND между словами, так что не всегда нужно его прям прописывать.

Оператор *

Сейчас наш запрос выглядит так, как будто русский школ был далеко. Котик у нас рыжий, но киса-то рыжая! И тут нам может помочь оператор *, который пишется в конце слова вместо любого количества пропущенных букв. И тогда наш запрос может стать уже

рыж* AND (кот* OR кис*)

Однако, эта фишка не работает в гугле, там * означает любое количество слов между двумя словами, например, если мы ищем не просто сочение "рыжий кот", а все вариации типа "рыжий наглый кот" и тд. Тогда запрос будет выглядеть как

рыжий * кот

Оператор ""

кавычки позволяют искать по точному совпадению фразы. Например, нам нужно, чтобы в запросе были рыжие коты и черные кошки. Тогда запрос будет

"рыжий кот" AND "черная кошка"

а с учётом возможности множественного числа

"рыжи* кот*" AND "черн* кошк*"

Оператор NOT

А что если в нашем запросе котик OR кот OR киса выдаются материалы с героем известного романа "Двенадцать стульев" Ипполитом Матвеевичем Воробьяниновым? А он нам тут вовсе не нужен. Тогда можно исключить его из рассмотрения с помощью оператора NOT или для гугла оператора -. Запрос тогда превращается в

(котик OR кот OR киса) NOT Воробьянинов

Оператор site:

Весьма полезный оператор для гугла, ищет информацию на определённом сайте. Например на сайте РНФ можно найти упоминания о 5 учёных с фамилией Котик и всего один проект с морскими котиками. Запрос выглядит так:

котик site:rscf.ru

Оператор [...]

В научных базах данных также можно добавлять конкретные места в статьях, где должно находится указанное слово, например в заголовке, абстракте или ключевых словах. Везде это оформляется по-разному, например, в PubMed, который я использую, с помощью [...]. Запрос в котором котики обязательно должны быть в заголовке статьи, а их цвет в абстракте будет выглядеть как

(cat[Title]) AND (coat color[Title/Abstract])

В других базах данных может быть по-другому и чтобы не запутаться, надо поискать в своей базе кнопку Advanced Search или что-то подобное. Там будут и самые популярные операторы AND OR NOT, и различные поля для поиска и дополнительные инструменты, например ограничения по годам публикации.

Шурик:

А всё-таки, разве нейросети не могут сделать поиск и анализ литературы за меня?

АД:

Чем-то они определённо смогут помочь, но важно помнить, что ИИ не всегда понимает контекст и его результат нужно перепроверять. Но если уж вы решили воспользоваться нейросетями, то лучше выбирать специализированные, а не просто случайную LLM

3.3. Как облегчить поиск с помощью ИИ

Мнение учёных по теме использования ИИ пока ещё противоречивое. Большинство, всё же, поддерживает новые сервисы, поскольку они могут облегчить и ускорить работу. Противники же считают, что использование нейросетей приведёт к тому, что люди перестанут сами анализировать что-либо. На самом деле, если человек полностью полагается на ИИ и не пользуется естественным интеллектом, то ему не место в науке. И, как верно подметил один из читателей АДoвого рисёча, "нейросети сильных сделают ещё сильнее, а слабых — ещё слабее".

Какими же ИИ сервисами можно пользоваться для работы с научной литературой

Consensus — туда можно задать вопрос, и ИИ ищет ответ среди PubMed, Semantic Scholar и других баз данных, а также даёт ссылки на исследования, откуда он взял результат. Ещё там есть очень удобный Consensus Meter, в котором можно оценить качество и количество статей, поддерживающих или опровергающих точку зрения. Например, большинство статей считают арбидол эффективным препаратом, но большинство хороших статей говорят, что нет.
Perplexity Academic — нейросеть, которая выдаёт ответы на вопросы, анализируя научные статьи. Но в отличие от Consensus, не анализирует рейтинг журналов, количество цитирований и т.д.

SciSpace — помимо стандартного (имхо, весьма слабенького) бота для вопросов, имеет ряд интересных фич. Например, умеет перефразировать предложения, оформляет цитаты, пересказывает простым языком куски статей. Ещё он умеет превращать статьи в презентации и в видео, но эта функция работает пока коряво, мои статьи он не смог нормально переварить.
Research Rabbit — очень классный инструмент, позволяющий строить взаимосвязи между статьями и находить похожие исследования. Кажется, скоро станет незаменимым при подготовке обзорных статей.
Litmaps — по функционалу очень похож на Research Rabbit, но немного другой интерфейс и принцип сбора карты. Если в Research Rabbit сразу выдаются тысячи похожих статей и далее нужно отбирать нужное/ненужное, то тут надо добавлять похожие статьи, и на основе этого генерируются всё новые и новые рекомендации. Обе программы, кстати, синхронизируются с Zotero.
AlphaXiv — ищет литературу по разным источникам плюс выступает как самостоятельная библиотека. Очень классная фишка — краткий конспект статьи (кнопка blog). Также выступает как соцсеть: статьи можно комментировать и делиться своими заметками.
Elicit — делает достаточно подробные обзоры, в том числе систематические, по заданной тематике. Попробовала спросить по тематике своих исследований — справляется в целом неплохо. Но хочет денег за полный функционал, так что я не смогла оценить по достоинству.
Writefull — интересный сервис, который позволяет делать текст более академичным, а также умеет придумывать заголовки по абстракту и абстракт по тексту статьи. В этом плане может быть хорошим подспорьем в случае творческого кризиса.

Шурик:

Класс, у меня как раз была отличная идея для исследования, я поискал по всем базам и никто её ещё не проверил! Надо приступать к работе!

АД:

Подождите, помните о чём мы говорили? Ваша идея должна быть не только новой, но ещё и актуальной. Актуальность обычно проверяется с помощью анализа трендов

3.4. Как понять актуальность темы исследования

Поиск по базам статей и патентов позволяет понять новизну исследования, то есть не сделал ли его уже кто-то другой. Но что с актуальностью? Где по отношению к научным знаниям находится ваше исследование? Может оно вышло из моды или никогда и не было интересным? Или наоборот тема только набирает обороты или находится на пике популярности? Понять это поможет анализ трендов

PubMed. Если вы введете поисковый запрос, то слева можно увидеть гистограмму с количеством публикаций по годам. Например, можно посмотреть распределение по тем же коронавирусам: до пандемии интереса к этой теме было немного, и выходило 500-800 статей в год. Зато в 2020 году интерес возрос примерно в сто раз, а сейчас видно, что тема уже потихоньку себя исчерпывает. Так что, если вы хотели начать исследование на эту тему — забудьте, это уже неактуально.

Другие базы статей, такие как ScienceDirect, SpringerLink, Web of Science, Scopus, сами не строят красивую гистограмму по годам, однако вполне выдают результат по количеству публикаций по заданной тематике за каждый год. Если нужна визуализация, то придется вручную переносить данные в условный Excel и смотреть график там.

Google Trends анализирует количество поисковых запросов в гугл. Так что можно понять популярность темы не только среди учёных, но и среди всех, кого не забанили в гугле. Там же можно сравнить различные запросы. Например, если посмотреть на частоту запросов со словом "грипп", то можно увидеть чёткую сезонность, а также пик в 2005, совпадающий с пиком птичьего гриппа и в 2009, совпадающий с эпидемией свиного гриппа.

Яндекс Вордстат - наш ответ гугл трендам. Показывает статистику поиска в Яндексе. Уж не знаю какой процент учёных ищет информацию через Яндекс, но знать о наличии инструмента всё же стоит.

VOSviewer - это программа предназначенная в первую очередь для визуализации карт публикаций, авторов, журналов, ключевых слов и других научных данных. Туда нужно загрузить базу статей, которую предварительно нужно скачать с pubmed, Web of Science и так далее. Далее программа создаёт кластеры ключевых слов, тем, направлений исследований, взаимодействий стран и университетов и так далее, а главное позволяет проследить как менялись эти данные в течение времени.

SciVal - это аналитическая платформа, разработанная Elsevier, которая позволяет оценивать значимость отдельных исследований, строить связи между различными темами и собственно анализировать тренды.

Dimensions - это база данных научных публикаций, грантов, патентов, клинических испытаний и других видов академической информации. Там можно посмотреть топовых авторов, объемы финансирования, а также оценить объемы цитирования. Платформа также умеет делать отчёты с красивыми картинками

Altmetric - это база с упоминанием исследований в социальных сетях, новостных сайтах, блогах и разных онлайн-платформах. По сути позволяет вычислить какой общественный резонанс вызывает та или иная тема или конкретная научная работа.

TrendHunter - интересный сайт, агрегирующий свежие идеи из различных областей науки и просто жизни. Это скорее не проанализировать твою идею, но подсмотреть чужие. Например одна компания совместно с NASA делает кремчики на основе стволовых клеток, выращенных в биореакторе на орбите. Цены на такой крем будут космические.

Также можно искать различные статьи, посвященные трендам и трендбуки, которые составляют специально обученные люди.

3.5. Как организовать хранение литературы

Итак, благодаря поиску в разных базах и помощи ИИ, мы можем найти кучу статей по нашей теме, но запомнить такой объем прочитанного почти невозможно. В начале научной карьеры я завела себе специальную статейную тетрадь, в которую для каждой статьи выписывала дизайн эксперимента, основные выводы и полезные заметки. Также я видела, как люди делают нечто похожее в Word, в том числе онлайн, а также создают иерархию среди документов и оглавление с подуровнями. Но на самом деле это можно сделать гораздо проще с помощью специальных программ.

Mendeley - значительная часть людей всё ещё пользуюсь им, хотя в последние годы он субъективно стал хуже. Раньше у них был Mendeley Desktop, и, к счастью, его всё ещё можно скачать, но теперь основным является Mendeley Reference Manager, который, на мой взгляд, менее удобен. Десктопная версия есть на Windows и Linux, новая программа также работает и для MacOS. Когда-то было приложение для телефона, и это позволяло, например, читать статьи по дороге на работу, но его убрали. Тем не менее, даже без установки программ, доступ к базе статей всегда есть через браузер.

Zotero - на первом месте по популярности среди подписчиков АДового рисёрча. Внешне похож на старую версию Mendeley, хотя слышала отзывы о неинтуитивно понятном интерфейсе. Доступен на Windows, MacOS и Linux, а также есть мобильная версия на iOS; обещают скоро выкатить и для Android. В целом, для тех, у кого ещё нет привычки использования какой-либо программы, я бы скорее рекомендовала Zotero, они очень хорошо развиваются. А ещё нашла интересное сравнение Mendeley и Zotero, рекомендую почитать.
EndNote - обычно в таких подборках он идёт первым, да и коллеги в Европе чаще пользуются им, но лично я его не люблю, так как он платный. Совместим только с Windows и MacOS. Из плюсов - возможность делиться и синхронизировать общую библиотеку и большее количество стилей цитирования.
Papers - платная программа, но имеет несколько интересных решений, например, встроенные в pdf ссылки, метрики статей и ИИ-помощник. Да что я буду описывать, на сайте они даже сделали таблицу сравнения с самыми популярными программами.
JabRef - бесплатная программа, которая подойдёт тем, кто использует LaTeX для оформления статей.

Преимущества использования

Организация хранения литературы

Нужно просто добавить pdf статьи, программа сама грузит всё в облако и распознаёт все выходные данные. Многие программы имеют даже специальный импортер статей из браузера. Далее внутри программы статьи могут быть распределены по папкам и подпапкам, можно писать заметки, выделять текст и комментировать его, ставить хештеги для облегчения поиска.
Автоматическое создание цитат и списка литературы в документах

Например, вы пишете обзор к диплому и ссылки на литературу нужно оформить по ГОСТу. Имея такую программу и синхронизацию с текстовым редактором, можно расставить ссылки в нужных местах, а система автоматически составит список литературы.
Быстрое изменение стиля цитирования

Буквально за пару кликов можно изменить стиль цитирования литературы практически под любой журнал, так как в базах таких программ уже содержится огромное количество стилей. В крайнем случае, для многих из них можно создать его вручную.

шурик:

Так, я нашёл сорок две статьи по своей теме, загрузил их в Zotero и собираюсь прочитать их на этой неделе

АД:

Важно не только читать статьи, но и где-то фиксировать прочитанное. Иначе вы рискуете потерять весь материл в чертогах разума

3.6. Как конспектировать статьи

Можно попытаться запомнить содержание каждой прочитанной статьи, но если вы планируете прочитать больше десяти, то эта задачка будет с повышенным уровнем сложности. Поэтому я рекомендую конспектировать каждую прочитанную статью. Это можно делать непосредственно в библиотеках типа Mendeley, Zotero и прочих, можно в Excel или Word, можно в тетрадке — как удобно. При этом

Записывайте только основную мысль, а не переписывайте статью.
Сокращайте слова для облегчения записи. Например, "следовательно" =>, "клетка" #, "увеличивается" ↑ и т.д.
Оставляйте место между мыслями для дополнений. Хотя с электронными конспектами это решается само собой.

Метод Корнелла. Этот метод рекомендуется для ведения конспектов лекций, но для статей он тоже отлично подходит. Страница делится на три части: два столбца — поменьше и побольше — для основных идей и заметок к ним соответственно. А внизу остаётся немного места для основных выводов/краткого резюме.

Источник изображения

Создание схем, таблиц и маркированных списков. Здесь важно вычленить основные идеи и расположить их в виде:

схемы со стрелочками — если это процесс;
маркированного списка — если это перечень чего-то;
таблицы — если описываются несколько свойств или нужно сравнение.

Здесь очень важно не начать записывать вообще всё, просто в новой форме, а именно выделить основную мысль и сделать схему, список или таблицу максимально краткими.

Ментальные карты (mind map). Чем-то похоже на схемы, но не совсем. В этом методе в центре находится какая-то основная тема, и далее от неё в разные стороны отходят подтемы, а от них — основные тезисы, которые связаны с примечаниями и так далее. Их лучше строить в электронном виде, благо есть специальные сайты . Мне этот метод помогает в подготовке обзоров: в центре основная мысль, от неё идут подтемы, а далее уже конкретные статьи и факты.

Источник изображения

Предыдущая часть Следующая часть