Как скачать научную статью. Cloudflare прекратил обслуживание доменных имён Sci-Hub

Faq 23.06.2019
Faq

Во вторник, 5 сентября, стало известно, что одна из крупнейших баз бесплатных научных статей Sci-Hub прекращает работу на территории России. Основательница сайта Александра Элбакян заявила, что российские ученые «травят» ее. Чем известна Элбакян, кто ее поддерживает и за что ее критиковали? «Бумага» рассказывает о конфликте вокруг Sci-Hub.

UPD. В воскресенье, 10 сентября, создательница базы научных статей Sci-Hub , что сайт снова работает в России.

Что такое Sci-Hub?

Sci-Hub - международный ресурс, на котором в открытом доступе публикуют научные статьи. Это одна из самых больших баз статей в интернете. Тексты можно читать и скачивать бесплатно, притом что легальный доступ к ним стоит иногда несколько тысяч долларов.

Сайт в 2011 году создала студентка из Казахстана Александра Элбакян. Научные издательства обвиняли ее в пиратстве. По данным издания Science, по состоянию на июль 2017 года в базе Sci-Hub можно найти две трети всех научных публикаций в мире и 85 % публикаций, которые легально доступны только по платной подписке.

В 2017 году Федеральный окружной суд США оштрафовал Sci-Hub за нарушение авторских прав научного издательства Elsevier, оценив ущерб от распространения ста научных статей в 15 миллионов долларов.

В 2016 году Sci-Hub был номинирован на «Вики-премию» в категории «Свободные знания» и вошел в шорт-лист.

Почему создательница Sci-Hub закрыла к нему доступ на территории РФ?

Во вторник, 5 сентября, доступ к ресурсу на территории РФ оказался закрыт. При попытке зайти на сайт Sci-Hub.cc отображается открытое письмо Александры Элбакян. Она сообщает, что причина ограничения доступа к сервису - «крайне неадекватное, оскорбительное поведение российских ученых в адрес создательницы сервиса».

По ее словам, ее травят люди, «которых относят к так называемой российской „либеральной оппозиции“». Она утверждает, что ее выставляли сумасшедшей.

Обращение Александры Элбакян:

Например, ими распространяется информация о том, что Александра сумасшедшая, и ее личность всячески очерняется. В отличие от создательницы сервиса Sci-Hub, эти люди пользуются всеобщей поддержкой, некоторые даже занимают высокие посты в Российской академии наук и получают не только престижные научные премии, такие как „За верность науке“ и „Просветитель“, но и одобрительные похлопывания по плечу за оскорбления в адрес Александры».

«Варитесь в своем дерьме сами, а мне это тоже надоело, российская наука с возу - кобыле легче. Высвободившиеся ресурсы я направлю на свои исследования», - заключает Элбакян в своем обращении.

Чем известна Александра Элбакян?

Создательница Sci-Hub в 2016 году вошла топ-10 людей, оказавших важное влияние на развитие науки по версии журнала Nature . С конца 2016 года она не раскрывает свое местонахождение. По некоторым данным, девушка проживает в Куала-Лумпуре. Ряд научных СМИ называют Элбакян «Робин Гудом от науки».

Действительно ли пользователи критиковали Элбакян и за что?

В 2015 году Элбакян рассказала , что ее начали травить в интернете после того, как она высказала свое мнение о признании фонда «Династия» иностранным агентом. Она объясняла, что создатель фонда Дмитрий Зимин поддерживает только ученых, которые разделяют его политические взгляды, то есть либеральных ученых. Пользователи жаловались, что Элбакян банит всех в группе Sci-Hub, кто поддерживает «Династию».

Кроме того, некоторые указали на то, что создательница необоснованно обиделась на то, что в ее честь назвали насекомое. У Элбакян был открытый конфликт с популяризатором науки и старшим научным сотрудником Института проблем передачи информации РАН имени А. А. Харкевича Александром Панчиным. Она заявила , что Панчина и группу других популяризаторов, по ее впечатлению, «спонсируют и поддерживают на плаву определенные силы и влиятельные люди».

Панчин же раскритиковал решение Элбакян ограничить доступ к ресурсу.

Кто поддерживает Элбакян?

В поддержку Элбакян высказался основатель компании в области биоинформатики iBinom Андрей Афанасьев.

Где искать научные публикации в открытом доступе кроме заблокированного для российских пользователей Sci-Hub и где все-таки осталась лазейка, разбирался сайт.

Сейчас для исследователей вопрос поиска полных текстов научных статей стоит довольно остро. Подписки на ведущие научные журналы дороги и, к сожалению, есть даже не у всех ведущих вузов. С 5 сентября ресурс, позволявший скачивать полные тексты статей из любого журнала, Sci-Hub, . Безусловно, он был очень удобным инструментом. Но отчаиваться не нужно, ведь есть огромное количество способов получить полные тексты статей совершенно легально и бесплатно.

1. Unpaywall

Один из самых удобных инструментов для бесплатного доступа - расширение для браузеров Chrome и Firefox Unpaywall. Оно автоматически ищет полные тексты научных статей. Если вы заходите на страницу какой-нибудь публикации, справа на экране появляется иконка с изображенным на ней замком. Если она зеленая и замок открыт, то достаточно просто нажать на него, и вы автоматические перейдете на страницу с полным текстом статьи в формате PDF. Установить расширение можно на его сайте .

2. Академия Google

Другой сайт, который может помочь, - это Академия Google . Вы просто пишете название статьи в поисковой строке и читаете полный текст. Если он, конечно, есть в открытом доступе.

3. Open Access Button

Если ни Unpaywall, ни Академия Google вам не помогли, может пригодиться сайт Open Access Button . Большая волшебная кнопка справится с поиском нужной статьи.

4. ArXiv.org

Этот сайт был создан специально для того, чтобы решить проблему открытого доступа к статьям. На ArXiv ученые выкладывают препринты своих статей, то есть черновики, которые в итоге публикуются с некоторыми изменениями. Большинство авторов - математики и физики, но сейчас по инициативе фонда Присциллы Чан и Марка Цукерберга разрабатывается аналог для биологии и других естественных наук - BioRxiv .

5. КиберЛенинка

Научная электронная библиотека «КиберЛенинка» - крупнейшее в России собрание научных статей, в основном на русском языке, хотя есть и иностранные публикации.

6. Библиотека eLibrary

Узнайте, с какой библиотекой сотрудничает ваш вуз и как получить к ней доступ. Например, в МГУ доступ ко всем подпискам университета автоматически активируется, если вы ищете статью в компьютерном классе или через Wi-Fi-сеть МГУ.

8. Российская государственная библиотека (РГБ)

База в основном по медицине и биологии, иногда содержит ссылки на полные бесплатные тексты статей.

Обширная база англоязычных статей, журналов и научных работ по самым разнообразным темам.

База данных по физике высоких энергий.

P.S. И на самом деле никто не блокировал в России бот Sci-Hub в Telegram - ищите @scihubot. Вы ему пишете название статьи, а он вам присылает PDF-файл с текстом.

P.P.S. Кроме того, в России. Правда, не очень понятно, копирует ли он все функции сервиса, или всего лишь подсоединяется к базе Library Genesis.

Хотя пиратским сервисом Sci-Hub пользуются тысячи учёных и исследователей по всему миру, но решение американского суда имеет необратимую силу. Правообладатели делают всё возможное, чтобы стереть сервис с лица земли или хотя бы как можно более затруднить доступ к нему.

Подчиняясь законному требованию Американского химического общества, CDN-провайдер Cloudflare был вынужден прекратить обслуживание нескольких доменных имён, принадлежащих Sci-Hub. Хотя в прошлом он оспаривал такие запросы, но теперь уступил без видимых протестов.

В мае 2017 года один из крупнейших научных издателей Elsevier добился наложения на Sci-Hub и активистку и нейробиолога Александру Элбакян штрафа в $15 млн, а в ноябре 2017 года Американское химическое общество (АХО) выиграло судебный иск на $4,6 млн (сумма рассчитана как количество скачиваний 32-х научных работ, умноженное на цену научных журналов, в которых они опубликованы).

Понятно, что никаких штрафов Элбакян платить не будет, но Федеральный окружной суд Восточного округа Виргинии предусмотрел и другие меры взыскания. Самая жёсткая из них - суд согласился с требованием АХО наложить предписание на третьих лиц. Теперь любые поисковые системы, хостеры, провайдеры, регистраторы доменных имён по требованию АХО обязаны блокировать сайт Sci-Hub. Хостеры не могут предоставлять хостинг Sci-Hub, поисковым системам запрещено ставить ссылки на Sci-Hub, а интернет-провайдеры обязаны заблокировать доступ к сайту, если АХО потребует этого.

Вскоре после вынесения судебного вердикта началась охота. Несколько зеркал Sci-Hub стали недоступны, потому что доменные регистраторы подчинились судебному решению и разделегировали некоторые домены . В частности, перестали работать три домена sci-hub.io, sci-hub.cc и sci-hub.ac. Их перевели в статус “serverhold”, что часто означает вмешательство регулирующих органов. Такой статус получают домены, где обнаружено нарушение копирайта.

Разумеется, Sci-Hub не прекратил на этом существование, а начал использовать другие домены. С ноября 2017 года научное сообщество перешло на использование домена Sci-Hub.bz , где сервис оставался доступен. По-прежнему работал и сайт в сети Tor и другие зеркала.

Кроме того, на странице ВК и в твиттере Александра Элбакян посоветовала для обхода проблемы с доменными именами указать IP-адреса серверов 80.82.77.83 или 80.82.77.84. Эти адреса работают до сих пор.

3 февраля 2018 года на странице ВК Александра Элбакян поделилась неприятной новостью , что Sci-Hub выгоняют с Cloudflare. В письме в адрес Sci-Hub сервис Cloudflare сообщает, что получил судебное постановление (pdf) и вынужден прекратить обслуживание веб-сайтов Sci-Hub. В течение 24 часов Cloudflare удалил со своих авторитетных DNS-серверов домены sci-hub.la, sci-hub.tv и sci-hub.tw.

Элбакян создала Sci-Hub в 2011 г., будучи студенткой в Казахстане. Позднее она рассказывала, что хостинг сайта находится в Санкт-Петербурге. Sci-Hub создан в качестве альтернативы дорогой подписке на научные журналы. Доступ к одной научной публикации может обходиться ученому в $30, писал журнал Science. Для ученых из развивающихся стран это непосильная сумма. По статистике самого Sci-Hub, в 2015 г. активнее всего статьи из этой базы загружали пользователи из Ирана, Индии, Китая, России и США. Учитывая, что доля США и Европы в трафике базы растет, ученые все чаще обращаются к сайту не потому, что не могут себе позволить подписку на тот или ной журнал, а потому, что им так удобнее.

В ученой среде продолжаются массовые баталии - приносит ли Sci-Hub больше вреда или пользы для науки. Science пишет, что такая популярность проекта фактически означает конец подписной модели для научных журналов.

В 2015 г. американский издатель научных журналов Elsevier подал иск против Sci-Hub, в июне этого года суд Нью-Йорка поставил, что проект должен выплатить издательству $15 млн компенсации и перестать предоставлять нелегальный доступ к текстам в журналах Elsevier. В качестве обеспечительных мер по этому иску прежний сайт проекта Sci-Hub.org был заблокирован на территории США.

Elsevier в иске также ссылался что Sci-Hub получает доступ к платным копиям журналов издательства через логины и пароли университетов, которые сервис получает нелегально («Ведомости» ознакомились к копией иска).

В августе 2017 г. в суд на Sci-Hub подало еще одно издательство: American Chemical Society (ACS) потребовало взыскать с сайта почти $5 млн.

Как работает Sci-Hub

Sci-Hub устроен на основе алгоритма, который собирает и копирует содержимое веб-страниц (scraping или парсинг), в данном случае – тексты научных публикаций. По словам Элбакян, для получения публикаций, которые доступны только по подписке, написанный ею алгоритм удаленно подсоединяется к прокси-серверам университетов, у которых есть такая подписка. Порой алгоритм в поисках нужной подписки перебирает несколько десятков университетов, рассказывала она. Университеты либо платят за такую подписку, либо получают ее бесплатно от издателей журналов с рядом ограничений по доступу. Элбакян отказывается сообщать публично, как Sci-Hub получает доступ к внутренним сетям университетов - взламывает их или пользуется логинами и паролями, предоставленными проекту сотрудниками университетов.

В 2011-2013 гг. Sci-Hub собирал конкретные научные публикации только после получения конкретного запроса пользователей. Пользователь отправлял сервису ссылку на веб-страницу с нужной ему платной публикацией, Sci-Hub открывал доступ к тексту через прокси-сервер того или иного университета и давал пользователю возможность скачать файл бесплатно. Полученные такие образом файлы Sci-Hub хранил только 6 часов и затем удалял. В 2013 г. у проекта появилось хранилище - здесь собираются файлы с публикациями, которые прежде уже запрашивались пользователями. Также Элбакян доработала алгоритм, и он автоматически собирает новые публикации по актуальным темам до того, как тот или иной ученый начнет искать их в базе Sci-Hub.

По словам Элбакян, Sci-Hub, как и Wikipedia, существует на пожертвования пользователей. Сколько таким образом получает проект, она не раскрывает.

Даниэл Химмелстейн из Университета Пенсильвании подсчитал на основе открытых данных, что за время существования проект получил от пользователей 92,63 биткойна (более $400 000 по текущему курсу). Суммы пожертвований в других валютах исследователи оценить не смогли.

) в России, а потом разбанила через три дня, уже забыли?

Самое время поговорить о доступе к научным статьям, как без этого не обойтись и как это сохранить в будущем. Во время скандала с Элбакян было много записей и комментариев от ученых в разных дисциплинах в России, от студентов и сотрудников в лабораториях, о том, как без Sci-Hub они не представляют свою научную деятельность. Я обращаюсь ко всем этим людям и призываю их обратить внимание на проект Либген (http://libgen.io или http://gen.lib.rus.ec) и задуматься о его поддержке.

Еще раз подчеркну, что я не пытаюсь умалить вклад Александры Элбакян в дело свободного доступа к научным статьям - и этот вклад, и тот личный риск, на который она пошла и идет, несомненны (не забудем о судьбе Аарона Шварца - Элбакян ведь, по сути, выполнила и перевыполнила план, попытка заняться которым привела к аресту Шварца, уголовному делу против него и его самоубийству). Хронологически вклад Элбакян вместе с работой анонимных хранителей проекта Либген, в деле доступа к научным статьям, выглядит примерно так:

2011 - Элбакян запускает Sci-Hub. В первой версии проект позволяет вам заходить на сайты издателей, где лежат статьи, через чужие прокси с доступом; вы сами должны находить, где нажать, чтобы скачать статью, и скачанная статья остается только у вас и нигде не сохраняется.

2013 - проект Либген начинает давать доступ к научным статьям, с начальной базой примерно в 20 миллионов статей (источник этой начальной базы мне неизвестен). Они кооперируются с Sci-Hub, так что статьи, скачанные через Sci-Hub, автоматически копируются в базу данных Либген.

2014 - Элбакян переписывает движок Sci-Hub так, что он автоматически находит для пользователя, как скачать статью с сайта производителя, и скачивает ее (это чрезвычайно повышает удобство проекта). Она также запускает собственные сервера для хранения скачанных статей, чтобы не скачивать их снова и снова у издателя. При этом копии продолжают поступать в базу данных Либген. Элбакян копирует на свои сервера 20 миллионов статей Либгена.

2014-2017 - вдобавок к тем статьям, что скачиваются по запросам пользователей, Элбакян инициирует систематическое скачивание всех статей через свой движок из множества журналов и сайтов издателей. Эти два источника - запросы пользователей и скачивание по собственной инициативе проекта - доводят общее кол-во статей с 20 миллионов до 60 миллионов. Копии продолжают поступать в Либген.

Вклад Элбакян состоит в: 1) централизованной организации доступа к многим разным базам данных научных статей, пользуясь для этого множеством разных логинов/паролей, собранных за кулисами (предположительно пожертвованных добровольцами или добытых хакерами или и то и другое); 2) автоматизации скачивания PDF-версии статьи из каждой такой базы данных, и хранения на кэш-серверах, чтобы не надо было скачивать снова и снова; 3) автоматической догрузки множества статей по собственной инициативе проекта, для пополнения базы данных.

Вклад Либгена состоит в: 1) базе данных для всех статей, включая Sci-Hub"овские, с работающим поиском по именам и заголовкам (в Sci-Hub нет поиска, надо знать точный идентификатор конкретной статьи) 2) начальной базе в 20 миллионов статей 3) все статьи, весь код проекта, все базы данных - все открыто и может быть скачано и скопировано всеми желающими.

Ну и конечно, надо добавить сюда, что статьи это только одна из баз данных Либгена. Кроме этого, там есть художественная литература по-русски, на других языках, комиксы, и что самое важное - научные книги, первоначальный фокус этого проекта. Его ценность невозможно переоценить, по-моему; для меня лично он был и есть еще ценнее, чем Sci-Hub - хоть я понимаю, что для многих работащих ученых Sci-Hub важнее. Не будь Sci-Hub и раздела статей в Либгене, статьи все равно можно доставать через сообщества волонтеров с доступом, высылающих статьи желающим (главный способ получения статей до Sci-Hub). Не будь сотен тысяч оцифрованных книг в Либгене - включающих в себя практически полный набор учебников любого уровня по многим важным дисциплинам, и значительную часть монографий - их нигде больше не добыть, кроме как придя на своих двоих в библиотеку большого университета.

Но вернемся к научным статьям. Сейчас, в 2017-м году, больше 60 миллионов уже скачанных научных статей - по некоторым оценкам, более 60% массива современных научных статей - лежат на сайтах двух проектов: Sci-Hub и Libgen. Новые статьи, которые качаются через Sci-Hub, поступают в оба проекта. Но в одном из них, в Sci-Hub, никто не может сделать зеркало всех статей, а только смотреть по одной через капчу. Никто не может посмотреть на код проекта или сделать копию его базы данных. Все сервера и доступ к ним контролируются одним человеком, которая страдает от запредельного, галактического ЧСВ, и на почве этих страданий готова вырубать доступ целым странам, если ей не понравилась чья-то критика. Если завтра Элбакян вздумается закрыть проект, никакой копии Sci-Hub нет.

В другом проекте, Libgen, все накопленные данные (и статьи, и книги, и все остальное) раздаются всем желающим через торренты. Код проекта открытый. Периодические копии базы данных доступны к скачиванию прямо с сайта. Есть несколько зеркал. Хранители проекта, известные только под псевдонимами и не страдающие желанием прославиться, движимы судя по всему желанием раздать все это богатство как можно шире и поощряют создание зеркал и копирование данных.

Поэтому, вот что я хочу сказать, например, научному работнику в России - или любой другой стране, где у него нет легального доступа к необходимым базам данных и очень нужен доступ к научным статьям. Если, предположим, вы работаете в институте или большой научной лаборатории и идеология свободного доступа к научным статьям очень вам по душе. Если вас беспокоит возможность того, что Sci-Hub завтра закроют враги или закроет его же создательница по очередному капризу. У меня есть для вас очень дельный совет из двух частей. Во-первых, по адресу http://libgen.io/dbdumps/scimag/ скачайте дамп текущей версии базы данных всей статей. Цена вопроса - 7 гигабайт, или 26GB текстового файла в развернутом виде, и вот у вас есть все метаданные 66 миллионов статей. Я запустил скрипт на этой базе данных и посчитал, что общий объем всех статей - 54 терабайта. Поэтому вторая часть совета напрашивается. 54TB это много, но в рамках бюджета целого университета или большой научной лаборатории или фирмы - не очень много. Поднимите сервер или сервера с такими объемами жестких дисков и поставьте качать все торренты с http://libgen.io/scimag/repository_torrent/ . Это займет какое-то время, может пару месяцев, но в конце этого процесса у вас будет копия всех (*) научных статей западного мира. Своя мини-копия достижений научной цивилизации. У вас на диске. Под вашим контролем. А еще примерно 30TB дадут вам возможность и все торренты книг тоже скачать. А если вы еще и продолжите сидить это все, так и вообще цены вам нет.

(*) художественное преувеличение, не всех, но значительной части.

Будущее свободного доступа к научной литературе - будущее вашего доступа к научной литературе - в ваших руках.



Рекомендуем почитать

Наверх