ДИСКУССИЯ ОБ АВТОРСТВЕ НА ИНТЕРНЕТЕ

01-01-1998

Напомню, что в позапрошлом номере Рубен Герр и я отвечали на запрос Сергея Дацюка по поводу того, можно ли считать публикации на Интернете научными. Я, в частности, писал: "Публикация на Интернете не считается научной публикацией. На нее не делают отсылок, потому нет статистики обращений и , соответственно, эти публикации никак не учитываются в индексе цитирования. И вот почему.

Сетевые издания были бы незаменимой принадлежностью Оруэлловского Министерства правды. Или , как минимум, Вавилонской библиотеки или сада расходящихся тропинок Борхеса. Здесь очень легко вносить задним число любые изменения в ранее опубликованный текст. Или убрать его. Столь же легко можно просто поставить в прошлый выпуск совсем другой текст".

С некоторой задержкой от СЕРГЕЯ ДАЦЮКА пришел следующий ответ:
С Вашим ответом согласиться никак не могу. Ваше изложение не выдерживает никакой критики.

В настоящее время меня интересует вовлечения институциональной украинской науки в мировую научную коммуникацию. Поэтому я совершенно спокойно отношусь к атакам на Интернет в прессе, в среде престарелых ученых: что де и проституция там, и компьютерное воровство, и порнография, и всякий непосвященный помещает чего угодно.

Но я никак не могу согласиться, что это не мировоззренческое отношение людьми двигает, не эмоциональное несогласие, а оказывается, по Вашим словам, технические обстоятельства.

Но это не так! Ну возьмем, например, уже то, что АльтаВиста индексирует документы в полнотекстовом режиме. Этот же режим предлагают и все другие основные поисковые системы. Есть трудность с датами, АльтаВиста поступает с точки зрения информации рационально - она делает переиндексацию периодически, и, соответственно ставит дату последней переиндексации документа. При этом обновляется и полнотекстовый вариант индекса индексированного файла, если файл был изменен.

Чего не делают пока поисковые системы - не указывают на обнаруженные отличия файла от предыдущей версии, то есть не делают версионную индексацию. Но это не есть техническая проблема, как это Вы описали.

Я вижу простую систему научной индексации, которую можно было бы реализовать. И если этого нет, то непонятно, почему до сих пор ученые из России или Украины - эмигранты в США - этого не сделали.

Нужно немного:
1) Сертификация со стороны многих государств одной из поисковых систем с полнотекстовой индексацией для индексации научных статей с согласованными условиями-
2) Периодическая публикация индекса цитирования из базы индексов полнотекстовой регистрации ресурса сертифицированной поисковой системы, а не из самого ресурса-
3) Поддержка этим сертифицированным поисковым ресурсом версионной индексации.

Что такое версионная индексация? Это означает, что если вы индексируете документ, индексируется полнотекстовая версия и ставится дата регистрации.

Эта полнотекстовая версия является фактом научной публикации, и все исследования в области индекса цитирования, приоритета и ссылок проводятся по так установленному "факту научной публикации". Затем, скажем, вы регистрируете измененный документ. В этом случае, если текст изменен на уровне до 50%, указывается поверсионно картина изменений.

Точно также, как это происходит в MS Word с 6 версии начиная.

Если изменений больше 50%, регистрируется полностью новый документ.

Насколько я знаю, на сегодня ни одна из описанных мной технических характеристик не является недостижимой и реализована в какой-либо программе или поисковой системе. То есть речь идет не о технической невозможности, а об отсутствии такой инициативы. Если бы нашлись люди в разных странах, сумевшие сделать такой проект в Интернете, он вполне мог бы быть самоокупаемым. Потому что здесь речь идет об авторском праве на уровне сертифицированной системы.

Можно ли подделать статистику сертифицированной поисковой системы, изменить индекс полнотекстового документа или дату его создания? Да, но точно также можно подделать документы ВАК
и тому подобных организаций авторского права. То есть речь идет о защите авторизованной индексной информации сертифицированной поисковой системы, а не о технической невозможности такой поисковой системы.

Ну а то, что такая поисковая система в Internet даже на Западе не создана, так здесь у нас мог бы быть приоритет. Почему нет? Или же тогда, Вы просто не знаете о существовании подобного рода систем? И вообще, именно об этом я спрашивал. Я бы не хотел, чтобы Вы отмахнулись аргументами, типа предыдущих, рассчитанных на новичков в Интернете.

Нет-нет. Нужно именно экспертное заключение по этому вопросу. Некто «доктор Вагнер» прислал мне письмо о наличии системы «электронной подписи». Однако «электронная подпись» удостоверяет авторство некоторого текста в виде одноактной или наличной пересылки. Но электронная подпись отнюдь не позволяет закрепить некоторый полнотекстовый индекс всего документа (что-то вроде контрольной суммы слов-букв и т.п.) Также электронная подпись не позволяет защитить текст и в одно и то же время сделать его общедоступным. Или так, или так.

Поэтому мне видится выход именно в такой сертифицированной со стороны сообщества государств единой поисковой научной системы полнотекстовой индексации с версионной индексацией последующих версий документа. Какие работы ведутся в этом направлении? Кто бы мне ответил?

С уважением, Серей Дацюк

РУБЕН ГЕРР, много пишущий по проблемам интренета, ответил так:

Текст Дацюка, мне напомнил место из какого-то романа Вадима Шефнера (цитирую по памяти):
– А ваши стихи уже напечатаны?

– Да, но пока только на машинке...

С чего Сергей Дацюк взял, что индексация текста из Сети является «фактом научной публикации»? Любая научная публикация проходит ту или иную апробацию в пределах научного учреждения и/или в редакции издания. Редактор является в некотором роде доверенным лицом некоторого сообщества, он, быть может, с помощью консультантов-рецензентов, решает, достойно что-то внимания читателей или нет. Я же в явном виде об этом написал!

Человек не становится ученым только в результате того, что он себя объявил ученым. Публикация не может стать фактом научной жизни, если она не прошла через какие-то фильтры. В противном случае наука как профессиональное занятие исчезнет, ибо выделить нечто достойное внимания среди потоков графоманских трудов будет невозможно.

Ясно, что существующая технология фильтрации отнюдь не идеальна, но другой пока нет. Что это за публикационный фетишизм? «Мои работы прочитали сотни тысяч людей, я их опубликовал на заборе!» – так, что ли? Может быть, Дацюк просто ищет себе нового врага? Дескать, раньше украинским самородкам не давали ходу старые козлы из «центральной» АН СССР, теперь...

С не меньшим уважением, Рубен Герр

ИТАК, КАК ЖЕ УСТАНОВИТЬ АВТОРСТВО НА ИНТЕРНЕТЕ, А ЗАОДНО ДОСТОВЕРНУЮ СТАТИСТИКУ ?
Валерий Лебедев

Прочитал я письмо Сергея Дацюка. И немного огорчился.

Он пишет, что моя точка зрения (и текст) не выдерживает никакой критики. А затем тут же начинает критиковать. Огорчение мое вовсе не из-за того, что моя (и сходная Рубена Герра) позиция может быть оспорена, а из-за того, что Дацюк был причастен к методологической школе Щедровицкого, которая уделяла внимание логике.
А здесь что получается? Чисто логически: или это никакая критика, или все-таки какая-то? Если никакая, тогда ее (по определению) нельзя выдержать. Если же она "какая-то", но тогда ее можно выдержать, ибо не выдерживается только "никакая критика". Опять- таки, если посчитать критику Дацюка "никакой", что эквивалентно отсутствию не только конструктивной, но и всякой критики, то тут и выдерживать нечего - нет нагрузки. Получается, что фраза "Такое- то утверждение не выдерживает никакой критики" сама не выдерживает... Стоп стоп. В том-то и дело, что фраза эта бессмысленная. По крайней мере, если после этой фразы все-таки следует критика. Иными словами, неэтично - нелогично предварять свои возражения фразой "мнение моего оппонента не выдерживает никакой критики".

Эта фраза из советского фельетонного обихода является своего рода оксюмороном. Не выдерживает - не обращай внимания и не вступай в полемику. Мы столько видим и слышим чепухи, что если бы на каждую реагировали критикой, то ни хватило бы никакой жизни. Пришлось бы стать Кощеем Бессмертным и заниматься только критикой. А как же тогда личная жизнь с Бабой Ягой?
Технические соображения Сергея Дацюка заслуживают внимания, обсуждения и критики. Вполне возможно, что критику они выдержат. Тем лучше.
Но вот Рубен Герр в кратких, но точных словах (уже в этом номере, ниже) выразил суть того, почему публикация на Интернете не может служить вехой в научных приоритетах.
Наш автор, известный ученый Владимир Торчилин, имеет прямое отношение к рецензированию научных работ. Он утверждает, что Интернет пока никак не задействован в систему научных публикаций, ибо без "научных фильтров" в виде рецензирования и оценки научным сообществом любого "нечто", претендующего на открытие, наука мгновенно засорится диким количеством отходов. Интернет же пока не позволяет обеспечить даже доказательство приоритетности той или иной публикации (за счет того, что задним числом в текст можно вводить изменения).
Ситуацию в науке можно чем-то сравнить с выбраковкой вредных мутаций при естественном отборе, или с механизмом репарации клетки. Известно, что как только число ошибок при клеточном делении (комплементарной редупликации) превосходит возможности репарации, наступает одряхление и смерть. Вот именно это произошло бы и с наукой, если бы всякую чепуху, опубликованную на Интернете зачисляли в разряд научных открытий. Большую часть homepages вполне можно соотнести с упоминанием Рубеном Герром росписью на заборе, после чего тот может быть назван "Забор Парижской, (точнее - русской) Богоматери").
Главная мысль Дацюка: он не согласен с нашей позицией, что авторство на Интернете приобрело принципиально новый вид. Он полагает, что это только технические трудности. Нет, не только, Вернее, это такие технические трудности, которые стали принципиальными и потому ставят вопрос об авторстве совершенно по-новому. Атомная бомба тоже была техническим изобретением. Но таким, которое изменило всю концепцию войны. До такой степени, что ядерная война стала бессмысленной.
Дацюк наивно полагает, что можно регистрировать все параметры поступления текстов в какой-нибудь АльтаВисте. Как будто эта Альта - научное учреждение!
Именно это и есть главный вопрос. Дело не в индексации, и даже не в поверсионной индексации. Дело в том, что нет системы апробирования поступающих текстов в научном сообществе. Все, кто проходил этапы защиты знают, что там и обсуждения (многократные) на кафедре, или секторе, обкатывание темы на конференциях и симпозиумах, доклады на ученом совете и различных научных собраниях, рецензии на рукопись в редакции, работа с научным редактором, наконец, отзывы, оппоненты и сама защита. А потом еще - рецензенты ВАКа. Вопрос именно в том, как включить этот громоздкий, но все-таки работающий механизм в конструкцию Интернета? Конечно, после прохождения всего вышеназванного фильтра можно опубликовать статью (или даже диссертацию) на Интернете, предварительно проиндексировав ее в любимой АльтаВисте. Но ведь все равно при этом все преимущество Интернета в оперативности и скорости будет потеряно. Тут уж и разницы нет - публиковать на Интернете, или препринт малым научным тиражом.
Отнюдь не просто технической сложностью является проблема сбоев компьютера, выхода из строя диска, ошибок программы, вторжения вирусов и хакеров. Каждый на своем опыте знает, что даже серверы сплошь и рядом "стоят на профилактике", дают сбои, к ним влазят хакеры и пр. Да и потом, где гарантия, что молодцы из АльтаВиста сами не начнут химичить?
В прошлом "Лебеде" уже давался материал о том, как народец наскребает деньги только на том, что адреса их сайтов похожи на другие, известные сайты. Они размещают у себя рекламу и получают за каждую тысячу показов от рекламодателей, ибо пользователи, в общем-то, по ошибке выкликают их адрес, такую-то сумму. Когда этих показов сотни тысяч и даже миллионы, то в дело вступает закон больших чисел и отдельные доллары слипаются в весьма внушительный ком.
В качестве наглядного примера того, как легко на Интернете варьируется любая информация, я приведу деятельность "Рекламы Русского Интернета" (Реклама РУ).
На днях я послал в "Рекламу РУ" , ответственному за техническую сторону деятельности рекламы Константину Моршневу письмо с просьбой выяснить, почему наша и их статистика дает существенно разные результаты (в пять раз). Со второго раза я получил ответ без здравствуйте и до свидания, в котором ключевой фразой была следующая: "Все абсолютно нормально, кроме того, что Ваша программа подсчета статистики неправильно считает число хостов. Теперь, когда я знаю, что это ошибка вашей программы подсчета статистики, я нахожу (нашу) статистику абсолютно нормальной".
А вот я нахожу в этом ответе ненормальным все: начиная от отсутствия обращения "Здравствуйте" и "До свидания", до голословных утверждений, что "35% пользователей русского Интернета не загружают картинки" и, особенно, что "Ваша программа подсчета статистики неправильно считает число хостов". Допустим даже, что это так. Это будет еще одним аргументов в несовершенстве фиксирующего Интернетовского инструментария. Но откуда такая уверенность в собственной непогрешимости?
Этот ответ Рубен Герр охарактеризовал так: "Ответ юношей из REKLAM'ы являет собой типический пример стиля общения хакеров с ламерами: ты, мол, ничего не понимаешь и объяснять тебе бессмысленно, ибо ты недоумок. Эти нахалы утверждают просто, что их программа правильная, а другая -- нет. Проблема определения количества и качества обращений не так проста, как это может показаться на первый взгляд. Обращения действительно бывают нескольких сортов, не уверен, что мой список исчерпывающий: обращения для чтения on-line или off-line, обращения «из любопытства» -- посмотрел, нет ли чего интересненького, обращения от поисковых систем и спайдеров -- программ, которые просто по какому-то принципу отслеживают содержимое Сети в автоматическом режиме".
И далее Рубен Герр написал: "В отчетах о «посетителях», которые ты получаешь от содержателей сервера, имеется куда больше информации, чем они извлекают. Оттуда можно, например, узнать, сколько твоих читателей отключают загрузку картинок, какой процент прочитывает все «от корки до корки», какие статьи пользуются большей популярностью, какая корреляция между всеми перечисленными данными и географией (if any). Просматривая отчет, я обнаружил, например, что есть люди, которые заходят к тебе за какой-то конкретной статьей, причем минуя заглавную страницу, сразу же. Это может означать только, что либо они нашли где-то ссылку на эту конкретную статью (где?), либо воспользовались средствами поисковых систем (каких?). Интересно ведь, сколько таких? Все, что требуется, чтобы извлечь перечисленную информацию, равно как и другую, это найти какого-нибудь студента, который сделает соответствующую программу за несколько дней. Впрочем, не обязательно студента -- это может быть и профессор-преподаватель, который предложит кому-нибудь проделать эту работу в качестве курсового задания. Думаю, что в университетском городе Бостоне можно изыскать такие возможности, вместо того, чтобы обращаться к коммерческим службам, в объективности и честности которых есть все основания сомневаться".

А я со своей стороны скажу так: мне совершенно необязательно знать устройство печей в крематориях Освенцима и уметь рассчитывать тепловые потоки, чтобы представить, что в этих печах сжигались много тысяч трупов ежедневно. И точно также мне совсем не надо знать тонкости устройства программы статистики рекламы РУ, чтобы увидеть ее удивительные результаты.
Вы пишете, у вас нет ошибок. Давайте-ка проверим. Вот ваше уведомление всех ваших пользователей от 15 апреля:
From moko@design.ru Wed Apr 15 13:57:43 1998
Date: Wed, 15 Apr 1998 03:18:38 +0400
From: Konstantin Morshnev <moko@design.ru>
To: reklama@reklama.ru
Subject: nOWOSTI Reklama.Ru

ДОБРЫЙ ДЕНЬ !

Информируем вас о том, что на счет каждого участника добавлено 25% от числа показов за 14 апреля . Это сделано с целью компенсировать накопившиеся за последние полтора месяца потери..

С уважением, коллектив разработчиков Reklama.Ru.

Хорошо, что с уважением. Но - сколько раз вы ранее сообщали, что, то к вам влезли хакеры-конкуренты и сняли статистику, то были сбои в программе, то - неполадки с диском? Значит, ошибки, сбои и поломки у вас могут быть.
Обратим внимание на фразу "На счет каждого участника добавлено 25% от числа показов за 14 апреля . Это сделано с целью компенсировать накопившиеся за последние полтора месяца потери". Потери, стало быть, имелись. Теперь вы добавляете всем по 25 %. А ведь это свидетельствует о том, что вы совершенно произвольно можете изменять статистику. Добавлять количество. И с той же легкостью убавлять. И не только 25 %. А и в два раза увеличить. В пять раз. В десять. То есть, полный произвол в вашей "статистике" налицо - причем, вашими же собственными словами, смысл которых вам, видимо, был не ясен, когда вы так щедро всем добавили 25 %. Жаль, что вы не работали, по молодости лет, в Советском ЦСУ. Тогда бы страна уже давно жила при коммунизме.
Давайте обратимся к вашим передовикам. Возьмем только первую десятку вашей статистики за один день.
Понедельник, 13 апреля ваша статистика начинается стандартно:
Вчера ( то есть, 13 апреля) наша система показала баннеров: 583480
Подробнее за прошедший день:
Анекдоты из России (от Димы Вернера) - 141728
Яndex - 55405
Городской Кот 44618
Поисковая система Апорт 26644
Петерлинк 25042
Невалинк 22743
Музыкальный телефон 20755
Сервер Информационных Технологий 14945
Computerra Online 14137
Караван 13269
Итак, эта десятка дает в сумме 379 286 показов. За 1000 показов реклама получает от рекламодателей по 10 долларов (это по вашей же расценке). Итого за один день только от первой десятки - почти 3 800 долларов ! А всего за все показы - 5 834 доллара! За один день.
Мы имеем, например, "Анекдоты от Димы Вернера" с цифрой показа баннеров 141728. И что же эта за цифра? Количество выходов на его сервер? Или нажатий на баннер рекламы? Или количество разных серверов, то есть, число людей, упивавшихся анекдотами? Почти 150 тысяч человек за один день читали анекдоты? Ибо ведь там только анекдоты и есть, и если кто-то вызвал сайт анекдотов, стало быть повторно он уже вызывать в этом сайте ничего не будет. И тогда число выходов-хитов (почти) автоматически равняется числу серверов-хостов. И вы хотите, чтобы в эту чушь поверили? Да есть ли в России вообще такое число серверов? По моим данным, число вызовов анекдотов от Димы Вернера в рекордные дни- от 12 до 15 тысяч. Стало быть, вы смело преувеличили это число в десять раз. Надо еще учесть, что эти анекдоты есть плод присылки (по типу гостевой книги) анекдотов от всех, кто пожелает - без всякой редактуры и отбора. Это такой набор пошлости, глупости и похабства, что трудно себе представить. Не думаю, что население (имеющие выход на Интернет) в России настолько уж оскудело мыслью, что в массовом порядке рвется в эту помойку.
Приведу примеры лучших анекдотов за последний месяц (март). Орфография подлинника.

Лучший анекдот по абсолютному количеству голосов за март:

В Лонодоне на узкой улочке навстречу друг другу едут два шикарных лимузина "Бентли" и "Крайслер". Дорогу уступать никто не хочет, и в центре улочки они, едва не столкнувшись, останавливаются. Из "Крайслера" выскакивет черный водила - американец, из "Бентли" чинно выходит англичанин. Американец начинает орать и бешено жестикулировать:
- Ты куда! Куда ты лезешь? Да ты знаешь, кого я везу?!!
Англичанин оценивает происходящее невозмутимо и стоит с весьма помпезным видом.
Американец продолжает крик:
- У меня в машине сидит сам Билл Гейтс!!! И если ты...
Так проходит некоторое время. Американец не унимается.
Наконец, англичанин разворачивается, обходит свой "Бентли" и открывает заднюю дверь - американец видит Английскую Королеву. Англичанин смотрит на него испепеляющим взглядом:
- Ну а это по-вашему - залупа конская?

Анекдот рассказал(а) Сергей

Лучший анекдот по процентному соотношению:

Заседание приемной комиссии в театральном институте. Час-два-три... Последней абитуриентке, в качестве дополнительного вопроса, достается просьба:
- Девушка, изобразите нам что-нибудь круто эротическое, с крутым обломом в конце...
Через секунду профессор слышит нежный стон: А.. аа.. ааа... Аа-а-а-пчхи!!!

Анекдот рассказал(а) Gimli (gimli@ulweb.ml.org)

Как говоиться, если таков победитель, то каков же тогда побежденный?
На третьем месте (а часто - и на втором) у вас идет "Городской кот", в котором соседствует погода в Крыму с расписанием российских телепрограмм. И еще - десяток бессмысленных кошачьих фотографий. И некие новости в несколько строк о событиях в Miсrosoft и в "смежных областях", о которых подробнее и квалифицированнее можно прочитать в специальных компьютерных и Интернетовских журналах, которые и близко не подходят к вашим передовикам. В передовиках у вас и совершенно региональные издания, вроде Новгородских известий. И опять таки, вы хотите, чтобы мы поверили в то, что люди со всей Руси великой ломились на Новгородские новости?
Не проще ли предположить, что огромные ежедневные суммы, снимаемые вами с рекламодателей, каким-то образом делятся с вашими передовиками? Уж я не знаю, по какому принципу. Или некто вам предоставляет крышу. Или еще какие-то услуги. Тогда рекламодатели будут охотно давать рекламу вашим передовикам. От чего прямая выгода как им, так и вам (видите, уже и стихи сами собой сложились).
Этот пример я привел как раз по случаю "авторства на Интернете". Если уж со статистикой можно так шутить, то что говорить о простом изменении текста за прошлые времена.
Еще раз подчеркну: вопрос остается открытым. Будущее покажет, является ли ситуация с научными публикациями на Интернете только временной технической сложностью, или дело гораздо серьезнее.
Чтобы скрасить некоторую тягость темы, в следующей подборке я приведу открытие, сделанное еще до эпохи Интернета. Прочтите и представьте, что было бы, если бы такого рода открытия с помощью Интернета считались вкладом в науку.

Комментарии

Добавить изображение