Движение вперед
Кроме исследовательских тем, на встрече обсуждались процессы исследовательского сообщества, включая организацию процедур публикации, создание исследовательских программ, привлечение новых талантов и менторство над ними, усилия по обеспечению воздействия результатов исследований.
До начала этих обсуждений был произведен небольшой анализ данных над библиографией конференций по тематике баз данных из репозитория DBLP. Хотя эта работа выполнялась не на научном уровне, полученные результаты показывают, что исследовательское сообщество баз данных за последнее десятилетие выросло вдвое. На это указывают различные показатели: число опубликованных статей, число разных авторов, число разных организаций, к которым относятся авторы, а также число тематических сессий на конференции. Это служило фоном последующих обсуждений.
Рост сообщества оказывает воздействие на исследовательские публикации. Увеличивающийся технический размах сообщества затрудняет отслеживание области баз данных на тематическом уровне. В результате все более важным вкладом в деятельность сообщества становятся обзорные статьи и тьюториалы. Их следует поддерживать как неформально внутри сообщества, так и через профессиональные стимулирующие структуры, например, учитывать соответствующую деятельность при продвижении по службе. Что касается процессов, то становится все более обременительной работа по рецензированию статей, и возникает ощущение, что качество рецензий со временем падает. На встрече отмечалось, что отсутствие в последние годы очных собраний программных комитетов усугубляет проблему плохих рецензий и устраняет возможность победы смелых или дискуссионных статей над добротными, но более скучными работами. В этом контексте обсуждались усилия последних лет по совершенствованию профессионализма статей и процесса рецензирования. Многие участники встречи выражали скептицизм по поводу положительного влияния этих усилий на долгосрочное качество исследований, определяемое их интеллектуальным и практическим воздействием.
В то же время, признавалось, что рост сообщества приводит к повышению потребности в понятных и обоснованных академических процессах. Продолжает существовать проблема нахождения политик, которые поощряют крупные идеи и принятие рискованных решений, но обеспечивают при этом понятные и справедливые правила для достижения этих поощрений. При отборе публикаций следовало бы более внимательно относиться к первой из этих целей.
В дополнение к совершенствованию процесса рецензирования публикаций имеется возможность воспользоваться преимуществами других каналов коммуникации. Исследовательское сообщество баз данных слабо представлено на относительно активном рынке технических книг. При наличии возрастающей потребности в разработчиках, работающих с крупными наборами данных, нужны доступные книги по масштабируемым алгоритмам управления данными и методам, которые могут использоваться программистами для построения собственного программного обеспечения. Текущее поколение учебников для колледжей не ориентировано на этот рынок. Кроме того, имеется возможность представлять статьи, посвященные тематике баз данных, ориентируясь на любознательных читателей, которые не являются специалистами в этой области. В дополнение к техническим статьям могут использоваться блоки и вики, в которых могут обсуждаться разные этапы жизненного цикла исследований: отчеты о состоянии дел выполняемых проектов, краткие описания крупных идей, прогнозы на будущее и размышления. Возможность использования электронных средств распространения информации подчеркивает тот факт, что в современной действительности просто широко обнародовать свои идеи, но трудно добиться, чтобы многие прочитали
опубликованный материал. Это следует помнить в контексте традиционных публикаций и авторам, и рецензентам. В конце концов, именно от потребителей зависит то, какую пользу принесут идеи исследователей на практике.
Рост исследовательского сообщества баз данных делает своевременным образование амбициозных проектов, стимулирующих сотрудничество и обмен идеями.
Одно из предложений состоит в содействии исследованиям в области управления данными путем создания глобально доступной коллекции структурированных данных, свой вклад в построение которой могут внести все желающий. В отличие от предыдущих начинаний такого рода, эта коллекция не должна предназначаться для какого-либо конкретного тестового набора – на самом деле, вероятно, большую часть интересных проблем, навеваемых этими данными, еще только предстоит определить. Также состоялось обсуждение роли разработки программного обеспечения с открытыми кодами в сообществе баз данных.
Несмотря на наличие традиции разработки программного обеспечения с открытыми кодами, академические исследователи баз данных в разных организациях относительно редко повторно или совместно используют программное обеспечение. В современных условиях следует более энергично переходить к совместному использованию программного обеспечения и сотрудничеству при выполнении проектов несколькими организациями. Примером области, в которой возникают подобные формы работы, является интеграция информации. Наконец, был проявлен интерес к техническим конкурсам, таким как соревнования на приз компании Netflix
и конкурс KDD Cup. В качестве первого шага в этом направлении в области баз данных были определены две области, пригодные для проведения соревнований: компоненты систем для облачного компьютинга (критерием, вероятно, должна являеться эффективность) и крупномасштабное извлечение информации (критериями, вероятно, должны являться точность и эффективность). Хотя отмечалось, что для реализации каждого из этих предложений требуется масса времени и хлопот, несколько участников встречи взялись на общественных началах организовать работу в этой области. В настоящее время эта работа началась, и требуется участие в ней других членов сообщества.