Ноябрь/Декабрь 2003


Человек номера


“Базы данных и информационные технологии XXI века”

Так получилось, что в конце сентября совпали по времени два знаменательных для российских ученых и специалистов по информационным технологиям события:

  • российская презентация новой системы Oracle 10g, которая довольно широко отмечалось в средствах массовой информации, о которой я много писал в предыдущем выпуске журнала,
  • научная конференция “Базы данных и информационные технологии XXI века”, посвященная 30-летнему юбилею научно-исследовательского семинара “Теория и методология проектирования баз данных” под руководством М.Ш.Цаленко, то есть началу отечественных работ в области реляционной модели данных.

Конференции “Базы данных и информационные технологии XXI века” не было уделено должного внимания в СМИ, хотя по уровню научных сил и качеству докладов эта встреча была несравнимо выше многих нынешних научно-практических мероприятий в сфере IT-технологий. Прежде всего, это была именно научная конференция в том смысле, что докладчики не просто называли свои результаты, но формулировали и ставили новые теоретические и практические задачи. А новые задачи, поставленные перед собой теоретиками, гарантируют практикам долгую и интересную, полную новых идей и их реализаций профессиональную жизнь. Признаюсь честно, я давно уже не присутствовал на публичных выступлениях такого высокого теоретического уровня. Содержание более практических докладов (М.Розенфельд, О.Горчинская, А.Голосов) было под стать теоретическим, в них как бы утверждалось воплощение теории в практике.

Несколько случайно, но очень символично, что конференция открывалась и закрывалась выступлениями по исторической тематике. В нашей отечественной «непредсказуемой» (горькая шутка!) истории та ее ниточка, которая связана с приходом на Русь реляционной модели данных, вплетена в общую канву очень и очень определенно.

Поскольку в СУБД Oracle реляционная модель данных нашла свое лучшее практическое и коммерческое воплощение, мне представляется, что нашим читателям информация о конференции и выдержки из ее докладов могут представить значительный интерес.

Предполагается, что со временем выйдет сборник трудов конференции. Жаль, что мы не дошли еще до публикации аудио записей выступлений. Тогда бы можно было бы услышать живую и яркую, научно точную и в то же время очень образную речь докладчиков. Сопереживая с лектором его выступление, слушатель больше и лучше понимает, что и как хочет донести до него автор. Пока же я предлагаю вниманию читателей «Oracle Magazine/Русское Издание» подборку тезисов и резюме докладов, прочитанных на конференции, в том виде, как их мне для публикации прислали сами авторы. А также небольшой фотомонтаж из кадров, снятых во время конференции, часть из которых была любезно предоставлена PR-службой компании «ФОРС», за что ей отдельное спасибо.

Главный редактор Интернет-журнала
«Oracle Magazine/Русское Издание»
к.т.н., с.н.с. А.В.Бачин


Российский государственный гуманитарный университет
Министерство образования России
Межвузовский центр по информационному обеспечению гуманитарного образования
Кафедра математики, логики и интеллектуальных систем в гуманитарной сфере
Компания “ФОРС”

провели юбилейную конференцию

“Базы данных и информационные технологии XXI века”
посвященную 30-летию семинара “Теория и методология проектирования баз данных”
(под руководством М.Ш. Цаленко)
(Москва, 29-30 сентября 2003)

Программа конференции:

  • * “Чему нас учит история” - вступительное слово
    М.Ш. Цаленко (д.т.н., профессор)
  • * “Неоднородность и каноническое моделирование данных: ретроспективный взгляд” -
    Л.А.Калиниченко (д.ф.-м.н., профессор, зав. лабораторией Института проблем информатики РАН)
  • * “Система дистанционного обучения в Стэнфордском университете” -
    М.З. Розенфельд (Стэнфордский университет)
  • * “Технологии XML и XML данные” -
    М.Р. Когаловский (к.т.н., доцент, зав. лабораторией Института проблем рынка)
  • * “Хранилища данных и технологии анализа данных” -
    О.Ю. Горчинская (к.т.н., ст. консультант фирмы ORACLE)
  • * “Управление информационными ресурсами в государственном секторе” -
    А.О. Голосов (к.т.н., директор компании «ФОРС»)
  • * “Нерешенные проблемы теории баз данных и нереализованные проекты применения баз данных” -
    М.Ш. Цаленко (д.т.н., профессор)
  • * “Три манифеста по базам данных и их реализация” -
    С.Д. Кузнецов (д.т.н., с.н.с., главный научный сотрудник Института системного программирования РАН)
  • * “Системы формирования и использования баз понятий и проблемы построения открытых языков представления знаний” -
    Е.М. Бениаминов (д.ф.-м.н., профессор, Институт лингвистики РГГУ)
  • * “Современные технологии анализа хаоса в истории" -
    Л.И. Бородкин (д.ист.н., к.т.н., профессор, зав. лабораторией исторической информатики Исторического ф-та МГУ им. М.В.Ломоносовa).


М.Ш.Цаленко
д.т.н., профессор

 М.Ш.Цаленко. Чему нас учит история

Осенью 1973 года во Всесоюзном государственном проектно- технологическом институте Центрального статистического управления СССР (ВГПТИ ЦСУ СССР) возник под руководством автора научно-исследовательский семинар “Теория и методология проектирования баз данных”. Уже через три года после начала работы участниками семинара были получены новые научные результаты, и семинар стал оказывать значительное воздействие на формирование научных исследований в бывшем Советском Союзе в области теории баз данных, станововшейся в то время одним из основных разделов информатики, или computer science. В последующие десятилетия участниками семинара были получены фундаментальные результаты, написаны и опубликованы в СССР и за рубежом несколько монографий и десятки работ, прочитано много лекций и докладов на всесоюзных, российских и международных конференциях. Продолжительное и плодотворное функционирование семинара явилось основанием для Министерства образования Российской Федерации, Российского государственного гуманитарного университета (РГГУ), Межвузовского центра по информационному обеспечению гуманитарного образования, кафедре математики, логики и интеллектуальных систем РГГУ и фирмы ФОРС для проведения научной конференции “Базы данных и информационные технологии XXI века”, посвященной 30-летнему юбилею семинара. Как председатель программного комитета конференции хочу выразить искреннюю благодарность всем организаторам этого научного события и всем членам программного и организационного комитетов. Особо я хотел бы поблагодарить Е.М.Бениаминова, С.Н.Бычкова, А.О.Голосова, О.Ю.Горчинскую и Т.А.Стрешневу.

продолжение


Л.А.Калиниченко
д.ф.-м.н., профессор,
зав. лабораторией Института проблем информатики РАН

 Л.А.Калиниченко. Неоднородность и каноническое моделирование данных: ретроспективный взгляд

Доклад предатавляет собой попытку дать ретроспективный взгляд на методы создания канонических моделей данных в распределенных системах интеграции информации. Учитывая ограниченное время доклада и юбилейный характер семинара, в докладе дан краткий обзор подходов, исследовавшихся в более чем 20 летний промежуток времени в Лаборатории композиционных методов проектирования информационных систем ИПИ РАН. В этой ретроспективе выделяются три периода:

  • период структурированных моделей данных (доминировавший до середины 80х годов 20 столетия);
  • период объектных моделей и интероперабельного конструирования систем (начался в конце 80х годов);
  • период взрыва неоднородности источников информации (начался в середине 90х годов).

Этим трем периодам сопоставляются различные методы отображения моделей данных и создания канонических моделей систем интеграции информации, которые разрабатывались в ИПИ РАН.

продолжение


Марианна Розенфельд
Stanford University
Education Program for Gifted Youth
marianna@epgy.stanford.edu

 М.Розенфельд. Система дистанционного обучения в Стэнфордском университете

EPGY - это межфакультетская исследовательская лаборатория в Стэнфордском Университете которая разрабатывает multimedia курсы предназначенные для самостоятельного изучения с помощью компьютера и предоставляет их способным детям школьного возраста.

Наряду с разработкой курсов EPGY осуществляет администрацию, инструктаж и научную обработку собранных данных о процессе обучения.

EPGY предлагает курсы по математике, физике, программированию, английской грамматике и литературе, теории музыки, от арифметики второго класса до университетских курсов по теории чисел и квантовой механике. Каждый курс содержит полный материал, соответствующий официальным школьным программам; курсы университетского уровня соответствуют программе Стэнфорда. По окончании каждого курса ученики сдают письменный заочный экзамен и получают сертификат об успешном окончании.

продолжение


М.Р. Когаловский
к.т.н., доцент,
зав. лабораторией Института проблем рынка РАН, Москва
kogalov@cemi.rssi.ru

 М.Р. Когаловский. Технологии XML и XML-данные

Вторая половина 90-х годов стала временем рождения новых технологий управления данными в среде Веб, основанных на разработанном консорциумом W3C стандарте расширяемого языка разметки XML. Их создание направлено, прежде всего, на преодоление ограничений существующей версии Веб и разработку технологической платформы Веб нового поколения, называемого семантическим Веб, на обеспечение возможности его развития на длительную перспективу.

Функциональное ядро новой технологической платформы Веб, называемой в докладе платформой XML, составляет комплекс стандартов консорциума W3C, основанных на языке XML. Важное место занимает в ней также ряд других стандартов, расширяющих функциональные возможности ядра, однако, не основанных на языке XML или разработанных другими организациями.

Стандарты платформы XML быстро завоевали широкое признание. Ряд из них уже стал стандартами де-факто. Эти стандарты имеют довольно широкую сферу применения, которая выходит за рамки непосредственных потребностей Веб. Они оказывают заметное влияние на развитие стандартов в других областях информационных технологий как в горизонтальной, так и в вертикальной сферах, в частности, в технологиях баз данных, хранилищ данных, CASE-технологиях, технологиях интеграции данных, в области электронных библиотек, электронного бизнеса, им отводится важное место в технологиях электронного правительства. Платформа XML обеспечила эффективные возможности интеграции Веб-приложений. Активно развиваются тенденции интеграции технологий XML с другими пластами информационных технологий.

продолжение


Ольга Горчинская
к.т.н., старший консультант фирмы ORACLE

 О.Горчинская. Хранилища данных и технологии информационного анализа

Доклад посвящается информационным технологиям в области создания и использования информационно-аналитических систем.

В общем виде функционирование современной информационно-аналитической системы состоит в следующем. Данные поступают из различных внутренних транзакционных систем, от подчиненных структур, от внешних организаций в соответствии с установленным регламентом, формами и макетами отчетности. Вся эта информация проверяется, согласуется, преобразуется и помещается в хранилище и витрины данных. После этого пользователи с помощью специализированных инструментальных средств получают необходимую им информацию для построения различных табличных и графических представлений, прогнозирования, моделирования и выполнения других аналитических задач.

продолжение


А.О.Голосов
к.т.н., генеральный директор холдинга “ФОРС”

  А.О.Голосов. Управление информационными ресурсами в государственном секторе

Доклад посвящен практическому опыту создания баз данных и прикладных информационных систем. Описан ряд проектов, которые были выполнены компанией "ФОРС" в интересах различных государственных организаций.

Хотелось бы особенно подчеркнуть, что семинар "Теория и методология проектирования баз данных" под руководством М.Ш. Цаленко, тридцателетие которого мы сегодня отмечаем, оказал серьезное влияние не только на науку, но и на практическую деятельность в области создания информационных систем. Так, например, создание компании "ФОРС" до некоторой степени связано с деятельностью семинара. Основатели "ФОРС" работали во ВНИИСИ и являлись слушателями этого семинара. Когда в 1983 году встал вопрос о СУБД для внутренних проектов Института, выбор в первую очередь опирался на те знания, которые были получены нами на семинаре. Научная значимость систем управления реляционными базами данных не вызывала сомнений, однако промышленные СУБД, основанные на реляционном подходе только появлялись и выбор Oracle был не столь очевиден как сегодня. Впоследствии работа с технологиями и продуктами Oracle стала основным направлением деятельности компании "ФОРС". В этом году мы отмечаем 20-летие первого проекта, выполненного нами на платформе Oracle. Конечно, корпорация Oracle появилась бы в России и без семинара М.Ш.Цаленко, но в успехе компании в России есть и небольшая заслуга участников семинара, которые просветительской деятельностью подготовили почву для успешного движения СУБД реляционного типа в нашей стране.

продолжение


М.Ш.Цаленко
д.т.н., профессор

  М.Ш.Цаленко. Нерешенные проблемы теории баз данных и нереализованные проекты их применения

В докладе были обсуждены следующие темы:

  1. Если реляционные алгебра имеет конечное число образующих и конечные домены, то в силу известной теоремы Е.М.Бениаминова она является прямой суммой алгебр отношений. Отсюда следует, что такую алгебру можно считать подалгеброй алгебры отношений со значениями в конечной булевой алгебре, отличной от двухэлементой алгебры. Семантика элементов расширенной булевой алгебры остаётся невыясненной, хотя она играет существенную роль в теории баз данных с неполной информацией.
  2. Алгебра иерархически организованных отношений достаточно подробно описана в литературе. Однако возможность использования иерархических схем отношеннй при проектировании и интеграции баз данных практически не исследована.
  3. Изучение структур научных теорий в естественных и гуманитарных науках является интересной задачей гносеологии. Один из возможных подходов к этой проблеме состоит в построени баз данных тезаурусов научных теорий на основе списков терминов, содержащихся обычно в любой специализированной монографии. В докладе перечислены некоторые количественные характеристики таких тезаурусов, которые могут оказаться полезными при сопоставлении структур научных теорий.
  4. В 1993-1994гг. Было разработано техническое задание на создание банка данных “Интеллектуальный потенциал высшей школы России“. Основные идеи этого проекта сохраняют свою ценность и по сей день и могут оказаться полезными при реорганизации учреждений науки.

С.Д. Кузнецов
д.т.н., с.н.с., главный научный сотрудник Института системного программирования РАН
kuzloc@ispras.ru

  С.Д. Кузнецов. Три манифеста баз данных:
ретроспектива и перспективы

В период с 1989 по 1995 гг. авторские группы, включающие известных специалистов в области баз данных, подготовили и опубликовали три документа [1-3], которые отражали точки зрения авторов относительно перспектив развития технологии баз данных. С легкой руки авторов хронологически первого документа эти документы получили название манифестов, что, в общем-то, отражало их суть: в каждом из документов провозглашался набор идей и требований, на которых, по мнению авторов, должны были базироваться системы баз данных следующего поколения.

Интересно отметить различия между коллективами авторов каждого из манифестов. “Манифест систем объектно-ориентированных баз данных” [1] (далее для краткости мы будем называть его Первым манифестом) написан академическими исследователями; почти все они являются профессорами различных университетов. Конечно, это нашло свое отражение в стиле Первого манифеста – очень мягком и умеренно рекомендательном (хотя по своему духу предложения этого манифеста были весьма радикальными).

продолжение


Е.М. Бениаминов
д.ф.-м.н., профессор Института лингвистики РГГУ
beniamin@rsuh.ru

  Е.М. Бениаминов. Системы формирования и использования баз понятий и проблемы построения открытых языков представления знаний

Люди, изучающие или строящие новые области знаний, вынуждены формировать свой язык, адекватный этой области знаний. Новые идеи, образы, понятия оказывают влияние на язык. Это происходит на всех уровнях деятельности человека. Обычный бытовой язык может входить в противоречие с языком описания мира новых идей, и люди, сталкивающиеся с этими мирами, вынуждены придумывать новые специализированные языки (не термины, названия, а языки).

В настоящее время сложилась возможность создания электронных сред для поддержания процессов формирования и интеграции специализированных языков.

В докладе предлагается к рассмотрению первая версия системы Windows ЭЗОП (Элементов Задач и ОПределений), предназначенная для формирования баз понятий и языка проблемной области.

продолжение


Л.И. Бородкин
д.ист.н., к.т.н., профессор, зав.лабораторией исторической информатики Исторического ф-та МГУ им. М.В.Ломоносовa
Borodkin@hist.msu.ru@rsuh.ru

  Л.И. Бородкин. Современные технологии анализа хаоса в истории

Опыт применения компьютеров в исторических исследованиях насчитывает уже четыре десятилетия. Однако реальный рост приложений информационных технологий в этой сфере начался с конца 1980-х гг., когда на исторические факультеты университетов и в академические институты исторического профиля пришли первые персональные компьютеры. Сейчас, по истечении 15 лет можно выделить три направления приложений ИТ в исторических исследованиях, оказавших наибольшее воздействие на развитие новой научно-прикладной области, получившей название исторической информатики: базы данных, компьютерное моделирование исторических процессов, Интернет-ресурсы. Становление первого направления проходило в дискуссиях о соотношении т.н. источнико-ориентированного и проблемно-ориентированного подходов к созданию баз данных на основе исторических источников, в интеллектуальном поле развивающейся теории и методологии проектирования баз данных. В этой связи можно отметить роль семинара, руководимого д.т.н. М.Ш.Цаленко и его книги, ставшей культовой в то время. Обобщение опыта создания баз данных в исторических исследованиях было сделано к середине 90-х гг. И.М.Гарсковой.

продолжение



 

Небольшой фоторепортаж с конференции.
М.Ш.Цаленко с друзьями, сподвижниками, учениками
 

Л.А.Калиниченко, М.Р.Когаловский, М.Ш.Цаленко

М.Р.Когаловский, О.Ю. Горчинская, М.Ш.Цаленко

Оживленная научная дискуссия в фойе. В центре: М.Ш.Цаленко и О.В.Голосов, проректор Финансовой Академии при Правительстве Российской Федерации

Е.М.Бениаминов и С.Д.Кузнецов
слушают доклад Л.А.Калиниченко

На конференции было много молодых слушателей

Обучение - всегда актуально. М.З.Розенфельд отвечает на вопросы после доклада

Конференция - лучшее место для личного знакомства: М.Р.Когаловский и А.О.Голосов

Встреча через 40 лет: преподаватель (М.Ш.Цаленко) и студент (А.В.Бачин) мех-мата МГУ 1963-64 г.

Преподаватель должен быть доволен таким учеником:
М.Ш.Цаленко и А.О.Голосов



 М.Ш.Цаленко. Чему нас учит история
(продолжение)

1. Рождение семинара

Осуждая культ личности,
мы не можем отрицать
важную роль личности в истории.

М.Ш.Цаленко

Семинар, о деятельности которого пойдет речь ниже, возник совершенно непредсказуемым образом для его первых участников, включая и его руководителя, в результате неожиданных и смелых решений трех лиц: министра обороны СССР маршала А.А.Гречко, заместителя директора ВГПТИ ЦСУ СССР В.М.Савинкова и директора того же института О.В.Голосова.

Маршал Гречко в 1973 году принял решение об изменении статуса военных высших учебных заведений, особенно военных академий, а заодно о сокращении и “улучшении” кадрового состава общенаучных кафедр. В то время я работал доцентом кафедры математики Военной инженерной академии им. Ф.Э.Дзержинского, и мои научные интересы касались исключительно современной алгебры. Как результат решения министра обороны мне было предложено покинуть академию, вслед за создателем кафедры математики профессором МГУ П.А.Тумаркиным, тогдашним заведующим кафедрой, лауреатом Ленинской премии профессором МГУ Б.М.Левитаном, профессорами Б.П.Демидовичем и А.А.Юшкевичем. Поэтому летом 1973 г. мне пришлось заняться поисками нового места работы.

Неожиданно в моей квартире раздался телефонный звонок и незнакомый человек, назвавшийся Владимиром Макаровичем Савинковым, пригласил меня для переговоров о возможном сотрудничестве. То, что он сказал во время нашей первой встречи, я постараюсь воспроизвести дословно: “Нам нужна научно-исследовательская лаборатория по базам данных. Я предлагаю Вам создать такую лабораторию. Сотрудников Вы подбираете сами, и сами устанавливаете им режим работы”.

Все в этом предложении противоречило регламентированным “правилам игры”. Во-первых, моя научная работа в то время не имела какой-либо связи с информатикой. Во-вторых, в составе проектно-технологического института не полагалось иметь научно-исследовательской лаборатории. В-третьих, свободный режим для научных сотрудников был исключительной редкостью.

Я принял сделанное мне предложение, несмотря на его парадоксальность, потому что инстинктивно почувствовал перспективность и фундаментальность нового поля исследований, где современная алгебра, по-видимому, могла стать важным инструментом математического моделирования. Как вскоре выяснилось, базы данных стали одним из основополагающих элементов новых информационных технологий, совершивших вторую научно-техническую революцию.

Мне не пришлось искать первых сотрудников: мои коллеги по кафедре математики Г.Л.Литвинов, ученик известного геометра П.К.Рашевского, и В.Н.Туловский, ученик Б.М.Левитана, узнав о сделанном мне предложении, приняли решение перейти вместе со мной в ВГПТИ.

К сожалению, наш переход не прошел безболезненно, поскольку проблема кадрового состава беспокоила и отдел кадров ЦСУ СССР, начальник которого отказался визировать приказ о приеме на работу трех вышеперечисленных лиц. Тем не менее, директор ВГПТИ О.В.Голоcов счел возможным подписать приказ без соответствующей визы, и лаборатория, в нарушение всех правил, была создана.

Мы сразу поняли, что нам необходимо многое выучить и немедленно начали читать книги по информатике и научную периодику, а для осознания прочитанного нужен специальный семинар, организованный в лучших традициях знаменитых математических семинаров МГУ. Такой семинар был особенно важен для формирования плана нашей собственной научно-исследовательской работы. Одновременно мы стали посещать семинар В.М.Савинкова, на котором подробно обсуждалась разработка системы управления базами данных НАБОБ. Нас приняли исключительно дружелюбно, хотя увлеченные своей сложной и трудоемкой работой профессиональные программисты, руководимые Ф.Л.Фрилендером, могли с полным правом смотреть на нас, как на самозванцев. Таким образом, благодаря В.М.Савинкову и О.В.Голосову, мы оказались в очень благоприятной атмосфере, и нужно было продемонстрировать, на что мы способны.

2. Деятельность семинара

Друзья мои, прекрасен наш союз...
А.С.Пушкин
Не знаю ничего лучше “Апассионаты”
В.И.Ленин

Начиная с этого момента, следует иметь в виду, что работа семинара не являлась частью плана работы лаборатории, хотя многие результаты плановой работы рассказывались на семинаре. Семинар был добровольным и открытым для других объединением талантливых людей, которым проблематика теории баз данных показалась близкой и интересной, и поэтому они были готовы тратить свое свободное время на изучение научной литературы и ее обсуждение внутри семинара, делиться своими идеями и решать проблемы, близкие их индивидуальным вкусам. Расширение состава семинара происходило достаточно быстро, в нем стали участвовать сотрудники ВИНИТИ, ИПУ, ВНИИСИ, ВЦ АН СССР и других институтов, а впоследствии – мои аспиранты из МГПИ им. В.И.Ленина.

Назову имена некоторых участников семинара, десятилетиями приходивших на его заседания и внесших свой вклад в развитие теории баз данных и методологии их проектирования: Е.М.Бениаминов, ныне доктор физико-математических наук, профессор РГГУ, В.Б.Борщев, ныне доктор физико-математических наук, ведущий научный сотрудник ВИНИТИ, В.А.Брудно, бессменный секретарь семинара, М.В.Хомяков, всегда полный оригинальных идей, утрата которого ощущается и по сей день, А.О.Голосов, ныне директор фирмы ФОРС, осуществляющей проектирование банков данных с использованием программного обеспечения фирмы ORACLE, О.Ю.Горчинская, ныне работающая в московском отделении ORACLE, С.М.Ефимова, безвременно ушедшая из жизни М.Е. Иофинова, С.В.Петров, С.К.Сагнаева, ныне заведующая кафедрой информатики.

Начиная с 1975 года научно-исследовательская лаборатория ВГПТИ начала выпускать отчеты, в которых основной акцент был сделан на точное математическое описание как реляционной модели баз данных, так и на ряд других прикладных задач (оптимизация использования оперативной памяти, моделирование распределенных банков данных и т.п.). В это же время начала активно действовать Рабочая группа по программному обеспечению банков данных, созданная при Государственном комитете по науке и технике под руководством Г.К.Столярова. В.М.Савинков, будучи заместителем председателя этой группы, активно способствовал сначала распространению этих отчетов, а затем публикации двух моих обзорных статей в сборнике “Алгоритмы и организация решения экономических задач” в 1977 г. С этого момента и лаборатория, и семинар получили известность за пределами Москвы, и на наших заседаниях стали выступать с докладами гости из Риги, Свердловска, Новосибирска и других городов.

Хотя научно-исследовательская лаборатория ВГПТИ перестала существовать в 1977 году, семинар продолжал работать без перерыва. Научная активность участников семинара была чрезвычайно высокой. Начиная с 1977 года, ими были опубликованы несколько монографий, многие десятки, если не сотни, научных статей в российских и зарубежных изданиях, сделаны десятки докладов на национальных и международных конференциях, защищены кандидатские и докторские диссертации. Роль семинара в генерировании новых теоретических идей в теории баз данных получила широкое признание, что позволило провести в 1983 году большую научную конференцию с участием представителей из многих городов страны, посвященную его десятилетнему юбилею. К сожалению, по итогам конференции не был издан сборник трудов, однако многие новые результаты, которые были тогда сообщены на конференции, были отражены в последующих публикациях их авторов. Остановлюсь на наиболее важных достижениях участников семинара. Первый новый результат был получен мною и Е.А.Неклюдовой, когда мы предложили свой алгоритм синтеза отношений в третьей нормальной форме, значительно расширив применение аппарата булевых функций. Насколько мне известно, никаких других значительных продвижений в проблеме синтеза сделано не было.

Затем Е.М.Бениаминов ввел аксиоматическое определение реляционных алгебр и показал, что всякая реляционная алгебра, удовлетворяющая некоторым условиям конечности, является прямой суммой алгебр отношения. Он же построил аналог классической теории Галуа для алгебр отношения. Эти замечательные результаты послужили толчком для последующих обобщений, описанных в моей книге “Моделирование семантики в базах данных” (1989 г.) и в книге Б.И.Плоткина “Универсальная алгебра, алгебраическая логика и базы данных” (1991 г.) адресованной исключительно профессиональным математикам. Третий выдающийся результат принадлежит С.В.Петрову, который доказал невозможность конечной аксиоматизации т.н. зависимостей по соединению, решив тем самым проблему, привлекавшую внимание всех ведущих специалистов в теории баз данных.

Наконец, в серии моих работ 1985-95 гг., некоторые из которых были выполнены совместно с М.А.Бабушкиным, Е.М.Гудыревой, Е.П.Емельченковым и С.К.Сагнаевой, теория реляционных баз данных была расширена в двух направлениях: а именно, были построены алгебры отношений с оценками истинности в т.н. полных гейтинговых алгебрах (базы данных с неполной информацией) и были описаны алгебры иерархических отношений. В обоих случаях были также изучены функциональные, многозначные и другие типы зависимостей.

Каждое достижение, каждая новая идея были вдохновляющим стимулом для всех участников семинара, чувствовавших себя сопричастными к нелегкому интеллектуальному творчеству, к нахождению решений сложных научных проблем.

3. Чему нас учит история

Я не люблю протяжных расставаний...
О.Э.Мандельштам
Ты следуй себе, как за ночью день,
И каждый тебе поверит.

Из латыни
Заимствовано у К.Маркса
из “Критики Готской программы”

В знаменитом Кабачке “13 стульев” пан Високовский говорил: “История учит тому, что никто не учит уроков истории”. И действительно, в своей повседневной деятельности мы зачастую не оглядываемся назад, поскольку живем в другой исторической реальности. Тем не менее, оглянувшись назад, можно сделать ряд выводов о том, что способствует успеху интеллектуального творчества в науке и искусстве, поскольку в них каждое достижение является уникальным результатом большого творческого напряжения и вдохновения.

  1. Часто новые направления возникают в результате добровольного объединения талантливых людей, испытывающих потребность в непрерывном интеллектуальном обмене со своими единомышленниками.
    Для иллюстрации укажу несколько примеров: “Могучая кучка”, “Товарищество передвижников”, Бурбаки, КОБРА (союз художников из КОпенгагена, БРюсселя и Амстердама, возникший в Париже в 50-е годы прошлого века).
  2. Добровольное объединение не сковывает свободы творчества, оставляя каждому выбор своей темы, своего метода работы и даже своей организации повседневной жизни.
  3. Для успеха творческого объединения, успеха не в будущем, не после смерти, а во время расцвета, необходима поддержка и признание социального окружения.

В этом отношении семинар, 30-летие которого отмечается и который был добровольным объединением творческих индивидуальностей, оказался в исключительном положении. В начале я уже писал о том, что нас необыкновенно дружелюбно приняли во ВГПТИ. Затем нас доброжелательно встретили на семинарах, конференциях, совещаниях Рабочей группы по банкам данных, объединившей известных профессионалов, занимавшихся разработкой систем управления базами данных. Эта доброжелательность переросла в доверие и уважение. Приведу только один пример, хорошо иллюстрирующий сказанное. В начале 1992 года Л.А.Калиниченко, представлявший СССР в международных организациях, занимавшихся проблемами баз данных, рекомендовал меня в качестве приглашенного докладчика на европейскую конференцию в Берлине для доклада “Теория баз данных в России (1979-1992 гг.)”, доверив мне право представить иностранным коллегам достижения не только участников семинара, но и других российских ученых. Наконец, наша деятельность нашла признание и в более широкой среде профессионалов, занимавшихся общими проблемами информатизации общества. Особенно важна была поддержка Д.С.Черешкина, который способствовал публикации многих наших работ в изданиях ВНИИСИ и привлек меня к разработке концепции информатизации общества.

Существенным стимулирующим элементом социального окружения являлась молодежь, которая приходила на семинар еще в студенческом возрасте, включалась в исследовательскую работу и продолжала ее в аспирантуре. Именно молодежь заставляла продумывать методические аспекты нашей деятельности, тщательно выбирать темы для самостоятельной работы будущих исследователей. Молодые люди приобщались к чтению научной периодики и к пониманию важности полноты информационного обеспечения. В этой связи я хотел бы отметить огромную роль А.О.Голосова, который в течение многих лет обеспечивал семинар самыми последними иностранными публикациями по базам данных. Без преувеличения можно утверждать, что наше информационное обеспечение было первоклассным.

Подведем итог сказанному. В науке и в искусстве иногда возникают творческие сообщества талантливых людей, вдохновленных общими идеями, общей областью поисков. Если это сообщество появляется в нужное время в нужном месте, то результаты его деятельности становятся социально значимыми и стимулируют развитие новых направлений исследований. Как все в истории, сообщества рождаются, действуют и умирают, оставляя в наследство будущим поколениям реальные интеллектуальные ценности, созданные вдохновением и постоянным нелегким трудом. Чем дольше будет использоваться это наследство, тем выше вознаграждение за годы труда и творчества.


 Л.А.Калиниченко. Неоднородность и каноническое моделирование данных: ретроспективный взгляд
(продолжение)

В первый период автором были введены основополагающие определения эквивалентности состояний баз данных, схем баз данных и моделей данных для того, чтобы при построении отображений разнообразных моделей данных в каноническую сохранялись операции и не было потери информации [1,2]. Каждая модель данных при этом определялась синтаксисом и семантикой двух языков – языка определения данных (ЯОД) и языка манипулирования данными (ЯМД). Основным принципом отображения произвольной исходной модели данных в целевую модель (каноническую) явился принцип коммутативного отображения моделей данных, согласно которому сохранение операций и информации исходной модели данных при ее отображении в каноническую достигается при условии, что диаграмма отображения ЯОД (схем) и диаграмма отображения ЯМД (операторов) являются коммутативными [2]. При этом необходимо, чтобы в диаграмме отображения схем отображение пространств состояний баз данных в отображаемых моделях было биективным. Вторым, не менее важным принципом отображения, был принцип расширения целевой модели данных. Согласно этому принципу, отображение осуществляется не непосредственно в целевую модель, а в ее расширение, определяемое аксиоматически, так чтобы целевая модель, расширенная набором аксиом, стала эквивалентной исходной модели. Наконец, третьим принципом явился принцип синтеза канонической модели, согласно которому фиксируется ее ядро, акиоматические расширения которого конструируются эквивалентно всевозможным исходным интегрируемым моделям данных, после чего объединения всех таких расширений вместе с ядром составляют результат синтеза канонической модели.

На основании названных принципов был разработан процесс конструирования отображений моделей данных, в котором в качестве формализма (метамодели) использовалась денотационная семантика, позволявшая демонстрировать коммутативность диаграмм отображения моделей данных [2]. Такой формализм оказался оправданным для точной спецификации связи семантики ЯОД и ЯМД разнообразных моделей данных с их синтаксисом. Доказательство коммутативности диаграмм отображения ЯОД достигалось методом струтурной индукции, а доказательство комутативности диаграмм отображения операторов реализовалось на основе правил эквивалентного преобразования функций метамодели.

Применение метода отображения моделей данных в этот период было продемонстрировано для случая, когда в качестве ядра концептуальной модели использовалась комбинация реляционной и слабоструктурированной модели данных, а в качестве исходных моделей использовались 12 наиболее известных в тот период разнообразных моделей данных (сетевых, включая КОДАСИЛ, иерахических, включая IMS, бинарных реляционных, слабо-структурированных (БАЗИС), и пр.). В результате этого процесса были построены необходимые отображения и была синтезирована каноническая модель данных. На основании этого подхода в тот период удалось создать систему интеграции неоднородных баз данных СИЗИФ [2].

В целом, при относительно небольшом числе исходных моделей данных, используемых в распределенной системе, этот подход, основанный на конструировании отображений моделей данных и доказательстве их коммутативности вручную, был вполне приемлемым и с практической точки зрения.

Во второй период, когда наряду с объектными моделями данных (которые сами стали внутренне расширяемыми) и идеями интероперабельности [4], появились новые формальные языки и методы разработки программ (исчисление уточнений, разработка программ на основе их пошаговых уточнений), описанный выше метод отображения моделей данных и построения канонических моделей был видоизменен следующим образом. В качестве формализма (метамодели) метода вместо денотационной семантики была применена AMN (Нотация Абстрактных Машин), позволяющая определять теоретико-модельные спецификации в логике первого порядка и осуществлять доказательство факта уточнения спецификаций [3,5]. Теория уточнений позволила развить основополагающие определения отношений между типами данных, схемами данных, моделями данных (сформулированные в первый период) так, чтобы вместо эквивалентности соответствующих спецификаций, можно было рассуждать о их уточнении [6]. Наличие специальных инструментов (B-технология) позволило осуществлять доказательство коммутативности отображений полу-автоматически: необходимые для доказательства уточнений теоремы генерируются B автоматически, а их доказательство (в общем случае) реализуется с помощью человека. В одной из работ [6] было показано, как характерный для объектной модели данных ODMG тип отображается в тип канонической модели данных с проведением всех необходимых доказательств.

Наконец, третий период, активно развивающийся сейчас, характерен взрывоподобным развитием числа и разнообразия моделей представления информации. Это происходит как в рамках конкретных распределенных инфраструктур (таких как архитектуры OMG (в частности, архитектуры, движимые моделями представления информации (MDA)), архитектуры семантического Web и Web сервисов, архитектуры электронных библиотек как коллективных хранилищ информации в различных предметных областях, архитектуры вычислительных решеток и решеток данных (Grid и Data Grid)), так и в стандартах языков и моделей данных (таких как, например, ODMG, SQL:1999, UML, моделей данных, рожденных на основе XML), процессных моделей и моделей потоков работ, семантических моделей (включая онтологические модели и модели метаданных), моделей цифровых репозиториев знаний (например, Цифровое Небо, Цифровая Земля, Цифровые Биоисточники).

Этот период потребовал разработки более совершенных моделей данных, которые можно было бы использовать в качестве ядра канонической модели (язык СИНТЕЗ [4] является представителем такого ядра). При сохранеиии основных принципов коммутативного отображения моделей данных, применении теории уточнения и даже наличии эффективных инструментальных средств проведения доказательств, представляется невозможным справляться вручную с таким многообразием моделей данных. Поэтому в третий период эти подходы дополнены компонентным подходом к проектированию канонических моделей [7]. Этот подход в общих чертах заключается в том, что типы данных в каждой исходной модели данных регистрируются в канонической модели [9] так, чтобы они могли служить уточнением уже введенных в каноническую модель типов или их композиций. Если таковых в существующей канонической модели не обнаруживается, следует осуществлять раширение канонической модели данных. Спецификации компонентов (типов данных) канонической и исходных моделей хранятся в репозитории, специальные инструментальные средства применяются для того, чтобы находить нужные компоненты, соспоставлять их между собой, устранять структурные и поведенческие различия компонентов, формировать их композиции, доказывать коммутативность отображений. Специальное исчисление типов [8] используется в рамках этого подхода.

Литература

  1. Kalinichenko L.A. Data model transformation method based on axiomatic data model extension. Proc. of the 4th International Conference on Very Large Data Bases (VLDB), West Berlin, 1978
  2. Калиниченко Л.А. Методы и средства интеграции неоднородных баз данных. Изд-во “Наука”, 1983
  3. Abrial J.-R. B-Technology. Technical overview. BP International Ltd., 1992
  4. Калиниченко Л.А. СИНТЕЗ – язык определения, проектирования и программирования интероперабельных сред неоднородных информационных ресурсов. ИПИ РАН, 1993
  5. Abrial J.-R. The B Book: assigning programs to meaning, Cambridge University Press, 1996
  6. Kalinichenko L.A. Method for Data Models Integration in the Common Paradigm. Proceedings of the First East European Symposium on "Advances in Databases and Information Systems", St. Petersburg, September 1997 (also Springer Workshop in Computing, Electronic Publication)
  7. Briukhov D., Kalinichenko L. Component-based information systems development tool supporting the SYNTHESIS design method. Proceedings of the East European Conference on "Advances in Databases and Information Systems", September 1998, Poland, Springer LNCS, 1998
  8. Kalinichenko L.A. Compositional specification calculus for information systems development. Proceedings of the 3rd East European Symposium on “Advances in Databases and Information Systems”, September 1999, Springer, LNCS N 1475
  9. Briukhov D.O., Kalinichenko L.A., Skvortsov N.A. Information sources registration at a subject mediator as compositional development. Proceedings of the 5th East European Conference on “Advances in Databases and Information Systems”, September 2001, Springer, LNCS

  Марианна Розенфельд. Система дистанционного обучения
в Стэнфордском университете
(продолжение)

EPGY предоставляет software и индивидуального инструктора. Общение с интруктором происходит по телефону, электронной почте и через EPGY Web сайт. Инструкторы также проводят занятия в "виртуальном классе" (системы CENTRA).

На своем компьютере ученик получает multimedia лекции, отвечает на вопросы (в том числе со свободной формой ответа) и выполняет задания, используя специализированные пакеты. Каждый ученик движется со своей скоростью; ученики получают разное количество лекций и упражнений в соответствии с их успехами. Данные о работе ученика (включая его ответы на все вопросы) накапливаются и время от времени передаются на EPGY-сервер. База данных EPGY содержит примерно 40 мллионов записей.

Разработанные в EPGY пакеты GeometryConstruction, StructuralInput, DerivationSystem и ProofEnvironment создают для ученика формализованную среду, где он должен выполнять вычисления и строить доказательства, причем компьютер проверяет каждый шаг и обеспечивает немедленную обратную связь. Автор курса имеет возможность указать ожидаемую структуру ответа и способы проверки его частей.

С 1992 года более 18000 учащихся в возрасте от 5 до 18 лет получили сертификат об успешном окончании. В настоящее время по программе EPGY работает 3312 человек, 188 из них в двух или более курсах одновременно.

Посетите epgy.stanford.edu!

References:

  • Successful Pedagogical Applications of Symbolic Computation by Raymond Ravaglia, Theodore Alper, Marianna Rozenfeld, and Patrick Suppes. Reprintedfrom Kajler, N, Computer-Human Interaction in SymbolicComputation, Springer-Verlag, 1999.
  • A Computer Environment for Writing Ordinary Mathematical Proofs.David McMath, Marianna Rozenfeld, Richard Sommer. Lecture Notes in Computer Science Volume 2250 / 2001, p 507. Proceedings of 8th International Conference, LPAR 2001, Havana, Cuba, December 3-7, 2001.

 М.Р. Когаловский. Технологии XML и XML-данные
(продолжение)

В докладе анализируются предпосылки создания платформы XML, анализируются и ее истоки - платформа создавалась отнюдь не "с чистого листа", дается краткий обзор функциональных возможностей комплекса стандартов, составляющих платформу, обсуждается истинный смысл концепции расширяемости, обозначенный в названии языка XML.

Центральное место в докладе занимает рассмотрение особенностей XML-данных и возможностей их моделирования, обеспечиваемых стандартами платформы, а также развивающихся подходов к управлению такими данными.

Основной структурной единицей XML-данных является XML-документ. С точки зрения моделирования XML-данных, целесообразно различать два их вида – документы, ориентированные на данные, и документно-ориентированные документы. Их существенное различие заключается в степени структурированности. Кроме того, для документно-ориентированных документов необходимо при выдаче их пользователю сохранять их исходное представление. Документы первого вида, представляющие структурированные данные, могут составлять информационные ресурсы традиционных систем баз данных. Документы второго вида – это слабоструктурированные данные. Для их поддержки, обработки и поиска в большей мере применимы технологии текстовых систем. Единство представления документов обоих видов средствами стандартов платформы XML создает основу для создания систем интеграции структурированных и слабоструктурированных данных.

На развитие технологий управления XML-данными весьма существенное влияние оказывают концепции и подходы, сложившиеся в области баз данных. Хотя и не в полной мере последовательно, стандарты платформы XML поддерживают такие важнейшие концепции технологий баз данных, как модель данных, многоуровневое представление данных, ограничения целостности данных, использование наряду с принципами самоописываемости данных также и отчужденной схемы данных, языки запросов и др.

Однако природа XML-данных и подходы к их моделированию имеют свои особенности. Они подробно анализируются в докладе.

Весьма важное место в платформе XML отводится стандартизации представления метаданных, описывающих структуру и семантику XML-данных, а также описания онтологий. Именно эти средства должны стать основой семантического Веб.

Заимствуя многие важные идеи в области технологий баз данных, стандарты платформы XML, в свою очередь, оказывают заметное влияние на дальнейшее развитие этих технологий. Популярность и активное распространение этих стандартов привели к рождению нового класса систем баз данных. Значительное место в докладе уделяется обсуждению этого нового формирующегося направления в технологиях баз данных - XML-ориентированных баз данных.

В настоящее время уже создан ряд коммерческих и свободно распространяемых СУБД для таких систем, которые принято называть «чистыми» XML-ориентированными СУБД. Вместе с тем, созданию инструментария управления XML-данными уделяется большое внимание в сложившейся индустрии программного обеспечения традиционных систем баз данных. Традиционные СУБД адаптируются к потребностям управления XML-данными. В результате в последнее время грань между функциональными возможностями "чистых" XML-ориентированных СУБД и СУБД, адаптированных к XML, постепенно стирается. Оснащенные дополнительными возможностями для работы с XML-данными последние версии традиционных СУБД ведущих поставщиков программного обеспечения систем баз данных эффективно справляются с проблемами управлениями базами данных, поддерживающими оба указанных выше вида XML-документов. Они стали по существу мультимодельными системами, способными работать с различными представлениями хранящихся в них XML-данных. Чрезвычайно развитую оснастку для работы с информационными ресурсами XML имеет, в частности, продукт Oracle 9i компании Oracle

В докладе рассматриваются функциональные возможности XML-ориентированных СУБД, вопрос о поддерживаемых этими системами моделях данных.

Обсуждаются, наконец, вопросы конвергенции и интеграции технологий XML и технологий баз данных. Наряду с поддержкой важнейших концепций управления данными традиционных СУБД в XML-ориентированных системах, в составе платформы XML разрабатывается предназначенный для них язык запросов XQuery. Возможности этого языка довольно легко применимы в системах интеграции данных для работы с реляционными данными и данными иерархической структуры, поддерживаемыми в традиционных СУБД. В области систем баз данных осуществляется "встречное движение". Компонент SQL/XML создаваемого нового стандарта языка SQL, называемого теперь SQL:2003, будет определять стандартные средства описания отображения информационных ресурсов XML в среду реляционных баз данных и, наоборот, реляционных данных и схем баз данных - в среду XML.

Технологии XML с полным правом рассматриваются как информационные технологии XXI века. Можно смело прогнозировать довольно долгую их жизнь. Основания для этого дают развитые функциональные возможности стандартов платформы XML, открытой для дальнейшего расширения. Функциональные возможности платформы разнообразны, они обеспечивают ряд альтернативных средств для выполнения некоторых важных функций и имеют модульную организацию. Благодаря этому различные по степени изощренности пользователи могут найти в ней функции, адекватные их потребностям, связанным не только со средой Веб, но и с различными другими областями применений информационных технологий.

Круг специалистов, заинтересованных в технологиях XML, интенсивно расширяется. Хотя разработка и развитие ключевых стандартов платформы XML осуществляются консорциумом W3C довольно высокими темпами, можно предположить, что для достаточно полной их практической реализации потребуется еще немало времени.

Некоторые использованные источники:

  1. Веселов В., Долженков А. Опыт построения XML-СУБД. Открытые системы. - 2002. - №6.
  2. Когаловский М.Р. Перспективные технологии информационных систем. - М.: ДМК Пресс, Компания АйТи, 2003. - 288 с.
  3. Когаловский М.Р. Стандарты XML и электронные библиотеки. Электронные библиотеки. Институт развития информационного общества. – 2003. - Том 6. - Выпуск 2.
  4. Когаловский М.Р. Энциклопедия технологий баз данных. – М.: Финансы и статистика, 2002. – 800 с.
  5. Когаловский М.Р. Развитие стандартов XML: новые возможности и применения. Сб. трудов Второй Всероссийской конференции “Стандарты в проектах современных информационных систем”, Москва, 27-28 марта 2002 г.
  6. Когаловский М.Р. Стандарты платформы XML и базы данных (обзорный доклад). Труды Третьей Всероссийской конференции “Электронные библиотеки: перспективные методы и технологии, электронные коллекции”, Петрозаводск, сентябрь 2001 г.
  7. Когаловский М.Р. Функциональные возможности и направления использования стандартов платформы XML. Сб. трудов Всероссийской практической конференции “Стандарты в проектах современных информационных систем”, Москва, 2001. – М.: Открытые системы, 2001. – С. 127-133.
  8. Когаловский М.Р. XML: возможности и перспективы. Часть 1. Платформа XML и составляющие ее стандарты. Директор информационной службы. Январь 2001, с. 24-28.
  9. Когаловский М.Р. XML: возможности и перспективы. Часть 2. Базы данных XML, семантика XML-документов, перспективы. Директор информационной службы. Февраль 2001, с. 16-20.
  10. Когаловский М.Р. XML: сферы применения. Директор информационной службы. Апрель 2001, с. 10-12.
  11. Когаловский М.Р. Абстракции и модели в системах баз данных. СУБД, 4-5, 1998.
  12. Цикритзис Д., Лоховски. Ф. Модели данных. – М.: Финансы и статистика, 1986.
  13. Berners-Lee T., Hendler J., and Lassila O. The Semantic Web. Scientific American. May 2001. http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html.
  14. Bourret R. XML and Databases. July, 2003. http://www.rpbourret.com/xml/XMLAndDatabases.htm
  15. Bourret R. XML Database Products. August 13, 2003. http://www.rpbourret.com/xml/XMLDatabaseProds.htm
  16. XML Activity/ World Wide Web Consortium. http://www.w3.org/xml/.
  17. XML:DB Initiative for XML Databases. http://www.xmldb.org/
  18. World Wide Web Consortium. http://www.w3.org/

  Ольга Горчинская. Хранилища данных и технологии информационного анализа
(продолжение)

В соответствии с этим в области информационных технологий, поддерживающих эти процессы, выделяют два направления:

  • Хранилища данных (Data Warehousing)
  • Средства анализа данных (Business Intelligence)

В рамках первого направления решаются задачи, связанные с особенностями хранения аналитической информации, а также со сбором данных из разнообразных источников, согласованием и повышением их качества и достоверности. Второе направление ориентировано на использование этой информации и включает различные методы и программные средства как оперативного, так и долговременного анализа данных, включая многомерный анализ, прогнозирование, автоматический поиск закономерностей и др.

В докладе проводится краткий обзор состояния как первого, так и второго направления. Более подробно рассматриваются основные подходы к проектированию хранилищ данных и обсуждаются отличия хранения аналитической информации от ситуации в обычных транзакционных системах. Особое внимание уделяется вопросам моделирования данных в аналитических системах и проводится сравнение средств реляционного моделирования с многомерными моделями, часто используемыми в аналитических системах и составляющими основу технологии OLAP. В заключение обсуждаются тенденции и перспективы развития информационных технологий для решения аналитических задач.


 А.О.Голосов. Управление информационными ресурсами в государственном секторе
(продолжение)

Проекты, на примере которых рассматривается основная проблематика доклада, можно условно разбить на две группы. Первая группа - проекты, связанные с экономической безопасностью (это проект ИСИНПОЛ, который был выполнен для Федеральной Службы налоговой полиции (ФСНП) и проект, выполненный для Комитета по финансовому мониторингу). Вторая группа - проекты, связанные с правовой информатизацией (это проект для Российского фонда правовых реформ, проект "Паутина" для ФАПСИ и проекты по созданию реестра прав на недвижимое имущество).

В докладе рассмотрены следующие вопросы.

    Проблемы консолидации информационных ресурсов и пути их решения.
  • Создание инструмента аналитика, основанного на методах структурного моделирования.
  • Методы идентификации информационных объектов. Инструментальные средства создания систем правовой информации и электронных библиотек. Система ЭЛАД, ее архитектура, базовая система понятий. Опыт применения в решении практических задач.
  • Системы избирательного распространения информации и их интеграция с традиционными технологиями баз данных.

 С.Д. Кузнецов. Три манифеста баз данных: ретроспектива и перспективы
(продолжение)

Примечание: Полностью доклад опубликовпн на сайте Citforum.ru по адресу http://www.citforum.ru/database/articles/manifests/

Авторы документа “Системы баз данных третьего поколения: Манифест” (Второго манифеста) являлись представителями индустрии (вернее, индустриально-ориентированных исследований). Второй манифест написан в более жестком стиле и во многом направлен на защиту инвестиций крупных компаний-производителей программного обеспечения SQL-ориентированных СУБД. Конечно, Второй манифест во многом представлял собой реакцию индустрии на революционные предложения Первого манифеста. Эти предложения подвергались критике, и если говорить очень грубо, критика заключалась в том, что, по мнению авторов Второго манифеста, можно добиться аналогичных результатов, не производя революцию в области технологии баз данных, а эволюционно развивая технологию SQL-ориентированных СУБД.

“Третий манифест” (так и будем называть его далее) являлся одновременно наиболее консервативным и наиболее радикальным. Консервативность Третьего манифеста заключается в том, что его авторы всеми силами утверждают необходимость и достаточность использования в системах базах данных следующего поколения классической реляционной модели данных. Радикальность состоит в том, что (a) авторы полностью отрицают подходы, предлагаемые в первых двух манифестах, расценивая их как необоснованные, плохо проработанные, избыточные и даже вредные (за исключением одной общей идеи о потребности обеспечения развитой системы типов); (b) фактически, авторы полностью отбрасывают технологию, созданную индустрией баз данных за последние 25 лет, и предлагают вернуться к истокам реляционной модели данных, т.е. начальным статьям Э. Кодда [4].

После издания манифестов прошло в среднем около 10 лет. Как кажется автору этой статьи, пришло время оглядеться и оценить, каким образом реально повлияли эти документы на развитие технологии баз данных. Сбылись ли ожидания авторов хотя бы одного из манифестов? Не пора ли придумывать новый манифест, или же время манифестов прошло? В данной статье не делаются попытки заглянуть в будущее (как показывает история, эта задача является неблагодарной и безнадежной). Ограничимся взглядом на недавнее прошлое и настоящее.

В трех основных разделах статьи поочередно обсуждаются основные идеи манифестов и рассматривается их влияние на развитие соответствующих направлений области баз данных. Все приводимые характеристики отражают исключительно личное (и во многом субъективное) мнение автора.

  • [1] Malcolm Atkinson, Francois Bancilhon, David DeWitt, Klaus Dittrich, David Maier, and Stanley Zdonik: “The Object-Oriented Database System Manifesto”, Proc. 1st International Conference on Deductive and Object-Oriented Databases, Kyoto, Japan (1989). New York, N.Y.: Elsevier Science (1990). (Имеется русский перевод: М. Аткинсон и др. “Манифест систем объектно-ориентированных баз данных”, СУБД, No. 4, 1995, http://www.osp.ru/dbms/1995/04/23.htm )
  • [2] M. Stonebraker, L. Rowe, B. Lindsay, J. Gray, M. Carey, M. Brodie, Ph. Bernstein, D. Beech. “Third-Generation Data Base System Manifesto”. Proc. IFIP WG 2.6 Conf. on Object-Oriented Databases, July 1990, ACM SIGMOD Record 19, No. 3 (September 1990). (Имеется русский перевод: Стоунбрейкер М. и др. “Системы баз данных третьего поколения: Манифест”, СУБД, No. 2, 1996, http://www.osp.ru/dbms/1995/02/23.htm )
  • [3] Hugh Darwen and C. J. Date. “The Third Manifesto”. ACM SIGMOD Record 24, No. 1 (March 1995). (Имеется русский перевод: Х. Дарвин, К. Дейт. “Третий манифест”, СУБД, No. 1, 1996, http://www.osp.ru/dbms/1996/01/23.htm )
  • [4] E. F. Codd: “A Relational Model of Data for Large Shared Data Banks”, CACM 13, No. 6 (June 1970). Republished in “Milestones of Research”, CACM 26, No. 1 (January 1982). (Имеется русский перевод: Кодд Е. А. “Реляционная модель для больших совместно используемых банков данных”, СУБД, No. 1, 1995, http://www.osp.ru/dbms/1995/01/01.htm).

 Е.М. Бениаминов. Системы формирования и использования баз понятий и проблемы построения открытых языков представления знаний
(продолжение)

Система ориентирована на программистов, инженеров по знаниям и проблемных специалистов (не являющихся профессиональными программистами) для представления понятий проблемной области и непроцедурного описания задач с использованием введенных понятий.

Основное отличие разрабатываемой системы от систем подобного рода состоит в возможности подстраивания языка системы к языку представляемой области знаний по мере пополнения библиотеки понятий понятиями и языковыми шаблонами этой области знаний.

Пользователи системы могут средствами ЭЗОП формализовать понятия своей области и расширить язык системы собственными языковыми конструкциями (шаблонами), используемыми в этой области. При описании новых понятий или при описании задач введенные понятия и языковые конструкции могут использоваться в равной степени с системными. В системе имеется развитый язык запросов, предназначенный для тестирования введенных понятий и решения элементарных задач.


 Л.И. Бородкин. Современные технологии анализа хаоса в истории
продолжение

В данном докладе рассматриваются возможности второго из упомянутых направлений ИТ-приложений в исторических исследованиях, связанного с применением методов и технологий нелинейного моделирования исторических процессов. Отмечается, что в течение последнего десятилетия все большее внимание в работах историков-методологов привлекают концепции синергетики и тесно связанной с ней теории хаоса. Центральный вопрос, который обсуждается историками в этой связи – влияние случайностей, которые принципиально невозможно предугадать и прогнозировать, на общий характер развития изучаемого процесса. С этим вопросом связаны и новые подходы к изучению альтернатив общественного развития, возникающих в точках бифуркации. Не менее важным для историков является и технологический аспект применения синергетики в исторических исследованиях. Дело в том, что если источники дают возможность реконструировать достаточно длинные временные ряды, характеризующие существенные свойства изучаемого процесса, то с помощью специальных компьютеризованных методик можно проверить гипотезу о наличии хаотических режимов. Подтверждение этой гипотезы дает ключ к пониманию резких изменений (как количественных, так и качественных) в динамике процесса, которые могут происходить и без сколько-нибудь заметных внешних причин, в силу нелинейного его характера.

В докладе дается краткий обзор опыта построения нелинейных моделей исторических процессов, детектирования (с помощью специального универсального программного обеспечения) хаотических режимов в эмпирических исторических рядах динамики. Предлагается нелинейная модель динамики социальных конфликтов в российской промышленности начала ХХ века. С помощью этой модели анализируются эффекты самоорганизации, неустойчивого поведения в рассматриваемой системе. Компьютерное моделирование позволило выявить условия, при которых процессы самоорганизации в рабочей среде могут приводить к взрывному характеру конфликтов, к нелинейным эффектам в их развитии в силу действия внутренних факторов. Показано, что динамика стачечных волн может иметь неустойчивый, хаотический характер, когда малые (возможно, случайные) воздействия приводят к резким изменениям стачечной активности.

Анализ предложенной модели стачечного движения показал наличие трех типов динамики, каждому из которых соответствует свой аттрактор, к которому сходятся решения системы дифференциальных уравнений независимо от начальных условий (речь идет об устойчивой точке (фокусе), предельном цикле, странном аттракторе). Тип динамики определяется соотношением управляющих коэффициентов модели, которых в нашей системе дифференциальных уравнений - четыре. Эти коэффициенты (параметры модели) характеризуют скорость роста стачечной волны при отсутствии давлении властей (т.е. совокупное воздействие негативных факторов жизни рабочих, подталкивающих их к протесту); силу “сдерживающих” факторов (потенциальную или реальную угрозу со стороны властей) в отсутствии агитации; эффективность агитации и ее возрастание в результате взаимодействия агитаторов. Численное моделирование позволило определить те области значений параметров модели, в которых поведение системы имеет устойчивый или неустойчивый (хаотический) характер.

E-mail this page