Введение
Базы данных использовались в вычислительной технике с незапамятных времен. В первых компьютерах использовались два вида внешних устройств – магнитные ленты и магнитные барабаны. Емкость магнитных лент была достаточно велика. Устройства для чтения-записи магнитных лент обеспечивали последовательный доступ к данным.
Для чтения информации, которая находилась в середине или конце магнитной ленты, необходимо было сначала прочитать весь предыдущий участок. Следствием этого являлось чрезвычайно низкая производительность операций ввода-вывода данных во внешнюю память. Магнитные барабаны давали возможность произвольного доступа, но имели ограниченный объем хранимой информации.
Разумеется, говорить о какой-либо системе управления данными во внешней памяти, в тот момент не приходилось. Каждая прикладная программа, которой требовалось хранить данные во внешней памяти, сама определяла расположение каждого блока на магнитной ленте. Прикладная программа также брала на себя функции информационного обмена между оперативной памятью и устройствами внешней памяти с помощью программно-аппаратных средств низкого уровня. Такой режим работы не позволяет или очень затрудняет поддержку на одном носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации во внешней памяти.
1.Базы данных: основные понятия, история возникновения и развития
Современные базы данных хранят не только данные, но и информацию
База данных (БД) - это организованная структура, предназначенная для хранения информации. Современные базы данных позволяют размещать в своих структурах не только данные, но и методы (т. е. программный код), с помощью которых они взаимодействуют с потребителем или другими программно-аппаратными системами [12].
Системы управления базами данных (СУБД) - это набор программных средств, предназначенных для создания структуры новой базы данных, наполнения ее контентом, редактирования контента и визуализации информации. Под визуализацией базы данных информации понимается выбор отображаемых данных в соответствии с указанным критерием, их упорядочение, оформление и последующая доставка на устройство вывода или передача по каналам связи [5].
Хранение информации - одна из важнейших функций компьютера. Одним из распространенных способов такого хранения является база данных.
База данных (БД) - это совокупность взаимосвязанных, хранимых вместе данных при наличии такой минимальной избыточности, которая позволяет оптимально их использовать для одного или нескольких приложений.
Создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляется централизованно с использованием специальных программных средств - системы управления базами данных.
Система управления базами данных (СУБД) - это набор программных и языковых инструментов, необходимых для создания баз данных, их обновления и организации поиска необходимой информации в них [13].
2. Принципы организации данных, лежащие в основе современных СУБД
Правильно спроектированная БД должна удовлетворять следующим требованиям:
1 Минимальная избыточность. Непротиворечивость.
2 Целостность данных.
3 Независимость данных.
4 Возможность ведения (добавления и удаления) и актуализации (корректировки, модификации) данных.
5 Безопасность и секретность.
6 Высокая производительность. Минимальные затраты.
7 Соблюдение стандартов[4].
Минимальная избыточность означает то, что данные в БД не должны дублироваться. Избыточность данных, если она существует, влечет две опасности:
- неоправданно большой расход памяти и уменьшение времени отклика системы при обработке излишне больших объемов данных.
- нарушение непротиворечивости данных, т.е. возникновение такой ситуации, когда в различных местах машинной памяти хранятся противоречивые данные. Возникновение противоречивости чрезвычайно опасно для БД.
Несоответствие может возникнуть в результате корректировки избыточных данных. При внесении изменений в логическую запись может случиться, что отдельные экземпляры этой записи, хранящиеся в разных местах в машинной памяти, не исправляются. Программист должен уделять особое внимание организации процесса корректировки избыточных данных и разработке специальных программ, предотвращающих несоответствия.
Несоответствие также может возникнуть при корректировке данных без избыточности. Централизованное хранение данных это высокая вероятность того, что два или более пользователей будут нуждаться в одних и тех же данных одновременно. Если один из пользователей получает доступ к данным, а другой вносит в них изменения, будут получены противоречивые данные. Это объясняется тем, что процесс обновления данных требует определенного времени, в течение которого одни и те же данные появляются на разных этапах обновления. При доступе к таким данным в параллельных программах будет получена противоречивая информация.
3.Основные тенденции и перспективы развития БД
Взрывной рост WWW, а также потребности областей EOSDIS, электронной коммерции, электронных публикаций создают ряд сложных проблем, которые должны быть решены в будущих системах баз данных. Ниже приведены ключевые области исследований, связанные с поддержкой мультимедиа.
1) Третичная память
Для хранения мультимедийных объектов требуется огромное количество внешней памяти, что ставит перед нами новые задачи. Для таких приложений, как EOSDIS или электронные библиотеки, характерны объемы данных размером в петабайт. Несмотря на экспоненциальный рост емкости дисковых устройств, маловероятно, что в ближайшем будущем можно будет управлять только магнитными или магнитооптическими дисками для размещения данных такого объема. В результате возникает проблема эффективного управления новым уровнем иерархии хранения данных, называемым третичной памятью. На третичном уровне носители используются на несколько порядков медленнее, чем на уровне «вторичной памяти» (диски), но также гораздо более емкими. Третичные запоминающие устройства - это накопители стоек с компакт-дисками или магнитными лентами, где для установки нужной ленты или ленты обычно используется механический рычаг.
2) Новые типы данных
Каждый тип мультимедийной информации (тип данных) требует своего собственного набора операций и функций и их эффективной реализации на основе соответствующих структур данных и методов доступа. Например, в недавнем экспериментальном тестировании объектно-ориентированных систем было огромное расхождение в эффективности обработки больших текстовых объектов. Задача выбора последнего байта из текстовой строки длиной в мегабайт в некоторых системах была решена путем чтения всего текста сначала, а затем с помощью операции «взять последний байт», в то время как в других было возможно выбрать только последний байт или небольшая хвостовая часть струны [14].
3) Качество обслуживания
Ряд новых исследовательских проблем связан с доставкой мультимедийных данных сразу нескольким пользователям. В целом, если объем данных велик, доступ к ним и предоставление результатов выборки могут стать узкими местами. Однако доступ к крупным мультимедийным объектам часто осуществляется очень предсказуемым образом.
Заключение
Современное общество невозможно представить без компьютера. Они настолько широко и глубоко внедрились в нашу жизнь, что очень трудно назвать какую-либо сферу деятельности человека, где бы они не использовались. В связи с этим серьезные требования предъявляются и к аппаратной части современных компьютеров, и к используемому программному обеспечению.
В основном именно программное обеспечение, или, иными словами, программные продукты, обеспечивают возможность широкого использования компьютеров. Стоит нам переустановить программное обеспечение компьютера или добавить какой-либо новый программный продукт, и мы сможем решать на этом компьютере совершенно новые задачи.
Следовательно, используемые программные продукты должны соответствовать определенным критериям, обеспечивающим надежность работы компьютера и удобство работы пользователя.