Установка MarkLogic в Unix/Linux

Установка MarkLogic в Unix/Linux

MarkLogic — американское программное обеспечение, которое разрабатывает и предоставляет корпоративную базу данных NoSQL. Компания была основана в 2001 году и базируется в Сан-Карлосе, Калифорния. MarkLogic является частной компанией с более чем 500 сотрудниками и имеет офисы по всей территории США, Европы, Азии и Австралии.

MarkLogic насчитывает более 550 клиентов, включая Comcast, Deutsche Bank, Erie Insurance Group, Johnson & Johnson и армию США. Также шесть из десяти крупнейших мировых банков являются клиентами MarkLogic.

Для чего используется?

Может хранить большое количество информации, которая не имеет жёсткой структуры (в отличии от СУБД основанных на таблицах) и поиск по ней.

Какую модель использует MarkLogic?

MarkLogic имеет файлово-фолдерная модель БД. Почти каждая БД в ML — виртуальная ФС с каталогами, временными метками и разграниченным доступом. Каждый файл — документ XML, проиндексированный сервером; поиск осуществляется внутри любого XML с учётом его разметки.  Могут храниться также plain-text и binary документы, причём в последних можно осуществлять индексацию и поиск метаинформации. Встроена обработка PDF, изображений, архивов, документов MS Office и т.д. Для больших binary можно настроить прозрачное сохранение не в БД, а в файловую систему хоста.

Какой используется язык запросов?

  • Основной язык запросов — XPath, но чаще всего используется XQuery и известные как ‘FLWOR’. Запросы XQuery могут получаться сервером «на лету» от утилиты которая соединена с БД; а также взяты из самой БД или из ФС хоста.
  • Встроенные функции ML, которые позволяют осуществлять быстрый поиск по индексам и показать результаты в соответсвии с релевантностью. Результат любого запроса — множество строк в формате XML, plain-text или binary.

Исполнение запросов осуществляется либо через встроенный HTTP-сервер, либо через XDBC/ODBC.

Как можно работать с документами?

Изменение\сохранение документов доступно с помощью ML функций. Запрос XQuery — транзакция, а изменения по умолчанию заносятся в базу после успешного завершения работы скрипта. MarkLogic может валидировать данные средствами XML Schema в случае вызова соответствующей инструкции XQuery. Закачивание данных можно выполнять с помощью XQuery запросов через XDBC, через RESTful сервис или использовать WebDAV.

Как выполняется настройка MarkLogic?

Настройка выполняется через уже встроенный веб-интерфейс. Так же, можно редактировать конфиг-файлы.

Какая форма выпуска продукта?

Данное ПО — коммерческий, но можно получить продукт бесплатно ( но с урезанными возможностями, для примера: объём хранимых данных не должен быть больше 40GB; число используемых процессоров — 2; нет возможности кластеризации).

О внутреннем представлении

Database – это наивысшая абстракция над внутренним представлением данных в MarkLogic сервера. Она предоставляет доступ к данным как к единой сущности не зависимо от механизмов масштабирования и внутреннего представления.

Объект Database объединяет в себе настройки безопасности, схемы xml документов, набор триггеров, настройки in-memory cache, индексы, опции регулирующие поиск, настройки журналирования, опции репликации, настройки backup’a и набор объектов Forest.

Forest – это объекты в которых хранятся данные и индексы. База данных может иметь более одного объекта Forest и располагаться они могут как на одном так и на разных серверах. Механизм “local-disk failover” манипулирует объектами Forest, для этого одному объекту Forest назначается один и более “replica forest” объектов, что позволяет повысить надежность.

Forest имеет значительно меньше настроек по сравнению с объектами Database. Для Forest можно настроить расположение данных на файловой системе “data directory”, указать расположение для хранения больших объектов “large data directory” или расположение так называемой “fast data directory”, т.е. директории на быстрой файловой системе. “fast data directory” используется для хранения журнала транзакции и фрагментов данных. Эта директория должна располагаться на устройстве хранения отличном от того на котором располагается “data directory”. При заполнении “fast data directory” большие объекты из неё сливаются с данными находящимися в “data directory”. Внутри Forest данные хранятся в Stand объектах.

Stand – Является составной частью Forest объектов. Каждый Stand представляет собой упакованный бинарный файл, хранящийся в поддиректориях объекта Forest. Сам же Stand объект состоит их XML фрагментов.

Установка MarkLogic в Unix/Linux

Данная БД, поддерживает несколько ОС.

Установка MarkLogic на CentOS/RedHat

Ставим либы:

# yum -y install glibc.i686 gdb.x86_64 redhat-lsb.x86_64

Переходим на официальный сайт, регистрируемся и скачиваем пакет. Я скачиваю курлом:

# cd /usr/local/src && curl -O https://developer.marklogic.com/download/binaries/9.0/MarkLogic-9.0-1.1.x86_64.rpm?t=tOuB12O27H6ajih578b/C/&email=solo.metal%40bigmir.net

PS: Ссылка действительна только один раз, по этому вам необходимо будет регистрироваться самостоятельно. Так же, можно скачать прямо по ссылке ( без использования curl), но регистрация обязательна для данного продукта.

Выполняем установку:

# rpm -i /usr/local/src/MarkLogic-*.x86_64.rpm

ИЛИ:

# yum --nogpgcheck localinstall MarkLogic-*.x86_64.rpm

Для проверки статуса, используйте:

# /etc/init.d/MarkLogic status

Т.к он выключен, то запускаем службу:

# /etc/init.d/MarkLogic start

Запустили MarkLogic и нужно настроить его через веб-интерфейс. У меня это:

http://192.168.13.168:8001/

PS: Можно прописать у себя в /etc/hosts имя хоста — это будет удобнее.

Получаем начальную страницу:

Начальная страница MarkLogic

Нажимаем на «ok». Потребуется некоторое время, данная операция перезапустит службу. На следующем этапе, просят ввести некоторые данные:
Настройка MarkLogic кластер

Вводим данные и нажимаем «OK».

Где:

  • Host Name — hostname/IP ноды которую добавляем в кластер.
  • Admin Port — я ничего не менял и оставил 8001-й порт.
  • Protocol — Использующий протокол ( можно выбрать https).

На следующем этапе, вводим данные для входа — логин\пароль. Потом просят подтвердить данные действия и перекидывает в админ панель:

Админ-панель MarkLogic

В данной панели, можно настроить различные параметры. Так же, можно создавать пользователей, базы данных. Так же, можно добавить ноду в кластер и многое другое. Я ничего больше не делал, только установил для ознакомления.

Установка MarkLogic на Mac OS X

Не было нужды в установке.

ВЫВОД.

Не смотря на то, что имеется большое количество различных баз данных, данная реализация имеет свои положительные и отрицательные стороны ( собственно это логично). Данная реализация хорошо подходит для корпораций для которых нужна надежность, поддержка ( имеется интерпрайс релиз) и конечно же — BigData.

А на этом, у меня все. Тема «Установка MarkLogic в Unix/Linux» завершена.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.