11.07.2015 Views

Вісник № 13 PDF (Size: 2,65 МБ) - ХПІ - Національний технічний ...

Вісник № 13 PDF (Size: 2,65 МБ) - ХПІ - Національний технічний ...

Вісник № 13 PDF (Size: 2,65 МБ) - ХПІ - Національний технічний ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Dynamo – собственная разработка компании Amazon;ETL (Extract, transform and load – программные инструменты, используемыедля выведения данных из внешних ресурсов, трансформирования их в соответствиис операционными нуждами и выгрузка их в базы данных;Google File Systems;Handoop;SQL – компьютерный язык, разработанный для управления данными вреляционных базах данных. Этот инструмент позволяет вставлять, запрашивать,обновлять и удалят данные, а также управлять структурой баз данных иконтролировать доступ к данным.Другие инструменты включают Mashup (Мэшап), MetaData, HBase, BusinessIntelligence.Существует также множество методов визуализации информации,представленной большими данными. Такие методы, как кластерограмма,исторический поток (инструмент визуализации, отображающий вклад каждогоотдельного фактора в общий результат с течением времени). Очень удобноиллюстрируется на примере Википедии, где вклад каждого отдельного автора вконтент меняется со временем.Еще одним примером такой визуализации является тэговое облако, котороепомогает потребителям и бенефициарам больших данных интуитивно восприниматьзначение этих данных.Базой работы с большими данными является осознание различий междуданными, информацией и инсайтом (от англ. Insight). Данные представляют собойнабор знаков, цифровых, текстовых и графических, которые сами по себесоставляют определенную совокупность, чаще всего объединенную по одному илиряду признаков. Информация, в свою очередь, является результатом интерпретацииданных с помощью описанных нами инструментов и методов. Одни и те же данныемогут сгенерировать достаточно отдаленную по смысловому наполнениюинформацию в зависимости от используемых инструментов и методов, а такжесубъектов, анализирующих данные и потребителей данных. Таким образом,информация является более обширным понятием, чем данные в данном контексте.Последним звеном в этой цепочке является инсайт, то есть способ примененияполученной информации для получения положительного социального иэкономического эффекта. По сути, это соотношение информации и реальныхпроцессов, с ней связанных. По нашему мнению достичь правильного инсайта будетсложнее всего, особенно в странах с отсутствующей культурой обработки большихданных. Отсутствие опытных кадров в сфере анализа и инструментов обработкибольших данных сведет на нет весь потенциал от накопления самих данных.Подготовка специалистов в этой сфере не является процессом долгосрочным.Продолжительность подготовки может занять в среднем 2-3 года. Однако для стартаэтого процесса нужен существенный внешний импульс, скорее всего -государственное стимулирование. Специалистов нужно готовить заранее ввидутого, что определенный уровень подготовки требуется уже на этапе сбора иаккумуляции информации, а также ее правильного хранения.42

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!