Организации стараются справиться с быстро растущим объемом, скоростью поступления и разнообразием данных, создаваемых сегодня внутри и за пределами компаний и требующих обработки. Заказчики ищут технологии, которые помогут не только обработать эти данные и управлять ими, но — главное — осмыслить их, чтобы понять истинные механизмы движения рынка, который они обслуживают, и собственные показатели на фоне конкурентов.

Понимая важность этого нового направления ИТ, CRN/США подготовил список «Big Data 100», где впервые представлены вендоры, которые предложили продукты и услуги, помогающие организациям справиться с лавиной «больших данных».

25 вендоров управления данными

Рик Уайтинг, CRN/США

Представляем 25 компаний, ра­ботающих на рынке Big Data в сегмен­те управления данными, включая давних игроков отрасли и стартапы.

10gen

Компания 10gen разрабатывает и предоставляет коммерческую поддержку для MongoDB, свободной СУБД документов, которая помогает справиться с ограничениями производительности и масштабируемости, опираясь на технологию реляционных СУБД. Одним из создателей компании, стартовав­шей в 2007 г., был учредитель и директор по технологии DoubleClick Дуайт Мерриман. Добавим, что 10gen получила более 81 млн. долл. венчурного финансирования.

Actian

Компания предоставляет ряд технологий для обработки Big Data, в том числе ана­литическую базу данных Vectorwize, базу данных оперативной обработки транзакций (OLTP) Ingress, бизнес-приложения Action Apps и систему быстрой прикладной раз­работки (RAD) OpenRoad. Actian покупа­ет сейчас Pervasive Software, разработ­чика ПО аналитики «больших данных», за 162 млн. долл.

Actifio

Actifio предлагает средства для управления «копиями данных» — стремительно ­растущим объемом вторичной информации, создаваемой процессами защиты данных, резервного копирования, аварийного восстановления, аналитики, обеспечения бесперебойности бизнеса, тестирования и разработки и др. Компания подчеркивает, что ее технология снижает расходы на оборудование и лицензирование ПО, уменьшает используемую полосу пропус­кания и емкость, требуемую для хранения данных.

Attunity

Компания поставляет ПО, которое служит для обеспечения доступа к данным, обмена и дистрибуции данных в гетерогенной сре­де, включая облако. Ее линейка включает средства репликации данных, подключения к ним, сбора изменений, тиражирования файлов, управляемой их пересылки и доставки облачных данных.

Basho Technologies

Basho разрабатывает свободную распределенную базу данных Riak на основе NoSQL, которая автоматически перераспределяет данные при масштабировании (наращивании) информационных систем, оставляя их доступными даже при отказе физических машин. Basho нацелена на быстрорастущие Web-компании, операторов облачных систем и крупные организации.

Citus Data

Компания предлагает распределенную базу данных CitusDB, которая построена на уже проверенной СУБД PostgreSQL, позволяющей делать аналитические запросы к очень большим массивам. Главным аргументом продаж CitusDB является ее способность осуществлять SQL-запросы к данным в кластерах Hadoop, не загружая их в саму базу данных, что дает возможность SQL-запросов в реальном времени к хранимым в Hadoop данным.

Couchbase

Это компания, разработавшая свободную ­базу данных того же наименования на основе NoSQL, которая стала популярной в интерактивных мобильных и веб-приложениях. Обеспечивая поддержку всего сообщества Couchbase, компания зарабатывает продажей коммерческих версий ПО с лицензиями и предлагая услуги индивидуальной ­поддержки.

DataStax

DataStax предлагает платформу для «больших данных» DataStax Enterprise, которая сочетает в себе NoSQL-базу данных Apache Cassandra, Hadoop и Apache Solr, свободную технологию корпоративного поиска. В январе была выпущена версия DSE 3.0, имеющая самые обширные средства безопасности среди всех СУБД NoSQL-типа, заявляет компания.

Datawatch

Datawatch предлагает ряд программных продуктов «оптимизации информации» и объединенного управления информацией, которые помогут организациям сочетать структурированные, неструктурированные и полуструктурированные данные, сделав их доступ­ными для аналитических приложений и других систем обработки Big Data. Недавно компания объявила о поддержке Hadoop в своем продукте DataWatch Data Pump.

EnterpriseDB

Компания разрабатывает ПО и услуги корпоративного класса на основе свободной базы данных PostgreSQL. EnterpriseDB позиционирует себя как недорогую альтернативу реляционной СУБД Oracle и свободной базе данных MySQL, которой теперь владеет Oracle после покупки Sun Microsystems.

Garantia Data

Garantia Data предоставляет расширен­ные услуги облачного хранения-в-памяти на основе NoSQL, в частности для хостинга массивов данных Redis и Memcached. ­Redis — это свободная СУБД-в-памяти, а Memcached — распределенная система кэширования памяти общего назначения. Эти услуги стартовали в феврале; ежемесячная плата варьируется в зависимости от количества Гбайт.

Informatica

Informatica — поистине гранд-дама инте­грации данных: компания была создана в 1993 г., задолго до рождения самого термина «Big Data». Informatica разрабатывает широкий спектр ПО для интеграции корпоративных данных, интеграции облачных данных, обеспечения качества данных, репликации данных, управления мастер-данными, виртуализации данных, управления жизненным циклом информации и др.

MarkLogic

Флагманский продукт MarkLogic Server на основе NoSQL работает с популярным ПО бизнес-аналитики, таким как IBM Cognos и Tableau, обеспечивая поддержку рас­пределенной файловой системы Hadoop (HDFS). Компания предлагает и другие ­продукты, предназначенные для «больших данных»: это средства поиска и прикладной разработки.

MemSQL

MemSQL разработала СУБД-в-памяти того же наименования, которая ускоряет работу приложений Big Data в 30 раз по сравнению с другими системами, заявляет компания. MemSQL нацеливает свою технологию на рынки финансовых услуг и цифровой рекламы, где столь важен быстрый анализ машинных данных.

Neo Technology

Фирма разработала графовую базу данных Neo4j. Это особая категория технологии СУБД на основе NoSQL, которая использует структуру графов ­вместо индексов, чтобы быстро строить модели подключенных массивов данных и выполнять запросы к ним. Основным заказчиком является Cisco, которая заменила систему управления мастер-данными, использовавшую СУБД Real Application ­Clusters от Oracle, на Neo4j.

Rainstor

Компания Rainstor разрабаты­вает базу данных и связанные с ней продукты для управления «большими данными». Ее СУБД, выполняемая в родном формате Hadoop, включает улучшенную технологию сжатия данных, которая снижает стоимость их хранения на величину до 90%, заявляет компания.

Recommind

Recommind разрабатывает ПО для управления неструктурированными данными, включая ­полное руководство данными (governance) и анализ. Ее платформа CORE (Context Optimized Relevancy Engine) обеспечивает автоматический сбор, организацию и анализ больших объемов информации из многих источников внутри корпоративной сети и за ее пределами.

Revelytix

Revelytix лишь недавно предложила ознакомительную версию своего ПО интеграции данных Loom Dataset Management для Hadoop. Компания подчеркивает, что ее технология облегчает работу с Hadoop для специалистов по изучению данных, помогая управлять файлами Big Data и строить приложения аналитики. В состав ПО входят также средства отслеживания изменений данных и функции аудита.

Simba Technologies

Компания разрабатывает ПО ­доступа к данным, подключения к массивам и анализа для реляционных и многомерных источников данных, используя стандарты ODBC, JDBC, SQL и XML. В частности, компания разра­ботала драйверы ODBC для Apache Hive и HBase и сотрудничала с Intel, чтобы обеспечить ODBC-доступ к ее дистрибутиву Apache Hadoop.

Splice Machine

На фоне всеобщего интереса к базам данных на основе NoSQL Splice Machine идет своим путем, предлагая SQL-совместимую СУБД, предназначенную для приложений Big Data. Компания заявляет, что ее Splice SQL Engine, построенный на каркасе Hadoop, обеспечи­вает те же преимущества масштабирования, что и NoSQL, но без необходимости заново ­переписывать приложения и средства бизнес-аналитики, основанные на SQL.

Syncsort

Компания Syncsort предлагает ряд программных продуктов и услуг интеграции и защиты данных. Ее продукт DMExpress работает с системами HP Vertica и EMC Greenplum, ускоряя обработку «больших данных». Ее технология интеграции данных используется также в проекте Hadoop, который разрабатывается под эгидой Apache Software Foundation.

Talend

Talend предлагает свободное и коммерческое программное обеспечение для работы с Big Data, включая интеграцию ­данных, обеспечение качества данных, управление метадан­ными и средства полного руководства данными (governance). Ее Talend Big Data Platform объединяет в себе множество инструментов с такими функциями, как планировщик заданий Hadoop и средства подключения для NoSQL.

Unravel

Компания предлагает средства оптимизации, чтобы помочь пользователям тратить меньше времени на рутинные задачи взаимодействия с Hadoop и нацелиться на анализ Big Data для принятия более верных деловых решений. Unravel пред­лагает также серию инструментов визуализации, в частности Profiler, который позволяет спланировать потоки данных.

WibiData

Компания WibiData использует Apache Hadoop, HBase и другие технологии, позволяя анализировать огромные объемы данных о поведении пользователей, включая информацию профилей и транзакционные данные, регистрируемые в журналах. Идея в том, что все данные, имеющие отношение к пользователю, заказчику и т. д., держатся в одном месте.

XtremeData

Компания XtremeData разрабатывает СУБД с массовым параллелизмом для создания хранилищ данных, которые могут быть развернуты локально (on premise) или в облаке. Ме­ханизм этой СУБД способен ­обрабатывать сотни терабайт данных и позиционируется как альтернатива другим базам данных SQL-типа, хранилищам данных на основе устройств и платформе хранилища данных Apache Hive.

25 вендоров инфраструктуры и услуг

Рик Уайтинг, CRN/США

Amazon Web Services

Amazon Web Services, включая Amazon Elastic Compute Cloud и Simple Storage Service, предоставляет услуги онлайн-хранения данных, облачной инфраструктуры и онлайн-приложения, которые стали надежной платформой для многих проектов Big Data.

CA Technologies

Компания предлагает линей­ку ПО управления данными ARCserve и инструменты моделирования данных ERwin, помогая организациям справляться с трудностями обработки «больших данных». В частности, ­ERwin помогает управлять все более сложными структурами данных при проектировании баз данных, хранилищ и приложений.

Cloudera

Cloudera предлагает платформу для Big Data на основе собственного дистрибутива Apache Hadoop (Cloudera Enterprise) вместе со средствами его внедрения (Cloudera Quickstart) и администрирования (Cloudera Manager). Ее Cloudera Navigator поможет администраторам, менеджерам данных и аналитикам обеспечить защиту, управление и исследование данных в рамках Cloudera Enterprise.

Cloudwick Technologies

Компания предоставляет ряд услуг на платформе Hadoop, включая разработку и развертывание систем на базе Hadoop в организациях, их интеграцию с другими источниками данных внутри организаций, мониторинг этих систем и анализ данных, собранных внутри Hadoop.

Compuverde

Compuverde специализируется на разработке «зелёных» систем хранения «больших данных» для поставщиков решений, телекоммуникационных компаний и организаций. Компания заяв­ляет, что ее облачные системы Compuverde Object Store способны хранить свыше 100 петабайт неструктурированных данных и обеспечивают коэффициент готовности 99,999%.

Continuuity

Компания рассматривает прикладную разработку как следующую большую и трудную задачу в Big Data. Ядром облачных предложений этого стартапа явля­ется платформа разработки Continuuity App-Fabric (в настоящее время в стадии бета), построенная на базе Hadoop и сопутствующих компонентов. App-Fabric служит также средой ­выполнения и платформой для приложений обработки «больших данных».

DataGuise

Один из аспектов Big Data, тревожащий многих: потенциально большие объемы конфиденциальных данных могут остаться незащищенными. Компания ­DataGuise предлагает свою линейку инструментов DgSecure, позволяющих выявить конфиденциальные данные в органи­зации, обеспечить их защиту в соответствии с регулятивными требованиями HIPAA (Закон о правилах передачи и ответственности за документацию о страховании здоровья) и PCI (стандарты безопасности данных отрасли платежных карточек) и применить шифрование данных, маскирование и другие способы защиты.

Dell

На арене «больших данных» компания предлагает продукт Dell/Hadoop Big Data Solution, объединяющий в себе дистрибутив Cloudera Hadoop, серверы Power­Edge C самой Dell и ПО Business Analytics от Pentaho. Dell предлагает также ПО ­Kitenga Analytics (после по­купки Quest в прошлом году) для анализа структурированных и неструктурированных данных в среде Hadoop.

EMC

Являясь ведущим вендором систем хранения данных, EMC как никто понимает все трудности, связанные с управлением огромными объемами информации. Помимо своего магистрального бизнеса компания предлагает линейку ПО бизнес-аналитики Greenplum, а также Pivotal HD, собственный дистрибутив Hadoop вместе с услугами SQL-базы данных с массовым параллелизмом и технологией виртуализации VMware.

Hewlett-Packard

Компания имеет целый ряд предложений оборудования, ПО и услуг на арене Big Data. Наверное, самой заметной является платформа аналитики для «больших данных» Vertica. Также компания недавно представила свои услуги управления информацией и аналитики HP Big ­Data Discovery Experience, которые помогут организациям извлечь больше ценных сведений из их массивов «больших данных».

Hortonworks

Это один из заметных стартапов на арене Big Data. Компания предлагает платформу Hortonworks Data Platform, построенную на собственном дистрибу­тиве Hadoop и сопутствующих компонентах, а также услуги поддержки и обучения и свободно доступную «учебную» версию Hadoop для опробования.

IBM

Со своим арсеналом серверов и СХД, баз данных (DB2, Informix, InfoSphere) и ПО бизнес-аналитики (Cognos, SPSS и др.) IBM смело может заявить, что имеет одно из самых обширных предложений на арене Big Data. Компания только что предста­вила версию своего сервера ­PureData System, готовую к работе с Hadoop, и ряд расширений к DB2, предназначенных для «больших данных».

Infochimps

Infochimps Enterprise Cloud — это пакет облачных услуг для разработки и развертывания приложений аналитики для Big Data в общедоступном и частном облаке. Система Infochimps включает поддержку хранения данных и доступа для Hadoop, баз данных HBase и NoSQL-типа и заказных приложений, позволяя организациям выполнять анализ данных реального вре­мени, специальный анализ и пакет­ную аналитическую ­обработку.

MapR Technologies

Выступая соперником Cloudera, Hortonworks и других постав­щиков дистрибутивов Hadoop, MapR предлагает несколько версий собственного дистрибутива Hadoop вместе с обучением, поддержкой и другими профессиональными услугами. Компания предлагает также ПО и услу­ги для вертикальных рынков: здравоохранения, производства и ретейла.

Microsoft

В отличие от IBM или Oracle Microsoft не работает на рын­ке оборудования, но имеет серьезное предложение для «больших данных» в лице своей СУБД SQL Server 2012 и ПО бизнес-аналитики. Компания предлагает HDInsight Services — услуги развертывания и предоставления кластеров ­Hadoop в облаке, построенные на базе Hortonworks Data Platform. HDInsight для Windows Server и Windows Azure находятся сейчас в бета-стадии.

Mortar Data

Компания Mortar Data предлагает весь инструментарий Hadoop на базе облака — по сути, это платформа-как-услуга, которая поможет разработчикам и аналитикам строить приложения для обработки гигантских массивов данных, значительно облегчая весь процесс. Предложение компании строится на основе ее собственной свободной платформы разработки.

NetApp

NetApp предлагает больше, чем просто оборудование для обработки «больших данных». Ее Open Solution for Hadoop — это готовая к развертыванию система хранения с поддержкой кластеров Hadoop для аналитики Big Data. Компания разрабатывает также репозитории корпоративного и распределенного контента, высокопроизводительную систему хранения с поддержкой распределенной файловой сис­темы Lustre для параллельной обработки.

Oracle

Oracle имеет широкий спектр продуктов для работы с Big Data, от своей флагманской реляционной СУБД до ПО бизнес-аналитики и «специализированных систем», таких как Exadata Database Machine. Ее сервер на аппаратной платформе Intel Oracle Big Data Appliance интегрирован с дистрибутивом Hadoop от Cloudera и ее собственной базой данных на основе NoSQL.

Rackspace

Компания предлагает ряд услуг, связанных с Hadoop, в том числе хостинг Hadoop для заказчиков на выделенных серверах или в виде услуг собственного частного облака. (Компания го­товит также общедоступные облач­ные услуги Hadoop.) Так­же Rackspace в партнерстве с Hortonworks предоставляет услуги прикладной разработки и проектирования системной ­архитектуры на базе своего ­дистрибутива Hadoop.

RightScale

Компания RightScale предлагает целый ряд облачных услуг предоставления, мониторинга, отчетности и защиты приложений Big Data, построенных на базе экосистем Hadoop и NoSQL. Ее предложение включает также ряд «серверных шаблонов» (Server Template), как называет их компания, размещенных на ее витрине MultiCloud Marketplace, в том числе Hadoop MapReduce, IBM BigInsights Hadoop Framework, MongoDB и Couchbase.

Software AG

Главным предложением компании на рынке Big Data является линейка ПО администрирования Terracotta. Эта линейка, которую Software AG приобрела вместе с одноименной фирмой-разработчиком в 2011 г., включает средства, позволяющие управлять данными в памяти, выполнять их анализ и действовать исходя из результатов. Этот инструментарий позволяет также повысить производительность и масштабируемость приложений и согласовать выполнение заданий обработки на множестве узлов.

StackIQ

Компания предлагает пакет StackIQ Enterprise Data, обеспечивающий развертывание и администрирование кластерных систем обработки «больших данных». Изначально продукт был ориентирован на поддержку дистрибутива Hadoop от Hortonworks, но недавно компания предложила «мультивендорную» версию с поддержкой дистрибутивов Hadoop от Cloudera, MapR Technologies, DataStax и других.

Teradata

Компания предлагает ряд аппаратных платформ (в том числе хранилище данных Teradata ­Active Enterprise Data Warehouse и устройство аналитики Teradata Aster Big Analytics Appliance), СУБД, инструменты анализа данных и аналитические приложения для ретейлеров, маркетинга, управления каналом, анализа информации о заказчиках, а также для авиаперевозчиков и других транспортных компаний.

Treasure Data

Компания предлагает облачную платформу анализа данных, которую называет Big Data-как-ус­луга. Организации могут выгрузить свои данные из операционных приложений, файлы системных журналов, информацию датчиков и т. п. в хранилище данных Treasure Data для анализа и затем получить результаты обработки, которые можно поместить в электронные таблицы, базы данных и другие приложения, используя интерфейсы SQL, JBC или ODBC.

Zettaset

Пакет Orchestrator, который предлагает Zettaset, работает с дистрибутивами Hadoop многих вендоров, автоматизируя и упрощая внедрение этой платформы. Что, наверно, еще важнее, он привносит свою меру безопасности «корпоративного класса» и соблюдения регулятивных требований.

Big Data 100: 50 вендоров бизнес-аналитики

Кристин Бент, CRN/США

1010data

Компания предлагает интегрированное решение, включающее СУБД и ПО аналитики, которое нацелено на рынки розничной торговли и продажи расфасованных товаров, финансовые фирмы, госсектор, здравоохранение и сектор телекоммуникационных услуг. Один из флагманских продуктов компании, Trillion-Row Spreadsheet, позволяет анализировать «большие данные» в знакомом формате, напоминающем интерфейс Microsoft Excel.

Actuate

Компания ведет свой собственный open-source проект BIRT, который посвящен построению свободной системы отчетности на базе Eclipse для веб-приложений. Ее платформа ActuateOne строится на базе проекта BIRT, обеспечивая поддержку целого ряда приложений аналитики «больших данных» и взаимодействия с заказчиками.

Alpine Data Labs

Компания, созданная бывшими членами команды Greenplum в EMC, специализируется на прогнозной аналитике. Ее аналитическая платформа работает с построенными на базе Hadoop и традиционными источниками данных и предельно проста в навигации и развертывании, заявляет компания.

Alteryx

Компания разрабатывает стратегическое ПО аналитики, по­могая организациям принимать верные решения. Ее облачный сервис Analytics Gallery упрощает публикацию и раздачу аналитических приложений, используя общедоступное и частное облако.

Attivio

Суть предложения Attivio — это соединение корпоративного поис­ка, бизнес-аналитики и «больших данных», чтобы дать организациям более четкую картину их бизнеса и данных. Предлагаемый компанией Active Intelligence Engine располагается между ­источниками данных и аналитическими приложениями, обеспечивая услуги поиска данных и интеграции.

Ayasdi

Разрабатывает ПО, помогающее организациям найти исходную форму их данных. Применяя сотни алгоритмов из раздела математики «топология», это ПО находит повторяющиеся закономерности и взаимосвязи внутри больших массивов данных, выявляя лежащие в их основе геометрические формы.

Birst

Компания стремится предоставить «большие данные» самим бизнес-пользователям, предлагая инструменты бизнес-аналитики с самообслуживанием и с выводом результатов на «приборные панели». Пакет бизнес-аналитики Birst позволяет объединить и анализировать данные из разных источников в реальном времени, а также задействовать библиотеку интерактивных средств визуализации, чтобы нагляднее представить результаты.

Chartio

Компания специализируется на интерактивных диаграммах и «приборных панелях» для аналитической обработки «больших данных». Chartio подчеркивает, что ее инструменты дают интуитивно понятный интерфейс, работающий по принципу «перетаскивания», так что бизнес-пользователи могут легко освоиться с ее инструментарием сами, не прибегая к помощи ИТ-персонала.

Cirro

Ставит своей целью свести к минимуму время на освоение аналитики для Big Data, пред­лагая решения, позволяющие анализировать большие массивы данных, используя имеющиеся средства анализа. Так, ее инст­румент Analyst for Excel позволяет выполнять анализ данных через Microsoft Excel, задействуя при этом библиотеку Cirro Function Library для типовых SQL-запросов и реализации функций Map/Reduce.

ClearStory Data

Компания понимает, сколь разрозненны сегодня источники данных организаций, и разрабатывает средства аналитики, позволяющие справиться с этой проблемой. Задействуя ее инструменты, пользователи могут охватить ­самые разные источники — будь то Hadoop, обычная реляционная база данных или вебсайты, такие как Facebook или Twitter, — и создать интерактивные отчеты на основе их анализа.

Continuum Analytics

Компания занята разработкой средств аналитики следующего поколения, стремясь сделать язык программирования Python столь же полезным и мощным инструментом анализа Big Data и других деловых данных, каким он стал в науке, инженерных дисциплинах и масштабируемых вычислениях.

DataGravity

DataGravity не сообщает подробностей о разрабатываемых ею решениях для Big Data, но всё же можно заключить, что она строит платформу управления данными и анали­тики, которая позволит извлекать полезную информацию из неструктурированных данных, не прибегая к «сложным пакетам ПО».

Datameer

Компания предлагает интегри­рованное решение для управления массивами «больших данных», их интеграции и анализа с самообслуживанием. Ее продукт — это единое приложение, которое не требует средств ETL (извлечения, преобразования и загрузки информации) или статических схем, так как уже включает в себя свыше 200 специальных функций.

Datasift

Разрабатывает платформу аналитики для «соцсетевых больших данных», специально предназначенную для поиска и анализа информации с сайтов соцсетей и других социальных медиа. Ее инструменты помогают организациям использовать данные из этих источников для управления отношениями с клиентами или отслеживания восприятия своего бренда на рынке.

Dataspora

Предлагает «платформу машинного самообучения», как она ее называет. Это решение использует сетевые модели и параллельные вычисления, помогая организациям понимать не только то, что происходит с их бизнесом в данный момент, но и чего они могут ожидать в ближайшем ­будущем.

DataXu

Компания хочет помочь игрокам рынка строить и укреплять свои бренды в сегодняшнем цифровом мире. Понимая, что традиционные методы марке­тинга уже не эффективны там, где правят Web и социальные сети, DataXu помогает рекламодателям использовать новые пласты Big Data, чтобы продвигать свои продукты по различным цифровым каналам.

Digital Reasoning

Digital Reasoning предлагает платформу Synthesys, которая может анализировать структурированные и неструктурированные данные, помогая обнаружить взаимосвязи между ними. Это решение нацелено на госструктуры и финансовые организации, где его можно использовать для выявления мошен­ничества и смягчения других рисков.

Emcien

Компания предлагает уникальные решения аналитики «больших данных» для розничной торговли, дистрибуции, произ­водственного сектора и госучреждений. Ее пакет EmcienMix позволяет организациям получить текущую картину покупательского поведения в реальном времени, а EmcienScout помогает правоохранительным органам изучать текущие данные, чтобы выявить потенциальные источники дестабилизации.

Glassbeam

Компания Glassbeam предлагает пакеты приложений аналитики «больших данных» для служб поддержки заказчиков, маркетинговых отделов и других групп. К примеру, группы технической поддержки или сервисного обслуживания клиентов могут ­использовать ее решения, чтобы предвидеть проблемы еще до того, как заказчик обратится за помощью.

GoodData

GoodData предлагает облачные приложения обработки «больших данных» (компания называет их «Bashes»), которые должны помочь организациям отслеживать спрос своих заказчиков и лучше его направлять. Недавно компания выпустила GoodSuccess Bash, который отслеживает уровень спроса на продукт среди ключевых клиентов организации.

Google

Присутствие Google на рынке Big Data держится на облачном сервисе BigQuery, который позволяет проводить интерактивный анализ огромных объемов данных — вплоть до миллиардов записей. Пользователи могут делать произвольные SQL-запросы к многотерабайтным массивам данных за считанные секунды, заявляет компания.

Hadapt

Преподносит свою Adaptive Analytic Platform как соединение лучшего из Hadoop и реляционной СУБД в единой платформе обработки Big Data. Результат, говорит компания, — высокопроизводительная система анали­тики, способная работать со структурированными и неструктурированными данными.

HStreaming

Платформа HStreaming на базе Apache Hadoop предоставляет функции аналитики для неструктурированных источников данных, таких как видеоконтент и встроенные датчики. Она совместима со всеми основными дистрибутивами Hadoop; типичные варианты применения включают анализ видеоданных, особенно в военной области, а также сетевой анализ и обнаружение мошенничества.

Information Builders

Компания нацелена на самые разные сферы применения ­своего пакета бизнес-аналитики для Big Data — от образования и здравоохранения до гостиничного бизнеса. Ее флагманский продукт WebFocus включает множество полезных инструментов, в том числе «приборные ­панели», «цифровые табло» и управляемую автоматизированную отчетность для построения отчетов аналитики и их последующей рассылки членам команды.

Jaspersoft

Компания Jaspersoft помогает визуализировать любые данные, будь то реляционные, OLAP (оперативной аналитической обработки) или Big Data, посредством интерактивных диаграмм на базе HTML5 и «приборных панелей». Можно выполнить анализ типа «что если...», используя готовые встроенные функции Jaspersoft, или встроить анализ на базе браузера в веб-приложение и внедрить его в рамках всей организации.

Karmasphere

Предложение компании включает три основных компонента: Karmasphere Analyst, который дает аналитикам информации доступ к структурированным и неструктурированным данным в Hadoop; Karmasphere Studio, предоставляющий инструменты для разработки заказных алгоритмов для Hadoop; и Karmasphere Analytics Engine, программное ядро всего предложения.

Kognitio

Компания преподносит свою Analytical Platform как первую аналитическую платформу, использующую вычисления-в-памяти. Она может быть развер­нута локально либо в частном или общедоступном облаке в качестве платформы-как-услуги и совместима с большинством решений ETL (извлечения, преобразования и загрузки информации) и бизнес-аналитики, имеющихся на сегодня.

LucidWorks

Компания LucidWorks применяет концепцию поисковых механизмов к «большим данным», предлагая платформу разработки, которая ускоряет и упрощает создание поисковых приложений корпоративного класса. Кроме того, ее LucidWorks Search может помочь улучшить настройку и оптимизацию поиска для получения более надежных результатов.

MicroStrategy

Компания предлагает ряд решений-в-памяти и бизнес-аналитики, предназначенных для обработки «больших данных», в том числе MicroStrategy Mobile — инструмент аналитики, позволяющий извлекать полезную ­информацию из источников Big Data и создавать оптимизированные для сенсорного экрана отчеты прямо с мобильных устройств.

NGData

NGData имеет ряд решений для рынка Big Data, но ее флагманским инструментом аналитики является пакет Lily, способный дать организациям более глубокое понимание их базы ­заказчиков. Позиционируемый как «инструмент потребительской аналитики», Lily помогает выявить тренды и изменения в поведении потребителей, чтобы построить более действенную рекламу.

Palantir Technologies

Пакет приложений для интеграции и анализа неструктурированных данных, созданный компанией Palantir, быстро нашел признание в органах разведки, оборонных и правоохранительных органах. Также он помогает подкрепить планы аварийного восстановления и использовался во время урагана Сэнди, помогая отслеживать волонтеров и выявлять районы, больше всего нуждающиеся в помощи.

Panarama Software

Пакет Necto — это веб-решение бизнес-аналитики, позволяющее подключиться почти к любому источнику данных и строить их модели, используя технологию вычислений-в-памяти. Necto включает также встроенный механизм рекомендаций бизнес-аналитики, который может создавать ассоциации между данными, профили пользователей и др., выявляя взаимосвязи, о которых никто даже не подозревал.

Panopticon

Компания Panopticon выделяется среди других вендоров бизнес-аналитики для Big Data со своим неуклонно растущим портфелем средств визуализации данных. Предложение компании насчитывает более 15 решений для визуализации данных в реальном времени, в том числе Treemaps — интерактивные «карты» данных, которые представляют информацию в разноцветных рамках и шрифтом разного размера, помогая мгновенно выявить корреляции и выбросы.

ParAccel

Компания предлагает столбцовую базу данных с массовым ­параллелизмом, которая опти­мизирована для высокопроизводительного анализа Big Data. Стремясь лучше вооружить пользователей, компания встроила в свою базу данных более 500 аналитических функций, готовых к использованию (в дальнейшем можно постепенно создать собственную библиотеку новых, более сложных функций).

Paradigm4

Компания Paradigm4 — ведущая сила open-source проекта SciDB — свободной СУБД, специаль­но предназначенной для обработки больших объемов данных при решении научных проблем. Paradigm4 предлагает собственную разновидность SciDB, включающую сложные аналитические функции, которые выполняются параллельно на всех вычислительных узлах, чтобы обеспечить максимально высокую производительность.

Pentaho

Pentaho Business Analytics — это интерактивная веб-платформа, обеспечивающая доступ к источникам данных, создание отчетов и «приборных панелей» и визуализацию этих данных — будь то из Hadoop, NoSQL или традиционной БД. Intel включила технологию Pentaho в новую версию своего дистрибутива Hadoop.

Platfora

Компания предложила ПО бизнес-аналитики-в-памяти, которое позволяет анализировать данные непосредственно в Hadoop без необходимости строить сложное (и дорогостоящее) хранилище данных или традиционный склад данных. Главный управляющий компании заявил, что это решение может означать «начало конца хранилищ данных».

Qlik Technologies

Платформа Business Discovery компании Qlik Technologies предоставляет функции бизнес-аналитики и поиска для «больших данных», но что действительно делает ее уникальной на рынке, так это прицел на коллективную работу. Она обеспечивает непрерывный обмен между членами команды, позволяя делать закладки и оставлять комментарии прямо в BI-приложениях Qlik, где их могут видеть другие пользователи.

Qubole

Компания Qubole разрабатывает «самомасштабируемую», как она ее называет, платформу для анализа и обработки «больших данных». Цель компании — предложить облачные услуги Apache Hadoop и Hive, которые оставляют «за кадром» все сложности инфраструктуры, позволяя избавить ИТ-подразделения от необходимости строить собственные кластеры Hadoop и обеспечивать их сопровождение.

Retention Science

Customer Profiling Engine компании Retention Science — это маркетинговая платформа, позволяющая использовать «большие данные». Она помогает онлайн-продавцам анализировать огромные объемы данных, чтобы добиться подлинной лояльности клиентов. В частности, приложения этого стартапа могут помочь компаниям, работающим в области интернет-коммерции, прогнозировать, насколько чувствительны к цене потенциальные покупатели, и предложить со­ответствующие промоакции, ­которые действительно будут эффективны.

Revolution Analytics

Revolution Analytics предлагает ПО и услуги, предназначенные для пользователей свободного языка программирования R, который служит для разработки статистического ПО и прило­жений анализа данных. Компания предлагает корпоративную и бесплатную версии своего ПО Revolution R; первая отличается тем, что включает расширенные функции аналитики для обработки терабайтных массивов данных.

SAP

Давний и крупнейший вендор на рынке ПО бизнес-аналитики. Главное предложение компании в сегменте Big Data — это ее СУБД-в-памяти HANA, которая значительно ускоряет манипулирование данными и их аналитическую обработку. Компания предлагает также другие пакеты аналитики — SAP Business Suite, SAP Business One и SAP BusinessObjects, — которые можно использовать вместе с HANA.

SAS

Пакет Visual Analytics от SAS — это набор инструментов, которые помогут аналитикам и бизнес-пользователям быстро исследовать большие объемы данных. SAS — крупнейшая в мире частная ИТ-компания; в 2012 г. ее продажи выросли на 5,4%, в том числе благодаря расту­щему спросу на приложения для анализа «больших данных».

SiSense

Компания SiSense заявляет, что создала «самую компактную в мире систему аналитики для Big Data». Это ее пакет Prism, способный перемолоть 1 Тбайт данных на ноутбуке, имеющем всего 8 Гбайт оперативной памяти. Компания позиционирует свой пакет Prism, который недавно стартовал в облаке Win­dows Azure, как более дешевую и простую в использовании альтернативу предложениям других вендоров.

Splunk

Предлагает одноименный механизм обработки данных, кото­рый позволяет осуществить сбор, индексирование и анализ машинных данных, создаваемых приложениями, серверами и устройствами, будь то фи­зическими, виртуальными или в облаке. Технология Splunk обеспечивает также возможность поиска по этим данным и позволяет анализировать оперативные и ретроспективные данные из одного и того же источника.

Sumo Logic

Компания предлагает облачный сервис управления журналами и аналитики, который предназначен устранить слож­ности, связанные с сопровож­дением локаль­но развертываемого ПО, выполняющего те же функции. Он помогает органи­зациям глубже заглянуть в корпора­тивные файлы жур­налов и, возможно, сделать ­новые открытия, касающиеся безопасности, операционной обра­ботки и др.

Tableau Software

Tableau Software специализи­руется на визуальной анали­тике для «больших данных», и ее главный козырь это предельно простой пользовательский интерфейс, использующий технику «перетаскивания». Предложения Tableau интегри­рованы почти со всеми ведущими дистрибутивами ­Hadoop, включая Hortonworks и Cloudera.

Tibco

Помимо своих инструментов аналитики и визуализации для Big Data, компания предлагает также платформу анализа событий, которая позволит организациям быстро собрать и проанализировать информацию о происходящем в их отрасли и действовать исходя из выявленных тенденций — например, по-другому спланировать сложную цепочку поставок, чтобы избежать задержек в будущем.

Tracx

Tracx разработала систему управления информацией с соцсетей, позволяя организациям «просеивать» данные с Facebook, Twitter и других им подобных сайтов, чтобы получить наиболее точные сведения о восприятии их компании. Организации могут также использовать Tracx, чтобы оценить свои показатели на фоне конкурентов и получить полную картину всего, что касается их бренда и его обсуждения в соцсетях.

Zoomdata

Решения Zoomdata помогают орга­низациям охватить внутренние и внешние источники данных, свести воедино эту информацию и визуализировать интересующие их потоки данных в реальном времени. Только что стартовала бета-версия приложения для Big Data; версия для iPad уже предлагается.


Версия для печати (без изображений)