Armazenar e processar documentos de tipos variados – como planilhas, imagens, e-mails, etc – de maneira eficiente, possibilita a extração de valor dos dados e a geração de insights que podem potencializar os negócios. O Azure Data Lake Storage Gen2 possibilita o armazenamento “inteligente” e seguro de dados estruturados e não estruturados, sendo uma alternativa séria para as organizações.
Veja também
- Benefícios tangíveis para o negócio na migração para a Nuvem
- Quando adotar técnicas de aprendizagem computacional?
O principal cenário de aplicação do serviço é quando percebe-se que dados relevantes, independentemente de formato, tamanho ou estrutura, estão sendo armazenados de maneira esparsa ou até mesmo indisciplinada – em diversas mídias de armazenamento, serviços de nuvem, conversas de WhatsApp, etc – impossibilitando a análise e a extração do valor contido nesses dados.
O Azure Data Lake Storage, ou ADLS, atualmente está na sua segunda versão, chamada de Gen2. O serviço combina todas as funcionalidades do primeira geração – como semântica de acesso ao sistema de arquivos, segurança a nível de arquivo e escala – com as características do Azure Blob storage, como baixo custo, alta disponbilidade e recursos de disaster recovery.
Serviços do Azure, como Databricks, HDInsight e Data Warehouse se comunicam com o ADLS Gen2 por meio do Azure Blob File System (ABFS), possibilitando um alto nível de integração entre os componentes utilizados em arquiteturas de Big Data. O ABFS também possibilita que seja realizada a interação e o gerenciamento do ADLS Gen2 da mesma forma que em sistemas que utilizam o Hadoop Distributed File System (HDFS).
[tweet]A criação de um pipeline de análise de dados pode ser um processo complexo e custoso. Entretanto, usando serviços Azure, como o Azure Data Lake Gen2, a jornada de implementação de uma arquitetura de Big Data pode ser mais simples, barata e eficiente.[/tweet]