Armazenamento de dados – Faça a coisa certa!

0
1

Marco Antonio Carvalho
O consultor Bill Inmon, “pai” dos sistemas de data warehouse, costuma dizer que, até 2015, as empresas deverão gerar dados em volume superior àquele que a humanidade conseguiu juntar ao longo dos últimos 10 milhões de anos. O assombro que tal previsão costuma causar não se explica apenas em função da quantidade, inimaginável. Diante da estimativa, o que logo se perguntam os executivos de TI é onde guardar tudo isso.
Não é por acaso que, segundo pesquisa da e-Consulting, em 2004, as empresas brasileiras deverão despender quase US$ 2 bilhões na compra de mídias de armazenamento, mercado que, nos últimos dez anos, exibe taxa de crescimento anual da ordem de 40%. Na construção dos grandes bancos de dados, as despesas com discos e fitas capazes de guardar informações chegam a somar 50% do investimento total.
A própria natureza do acervo descarta qualquer possibilidade de evitar a despesa. Além daquelas, que, por exigência legal, simplesmente, têm de ser conservadas por até 30 anos, boa parte das informações é indispensável, utilizada no dia-a-dia das empresas, em apoio ao processo decisório.
Não se sabe, ao certo, qual seria a contribuição dos serviços de atendimento a clientes (SACs) na geração de tamanho volume de dados. Mas, a julgar pela forma como aqui eles proliferam, fica fácil imaginar. Nas empresas de diferentes portes e setores da economia, o ambiente dos call centers, espécie de caixa de ressonância do mercado, é aquele onde talvez hoje se guarde a maior e mais importante massa de informações de valor estratégico: quem são os clientes, como se comportam, preferências, hábitos de consumo – está tudo lá, nos arquivos do SAC.
A boa notícia é que, se essas informações são, por definição, essenciais, orientando desde a concepção dos produtos e serviços até a estratégia aplicada ao marketing de relacionamento, a tecnologia está do nosso lado. E não apenas porque forja mídias de qualidade irrepreensível e alta capacidade de armazenamento. Mais do que isso, inteligente, a moderna arquitetura das soluções de storage se orienta pelo conceito de multi-tier, que propõe a classificação e armazenagem das informações por grau de importância, volume e, ainda, segundo a freqüência com a qual são solicitadas pelos diferentes tipos de usuários. O mesmo princípio de praticidade que nos leva a manter na parte de baixo do armário apenas as roupas da estação.
Podemos atribuir um valor diferente a cada dado, em função da importância do mesmo para o negócio da empresa. Este conceito deu origem a sigla ILM- Information Lifecycle Management, ou gerenciamento do ciclo de vida do dado. Com isso, tornou-se necessária a criação de um conceito de armazenamento do ponto de vista de hardware e software que pudesse atender a esta característica, dando então origem ao termo multi-tier storage, ou storage de múltiplas camadas. Assim, os dados serão armazenados em locais adequadamente projetados em termos de custo, performance e disponibilidade.
Simples assim: em nome do bom-senso e da sempre bem-vinda economia de custos, recomenda-se guardar em mídias mais baratas informações históricas em grande quantidade, raramente consultadas, mas que precisam ser preservadas. Por exemplo? Os registros dos atendimentos feitos a determinado cliente um ano atrás até a data em que ingressou na carteira. Nesse caso, dependendo do volume, experimente as fitotecas robotizadas. Nelas são armazenados os dados categorizados como off-line.
Mas caso necessite recupera-los rapidamente para consultas eventuais, use as VTL- Virtual Tape Libraries, que simulam um fitoteca para o sistema, mas armazenam os dados em subsistemas de discos com custo menor. Estes últimos, conhecidos como disk arrays – de drive convencional, padrão ATA (Advanved Technology Attachment) ou em versão mais avançada, padrão SATA (Serial Advanved Technology Attachment) podem ser guardadas informações consultadas mensalmente. Esta é a camada de armazenamento onde aplicamos a definição de Near-Line Storage mais adequadamente, ou seja, algo entre on-line e off-line.
Já as informações consultadas no dia-a-dia, independente do volume, e cuja recuperação precisa ser rápida, devem permanecer nas mídias que se convenciona chamar discos de alta performance – produtos das mais avançadas tecnologias magneto-ópticas. Além da enorme capacidade de armazenamento, disponibilidade total e grau de segurança quanto à integridade dos dados, eles se caracterizam pelo altíssimo desempenho. Com isso, evitam aquele que costuma ser um dos maiores problemas nas grandes bases de dados: a lentidão na recuperação das informações. Aqui estão os chamados dados On-line.
Marco Antonio Carvalho é diretor da Skill-Computer, que integra, os produtos Nexsan Technologies no Brasil.