Recomendo este artigo sobre a produção de provas em meio digital. O artigo original não é meu, foi extraído do Law Technology Today e trata do assunto sob a ótica do direito dos Estados Unidos.
Reparem como este tema está desenvolvido nos EUA, se o compararmos com a pequena jurisprudência e produção intelectual brasileira sobre o mesmo assunto.
Reparem como este tema está desenvolvido nos EUA, se o compararmos com a pequena jurisprudência e produção intelectual brasileira sobre o mesmo assunto.
Perigos do Desaparecimento de Dados em Fase de Produção de Provas Eletrônica (eDiscovery)
Postado por David Carns, 17
de dezembro de 2014
A indústria de eDiscovery é madura. Embora possa-se discutir o momento
em que a indústria surgiu oficialmente, é certo que existe há pelo menos uma
década. Ao longo dos anos, muitos detalhes do fluxo de trabalho do eDiscovery
foram analisados, amplamente debatidos e resolvidos. Apesar dessa maturidade,
continua a haver uma série de áreas cinzentas em processamento de dados do
eDiscovery que não chegaram a ser analisados com a profundidade que seria de se
esperar. Em alguns casos, existe a possibilidade de que os dados desaareçam ou
não sejam adequadamente apresentados.
Tais áreas cinzentas caem em categorias diferentes, mas aqueles
relacionados aos dados do banco de dados e tipos de dados obscuros são de
particular interesse.
Dados do Banco de Dados
eDiscovery é em grande parte sobre documentos: documentos do Word,
planilhas do Excel, apresentações em PowerPoint, e e-mails dominam esta
paisagem. O termo técnico para esta informação com base em documento é dados não-estruturados. Podem ser criados
de forma livre por um usuário e não têm estrutura definitiva. Dados não estruturados são,
ironicamente, fáceis de trabalhar no contexto de eDiscovery. Um documento é um
único item com meta-dados relativamente fixos, que podem ser representados
facilmente na forma impressa. Mas nem todos os dados do eDiscovery são não-estruturados, e alguns tipos de
dados, tais como bancos de dados, carregam questões complicadas.
Bases de dados representam dados estruturados. Dados estruturados são
armazenados de forma sistemática. Alguém pode acreditar que esta é uma vantagem
sobre os dados não estruturados, mas,
na verdade, muitas vezes causam mais problemas do que resolvem. Existem algumas
regras sobre como os dados estruturados devem ser organizados. A maioria dos
bancos de dados, no entanto, tem três grandes tipos de dados representados:
1. Planilhas
2. Formulários
3. Relatórios
As tabelas são onde
os dados são armazenados e formulários fornecem campos de entrada de dados que alimentam
essas tabelas. Os relatórios são diferentes formas de olhar para os dados
armazenados em tabelas, podendo ser consultados, agrupados e ordenados.
Um tipo comum de
banco de dados é aquele criado com o Microsoft Access. Microsoft Access é quase
onipresente nas empresas e é bastante fácil para um usuário de negócios criar
um novo banco de dados. A maioria dos mecanismos de processamento de dados
eDiscovery, no entanto, não lidam muito bem com os tipos de dados incorporados
no Microsoft Access.
Em eDiscovery, é
importante ser possível se extrair texto das tabelas, formulários e relatórios
de um banco de dados Microsoft Access para que o texto completo do banco de
dados seja extraído. Dependendo do caso, é importante produzir dados a partir
das tabelas, formulários e relatórios para que a parte contrária tenha
conhecimento do que está sendo produzido. Que texto é extraído e que dados que
são produzidos, depende das necessidades de cada caso.
Na realidade, não
existe uma resposta única que atenda às necessidades de cada banco de dados criado
com o Microsoft Access, de modo que cada um precisa ser tratado de forma
individualizada. Há poucos padrões desenvolvidos em torno destas questões, por
isso, frequentemente se conta com a experiência dos prestadores de serviços.
Esse tipo de manipulação individualizada dos dados, feita caso a caso, permite
que especialistas e prestadores de serviços adicionem valor ao produto, mas,
para uma indústria que se orgulha de resultados forenses, fica claro que a
nossa forma de processar os arquivos do Microsoft Access levanta problemas,
especialmente ao se procurarem detalhes.
Outro tipo de banco
de dados é o Lotus Notes. Muitas pessoas pensam que o Lotus Notes é um sistema
de e-mail, mas, na verdade, é um sistema de banco de dados sofisticado, que
pode ser usado para criar bases de dados de quase qualquer formato ou tamanho. Em
meados da década de 90, as empresas tinham grande interesse em e-mail e, por
essa razão, o Lotus Notes foi muitas vezes usado como um banco de dados de
e-mail, embora e-mail não fosse a sua única forma de utilização. Muitas ferramentas
de eDiscovery tratam bancos de dados do Lotus Notes como e-mail apenas e,
portanto, dados importantes podem ser perdidos. Todos os bancos de dados do
Lotus Notes devem primeiro ser inspecionados, para ver se eles contêm dados não
relacionados a e-mail.
Muitas ferramentas
de processamento de eDiscovery não são capazes de processar corretamente bancos
de dados do Lotus Notes, mesmo em se tratando de bancos de dados que contêm
apenas os dados de e-mail. Isto é em parte devido ao fato de que um banco de
dados de e-mail do Lotus Notes não é uma coleção de arquivos de e-mail
individuais (como é o caso de bancos de dados da Microsoft, como os que
armazenam arquivos com extensão PST), mas sim um banco de dados completo de
tabelas, colunas e linhas, que representam coletivamente e-mails, mas precisam
ser primeiro trabalhados, para que possam finalmente formar e-mails.
Muitas ferramentas de eDiscovery são incapazes de atuar adequadamente
sobre dados estruturados, tais como registros em banco de dados, e preferem
tratar os arquivos como dados estruturados ou como uma coleção de dados não-estruturados. De fato, é comum que
os software de eDiscovery simplesmente convertam bancos de dados do Lotus Notes
em uma coleção de arquivos de e-mail da Microsoft (agrupados em um arquivo de
armazenamento pessoal) e, em seguida, processem o e-mail em formato Microsoft.
O ato de converter Lotus Notes para o formato Microsoft, no entanto, quase
sempre provoca uma perda de metadados específicos do Lotus Notes, tais como
dados departamentais, formatação do corpo do texto, e outros campos personalizados
usados pela organização. Essa destruição de dados é muitas vezes encoberta e os
clientes raramente são informados sobre a perda de tais dados. Existem alguns
programas de software eDiscovery que podem lidar originalmente com dados do
Lotus Notes, por isso é importante perguntar ao seu departamento de assessoria
a litígios ou prestador de serviços de eDiscovery se há suporte original para o
Lotus Notes.
Dados Obscuros
Outra categoria de dados que muitas
vezes cai em uma zona cinzenta é a de dados obscuros. Dois exemplos são dados
Exif e dados com propriedades de metadados estendidos.
Exif designa o formato de arquivo de
imagem intercambiável (estranhamente, não se escreve EXIF oficialmente, ainda
que isso seja um acrônimo). Dados Exif são incorporados em muitos arquivos de
mídia, como JPEGs, TIFF e formatos de arquivo WAV. Dados Exif podem conter
informações como as configurações de tempo, de localização, de equipamentos e
dos meios de comunicação de quando o dado foi capturado. É comum nas fotos, por
exemplo, para incluir o tipo de câmera usada para tirar a fotografia, o local
onde a fotografia foi tirada, se um flash foi usado, etc. Ao se processarem
arquivos de mídia para eDiscovery, não se presume que os dados Exif foram necessariamente extraídos
e disponibilizados em campos de metadados durante a revisão. Isso pode levar à exclusão
de informações valiosas que poderiam ser úteis para um caso. Para que se possa
incluir esses metadados em sua avaliação, é importante para saber se o seu
provedor de serviços abarca estes metadados no seu fluxo de trabalho de
processamento.
Outro tipo de dados obscuros
acompanha os dados armazenados na nuvem. Grande parte dos dados armazenados na
nuvem ampliou as propriedades dos metadados. Por exemplo, os dados armazenados
no serviço de armazenamento de arquivos Amazon S3 contém não apenas metadados
típicos relacionados com o arquivo, mas também metadados referentes a quando o
arquivo foi carregado, se existem versões mais antigas do documento, e qualquer
costume ou metadado definido pelo usuário. Esta informação pode conter dados fundamentais
para um caso, mas muitas vezes é ignorada. É importante assegurar que esses
metadados sejam preservados e extraídos, se você acredita que isso poderia ser
importante para o objeto da sua lide.
eDiscovery é uma indústria madura e
de alto padrão. É importante, no entanto, entender que ainda há alguns tipos de
dados, tais como banco de dados (estruturados) e os dados obscuros, que nos
obrigam a tratar os dados caso-a-caso. Os dados estruturados requerem uma
compreensão de cada banco de dados e como os seus dados são armazenados e
apresentados, a fim de serem efetivamente utilizados em eDiscovery. Dados de
tipo obscuro exigem uma profunda compreensão do método segundo o qual os dados
são armazenados e uma compreensão adicional dos tipos de metadados estendidos
que um arquivo pode conter. Enquanto as ferramentas para eDiscovery já percorreram
um longo caminho ao longo dos anos, eDiscovery ainda demanda conhecimento
especializado sobre dados, como eles são armazenados, e sobre como se extrair informações
dos dados da forma mais eficaz possível.
Nenhum comentário:
Postar um comentário
Os comentários servem para discussões teóricas e para comentários políticos e econômicos. Se você precisa de auxílio em matérias de Direito Internacional, escreva para contato@adler.net.br.