Como usar as bases de dados do DATASUS

(Atualização válida para o ano de 2022) As bases de dados sobre saúde no Brasil referentes ao SUS – Sistema Único de Saúde são disponibilizados pelo DATASUS, o Departamento de Informática do SUS, do Ministério da Saúde.

O site do DATASUS apresenta uma pluralidade de siglas, sistemas, bancos de dados e termos técnicos, em grande parte de difícil compreensão. A existência de vários sistemas é fruto da construção de bancos de dados em diferentes épocas, servindo a objetivos diversos e, como boa parte dessa estruturação aconteceu antes da criação da Lei de Acesso à Informação, fica claro que não foi feita para uso do público em geral.

TABNET E TABWIN

O acesso às informações dos bancos do DATASUS pode ser feito de duas formas: por meio de diferentes plataformas online TABNET, que podem ser federais ou mesmo municipais, ou por meio do download das bases de dados integrais.

O TABNET é uma ferramenta online que permite a seleção de variáveis e cruzamentos de dados para a criação de tabelas consolidadas. Embora as plataformas TABNET sejam interfaces um pouco mais amigáveis para o público em geral e que poderiam ser usadas em análises iniciais e exploratórias, um ponto crítico é que não apresentam todas as colunas existentes nos bancos de dados de interesse. Assim, os resultados são apresentados frequentemente de forma limitada e fragmentada, sendo difícil saber quais são de fato os dados disponíveis. As plataformas TABNET também podem apresentar instabilidade no acesso, de acordo com o órgão que as hospeda (veja ponto de ‘atenção’ em vermelho, abaixo). Por este motivo, recomendamos o download das bases integrais de dados.

Para ter acesso completo às informações, é necessário baixar os arquivos integrais das bases, usar o software TABWIN (também disponível no site) para ao menos descompactar as bases do formato .dbc para o formato .dbf e então trabalhar com programas de análises de dados, tais como R, Pandas, Excel, LibreOffice ou o próprio TABWIN. O TABWIN foi desenvolvido para o sistema operacional Windows, mas é possível usá-lo no Linux via Wine.

Quais bases acessar?

Em relação aos dados sobre vítimas feridas ou mortas no trânsito, as bases de interesse são o SIH – Sistema de Informações Hospitalares, para análise de dados de internações, e o SIM – Sistema de Informações de Mortalidade, para análise de dados de óbitos.

A base de dados dos atendimentos ambulatoriais SIASUS seria de grande utilidade pois contempla ocorrências que não levaram a internações. Entretanto, uma vez que a filtragem dos dados sobre vítimas do trânsito se dá pela categorização de “causas externas” e esta base não possui este campo específico, não há como usá-la.

Plataformas online TABNET de interesse para São Paulo

Morbidade Hospitalar do SUS por Causas Externas – Por local de internação – São Paulo. Mantido pelo Ministério da Saúde, então filtre por município ao fazer as buscas (o código de São Paulo é 355030). Possui dados sobre internações hospitalares relacionadas a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Atualizações frequentes, com diferença de cerca de 3-4 meses entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações Hospitalares do SUS (SIH/SUS), do Ministério da Saúde.

Mortalidade Geral. Mantido pela Prefeitura de São Paulo. É o sistema mais completo com dados sobre mortos ocorridos no município de São Paulo relacionados a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Ciclo de atualização longo, com diferença de 1-2 anos entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações sobre Mortalidade (SIM/PRO-AIM – CEInfo), da Secretaria Municipal de Saúde de São Paulo.

SIVA – Sistema de Informação para a Vigilância de Acidentes (antigo SIVVA – Sistema de Informações para Vigilância de Violências e Acidentes). Mantido pela Prefeitura de São Paulo (página descritiva). Possui dados sobre internações hospitalares relacionadas a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Atualizações frequentes, com diferença de cerca de 1-2 meses entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações Hospitalares do SUS (SIH/SUS), do Ministério da Saúde.

Para filtrar os dados de ocorrências de trânsito com vítimas, leia primeiro a página explicativa sobre a CID-10, a classificação internacional da Organização Mundial de Saúde.

Atenção: O TABNET é uma ferramenta online de tabulação desenvolvida pelo DATASUS, que também desenvolve o programa offline TABWIN. Uma vez que o TABNET é fornecido para órgãos governamentais, para que inclusive abriguem dados mais regionais, sua disponibilidade depende da capacidade daquele órgão em manter sua infraestrutura de rede.

Como fazer download das bases integrais de dados

Acesse a página de download de dados do DATASUS ou, caso o link direto não funcione, siga os seguintes passos: entre na página inicial do DATASUS, clique no menu “Acesso à Informação” > “Serviços” > “Transferência/Download de Arquivos”. Nesta tela, é possível fazer o download dos bancos de dados do Sistema de Informações Hospitalares (SIH) e do Sistema de Informações sobre Mortalidade (SIM), bem como do programa TABWIN.

Dados do Sistema de Informações Hospitalares (SIH)

Acesse a página de download de dados do DATASUS, como descrito acima. Escolha “SIHSUS” no menu interno da página. Escolha as seguintes opções para fazer download da base:

  • Modalidade de arquivos: “Dados”;
  • Tipo de arquivo: “RD – AIH Reduzida”;
  • Escolha o(s) ano(s) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • Escolha o(s) mes(es) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • UF: “SP”;
  • Clique no botão “Enviar”. Os arquivos para download aparecerão como na imagem abaixo. Clique na palavra “Download” para que todos os arquivos sejam compactado em um único arquivo .zip para facilitar. Clique finalmente no link de texto arquivo.zip para baixar todos os arquivos de uma só vez.

Haverá um arquivo .dbc para cada uf_mês_ano, ou seja, será necessário juntar os arquivos posteriormente. Também será preciso descompactar os arquivos do formato .dbc para .dbf usando o programa TABWIN.

Para baixar o arquivo de documentação, com o dicionário de dados, escolha “Documentação” na modalidade de arquivos, conforme o primeiro passo acima. Todos os outros campos serão preenchidos automaticamente. Clique no botão “Enviar” e o arquivo em PDF ficará disponível.

Note que a base de dados SIH se refere a todo o estado de São Paulo, então será preciso filtrar os dados por município, por exemplo, na coluna “MUNIC_MOV”, referente ao “Município do estabelecimento”. O código de São Paulo é 355030. Já as colunas que indicam as “causas externas”, onde são categorizadas as ocorrências com vítimas de trânsito, são as 9 colunas de DIAGSEC1 a DIAGSEC9 (a partir de 2015) ou DIAG_SECUN (até 2015). A classificação segue a norma internacional da Organização Mundial de Saúde, a CID-10 (mais detalhes nesta página).

Cada linha do banco de dados de SIH é uma Autorização de Internação Hospitalar (AIH) do SUS. O banco de dados SIH tem grande potencial de estudos para orientar políticas de redução de colisões de trânsito. Apesar de ser necessário fazer críticas ao preenchimento de algumas colunas (como por exemplo, “raça/cor” não é preenchida em sua maioria), há informações relevantes sobre valores de internação, dias de permanência, se houve óbito, além de ser possível relacionar as principais lesões que as pessoas sofrem ao se envolverem em colisões no trânsito.

É preciso atentar que esta base se refere aos atendimentos do SUS com internações e não contempla atendimentos de órgãos privados não conveniados ao SUS. Os atendimentos ambulatoriais estão contidos no banco de dados do Sistema de Informações Ambulatoriais (SIA) que, como descrito acima, não permite filtrar atendimentos relacionados a ocorrências de trânsito.

Dados do Sistema de Informações de Mortalidade (SIM)

Acesse a página de download de dados do DATASUS, como descrito acima. Escolha “SIM” no menu interno da página. Escolha as seguintes opções para fazer download da base:

  • Modalidade de arquivos: “Dados”;
  • Tipo de arquivo: “DOEXT – Declarações de óbitos por causas externas – 1979 a 2020”;
  • Escolha o(s) ano(s) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • UF: “SP”;
  • Clique no botão “Enviar”. Os arquivos para download aparecerão como na imagem abaixo. Clique na palavra “Download” para que todos os arquivos sejam compactado em um único arquivo .zip para facilitar. Clique finalmente no link de texto arquivo.zip para baixar todos os arquivos de uma só vez.

Haverá um arquivo .dbc para cada uf_mês_ano, ou seja, será necessário juntar os arquivos posteriormente. Também será preciso descompactar os arquivos do formato .dbc para .dbf usando o programa TABWIN.

Para baixar o arquivo de documentação, com o dicionário de dados, escolha “Documentação” na modalidade de arquivos, conforme o primeiro passo acima. Todos os outros campos serão preenchidos automaticamente. Clique no botão “Enviar” e o arquivo em PDF ficará disponível.

Note que a base de dados SIM se refere a todo o estado de São Paulo, então será preciso filtrar os dados por município, por exemplo, na coluna “CODMUNOCOR”, referente ao “Município de ocorrência do óbito”. O código de São Paulo é 355030. Já as “causas externas”, onde são categorizadas as ocorrências com vítimas de trânsito, estão na coluna “CAUSABAS”. A classificação segue a norma internacional da Organização Mundial de Saúde, a CID-10 (mais detalhes nesta página).

Cada linha do banco de dados SIM é referente a uma pessoa morta. O SIM é a base de dados de mortes mais completa em quantidade de vítimas, pois considera mortes a qualquer tempo. Além dos dados do IML – Instituto Médico Legal, contemplam dados das declarações de óbitos no país, às vezes fornecidas por cartórios.

Como descompactar as bases de dados com o TABWIN

O primeiro passo é baixar o programa TABWIN. Acesse a página de download de dados do DATASUS, como descrito nos passos anteriores. Escolha “Aplicativos” no menu interno da página. Escolha as seguintes opções para fazer download do aplicativo:

  • Modalidade de arquivos: “Programas”;
  • Tipo de arquivo: “TABWIN – Tabulador de dados para Windows”;
  • Clique no botão “Enviar”. Os arquivos para download aparecerão como na imagem acima. Clique na palavra “Download” para que todos os arquivos sejam compactado em um único arquivo .zip para facilitar. Clique finalmente no link de texto arquivo.zip para baixar todos os arquivos de uma só vez.

Dentro do .zip compactado estará o arquivo TabWin415.exe. No Linux, será possível executá-lo com o PlayOnLinux. Uma vez aberto o TABWIN, entrar, no menu, em “Arquivo >Comprime/Expande .DBF”.

Dali, na parte à direita da tela com o título de “Arquivos comprimidos”, navegue até a pasta onde estão os arquivos originais em .DBC. Na parte à esquerda da tela, sob o título de “Arquivos expandidos”, navegue para onde você quer que eles sejam descompactados. A imagem abaixo ilustra o processo.

Selecione então todos os arquivos .DBC que você quer descompactar e clique no botão “Expande”, ao meio da tela. Feito isso, o programa começará a descompactar os arquivos .DBC em .DBF, como na imagem abaixo. Agora será possível abri-los nos programas de análise de dados.


Como usar as bases de dados do DATASUS (versão anterior)

As bases de dados sobre saúde no Brasil referentes ao SUS – Sistema Único de Saúde são disponibilizados pelo DATASUS, o Departamento de Informática do SUS, do Ministério da Saúde.

O site do DATASUS apresenta uma pluralidade de siglas, sistemas, bancos de dados e termos técnicos, em grande parte de difícil compreensão. A existência de vários sistemas é fruto da construção de bancos de dados em diferentes épocas, servindo a objetivos diversos e, como boa parte dessa estruturação aconteceu antes da criação da Lei de Acesso à Informação, fica claro que não foi feita para uso do público em geral.

TABNET E TABWIN

O acesso às informações dos bancos do DATASUS pode ser feito de duas formas: por meio de diferentes plataformas online TABNET, que podem ser federais ou mesmo municipais, ou por meio do download das bases de dados integrais.

O TABNET é uma ferramenta online que permite a seleção de variáveis e cruzamentos de dados para a criação de tabelas consolidadas. Embora as plataformas TABNET sejam interfaces um pouco mais amigáveis para o público em geral e que poderiam ser usadas em análises iniciais e exploratórias, um ponto crítico é que não apresentam todas as colunas existentes nos bancos de dados de interesse. Assim, os resultados são apresentados frequentemente de forma limitada e fragmentada, sendo difícil saber quais são de fato os dados disponíveis. As plataformas TABNET também podem apresentar instabilidade no acesso, de acordo com o órgão que as hospeda (veja ponto de ‘atenção’ em vermelho, abaixo). Por este motivo, recomendamos o download das bases integrais de dados.

Para ter acesso completo às informações, é necessário baixar os arquivos integrais das bases, usar o software TABWIN (também disponível no site) para ao menos descompactar as bases do formato .dbc para o formato .dbf e então trabalhar com programas de análises de dados, tais como Pandas, Excel, LibreOffice ou o próprio TABWIN. O TABWIN foi desenvolvido para o sistema operacional Windows, mas é possível usá-lo no Linux via Wine.

Quais bases acessar?

Em relação aos dados sobre vítimas feridas ou mortas no trânsito, as bases de interesse são o SIH – Sistema de Informações Hospitalares, para análise de dados de internações, e o SIM – Sistema de Informações de Mortalidade, para análise de dados de óbitos.

A base de dados dos atendimentos ambulatoriais SIASUS seria de grande utilidade pois contempla ocorrências que não levaram a internações. Entretanto, uma vez que a filtragem dos dados sobre vítimas do trânsito se dá pela categorização de “causas externas” e esta base não possui este campo específico, não há como usá-la.

Plataformas online TABNET de interesse para São Paulo

Morbidade Hospitalar do SUS por Causas Externas – Por local de internação – São Paulo. Mantido pelo Ministério da Saúde, então filtre por município ao fazer as buscas (o código de São Paulo é 355030). Possui dados sobre internações hospitalares relacionadas a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Atualizações frequentes, com diferença de cerca de 3-4 meses entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações Hospitalares do SUS (SIH/SUS), do Ministério da Saúde.

Mortalidade Geral. Mantido pela Prefeitura de São Paulo. É o sistema mais completo com dados sobre mortos ocorridos no município de São Paulo relacionados a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Ciclo de atualização longo, com diferença de 1-2 anos entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações sobre Mortalidade (SIM/PRO-AIM – CEInfo), da Secretaria Municipal de Saúde de São Paulo.

SIVA – Sistema de Informação para a Vigilância de Acidentes (antigo SIVVA – Sistema de Informações para Vigilância de Violências e Acidentes). Mantido pela Prefeitura de São Paulo (página descritiva). Possui dados sobre internações hospitalares relacionadas a “causas externas”, o que inclui ocorrências de trânsito com vítimas. Atualizações frequentes, com diferença de cerca de 1-2 meses entre a data atual e a data da última publicação. Possui como fonte de dados o Sistema de Informações Hospitalares do SUS (SIH/SUS), do Ministério da Saúde.

Para filtrar os dados de ocorrências de trânsito com vítimas, leia primeiro a página explicativa sobre a CID-10, a classificação internacional da Organização Mundial de Saúde.

Atenção: O TABNET é uma ferramenta online de tabulação desenvolvida pelo DATASUS, que também desenvolve o programa offline TABWIN. Uma vez que o TABNET é fornecido para órgãos governamentais, para que inclusive abriguem dados mais regionais, sua disponibilidade depende da capacidade daquele órgão em manter sua infraestrutura de rede. No momento em que este texto era escrito, um dos sistemas municipais do TABNET chegou a ficar fora do ar por dias.

Como fazer download das bases integrais de dados

Acesse a página de download de dados do DATASUS ou, caso o link direto não funcione, siga os seguintes passos: entre na página inicial do DATASUS, clique no menu “Acesso à Informação” > “Serviços” > “Transferência/Download de Arquivos”. Nesta tela, é possível fazer o download dos bancos de dados do Sistema de Informações Hospitalares (SIH) e do Sistema de Informações sobre Mortalidade (SIM), bem como do programa TABWIN.

Dados do Sistema de Informações Hospitalares (SIH)

Acesse a página de download de dados do DATASUS, como descrito acima. Escolha “SIHSUS” no menu interno da página e clique em “Acesse o SIHSUS” para chegar à página de transferência (link direto). Escolha as seguintes opções para fazer download da base:

  • Modalidade de arquivos: “Dados”;
  • Tipo de arquivo: “RD – AIH Reduzida”;
  • Escolha o(s) ano(s) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • UF: “SP”;
  • Escolha o(s) mes(es) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • Clique no botão “Enviar”. Os arquivos para download aparecerão ao lado direito.

Haverá um arquivo .dbc para cada uf_mês_ano, ou seja, será necessário juntar os arquivos. Também será preciso descompactar os arquivos do formato .dbc para .dbf usando o programa TABWIN (detalhes abaixo).

Para baixar o arquivo de documentação, com o dicionário de dados, escolha “Documentação” na modalidade de arquivos, conforme o primeiro passo acima. Todos os outros campos serão preenchidos automaticamente. Clique no botão “Enviar” e o arquivo em PDF ficará disponível.

Note que a base de dados SIH se refere a todo o estado de São Paulo, então será preciso filtrar os dados por município, por exemplo, na coluna “MUNIC_MOV”, referente ao “Município do estabelecimento”. O código de São Paulo é 355030. Já as colunas que indicam as “causas externas”, onde são categorizadas as ocorrências com vítimas de trânsito, são as 9 colunas de DIAGSEC1 a DIAGSEC9 (a partir de 2015) ou DIAG_SECUN (até 2015). A classificação segue a norma internacional da Organização Mundial de Saúde, a CID-10 (mais detalhes nesta página).

Cada linha do banco de dados de SIH é uma Autorização de Internação Hospitalar (AIH) do SUS. O banco de dados SIH tem grande potencial de estudos para orientar políticas de redução de colisões de trânsito. Apesar de ser necessário fazer críticas ao preenchimento de algumas colunas (como por exemplo, “raça/cor” não é preenchida em sua maioria), há informações relevantes sobre valores de internação, dias de permanência, se houve óbito, além de ser possível relacionar as principais lesões que as pessoas sofrem ao se envolverem em colisões no trânsito.

É preciso atentar que esta base se refere aos atendimentos do SUS com internações e não contempla atendimentos de órgãos privados não conveniados ao SUS. Os atendimentos ambulatoriais estão contidos no banco de dados do Sistema de Informações Ambulatoriais (SIA) que, como descrito acima, não permite filtrar atendimentos relacionados a ocorrências de trânsito.

Dados do Sistema de Informações de Mortalidade (SIM)

Acesse a página de download de dados do DATASUS, como descrito acima. Escolha “SIM” no menu interno da página e clique em “Acesse o SIM” para chegar à página de transferência (link direto). Escolha as seguintes opções para fazer download da base:

  • Modalidade de arquivos: “Dados”;
  • Tipo de arquivo: “DOEXT – Declarações de óbitos por causas externas – 1979 a 2016”;
  • Escolha o(s) ano(s) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • UF: “SP”;
  • Escolha o(s) mes(es) de sua preferência. Use as teclas SHIFT ou CTRL para selecionar mais de uma opção;
  • Clique no botão “Enviar”. Os arquivos para download aparecerão ao lado direito.

Haverá um arquivo .dbc para cada uf_mês_ano, ou seja, será necessário juntar os arquivos. Também será preciso descompactar os arquivos do formato .dbc para .dbf usando o programa TABWIN (detalhes abaixo).

Para baixar o arquivo de documentação, com o dicionário de dados, escolha “Documentação” na modalidade de arquivos, conforme o primeiro passo acima. Todos os outros campos serão preenchidos automaticamente. Clique no botão “Enviar” e o arquivo em PDF ficará disponível.

Note que a base de dados SIM se refere a todo o estado de São Paulo, então será preciso filtrar os dados por município, por exemplo, na coluna “CODMUNOCOR”, referente ao “Município de ocorrência do óbito”. O código de São Paulo é 355030. Já as “causas externas”, onde são categorizadas as ocorrências com vítimas de trânsito, estão na coluna “CAUSABAS”. A classificação segue a norma internacional da Organização Mundial de Saúde, a CID-10 (mais detalhes nesta página).

Cada linha do banco de dados SIM é referente a uma pessoa morta. O SIM é a base de dados de mortes mais completa em quantidade de vítimas, pois considera mortes a qualquer tempo. Além dos dados do IML – Instituto Médico Legal, contemplam dados das declarações de óbitos no país, às vezes fornecidas por cartórios.

One thought on “Como usar as bases de dados do DATASUS”

Comments are closed.