pyGenomeTracks

O pyGenomeTracks é uma ferramenta para gerar visualizações integradas de dados genômicos a partir de múltiplas faixas (tracks), como Hi-C, ChIP-seq, RNA-seq, entre outros.
Ele permite criar gráficos de alta qualidade combinando várias camadas de informação em uma única figura, facilitando a interpretação e comparação de diferentes experimentos genômicos.

Para mais informações, acesse: https://github.com/deeptools/pyGenomeTracks

Carregando o módulo

Para habilitar o pyGenomeTracks no HPCC Marvin, você deve carregar o módulo pyGenomeTracks:

module load pyGenomeTracks

As versões disponíveis do pyGenomeTracks no HPCC Marvin são:
  • pyGenomeTracks/3.9 (D)
Onde (D) indica a versão padrão.

Para acessar a documentação do modulo, utilize:

module help pyGenomeTracks

Executando o módulo

Para executar o pyGenomeTracks, é necessário um arquivo de configuração que descreva as tracks (faixas de dados).
A maneira mais fácil de criar esse arquivo é usando o programa make_tracks_file, que gera uma configuração padrão facilmente editável.

Comando para criar o arquivo de configuração:

make_tracks_file --trackFiles <file1.bed> <file2.bw> ... -o tracks.ini

O make_tracks_file identifica automaticamente o tipo de arquivo com base em sua extensão.

Comando para gerar o gráfico de uma região genômica:

pyGenomeTracks --tracks tracks.ini --region chr2:10,000,000-11,000,000 --outFileName nice_image.pdf

A opção --outFileName define o formato da imagem de saída. Se for usado .pdf, o resultado será um arquivo PDF. Os formatos disponíveis são pdf, png e svg.

Submetendo jobs

A execução do pyGenomeTracks no HPCC Marvin é feita por meio de scripts de submissão no SLURM. Crie um arquivo de script, por exemplo pyGenomeTracks.sh, com o seguinte conteúdo:

#!/bin/bash
#SBATCH --job-name=pyGenomeTracks
#SBATCH --partition=short-cpu
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=4
#SBATCH --mem-per-cpu=2GB

module load pyGenomeTracks/3.9

TRACKS="/caminho/para/tracks/file"
REGION="chr2:10,000,000-11,000,000"
OUTPUT_FILE="out.pdf"

pyGenomeTracks --tracks "$TRACKS" --region "$REGION" --outFileName "$OUTPUT_FILE"

Para submeter o job, salve o script e utilize o comando sbatch:

sbatch pyGenomeTracks.sh

Para mais detalhes sobre os parâmetros do pyGenomeTracks, use:

pyGenomeTracks -h