Juicer
Juicer é um pipeline completo para processamento e análise de dados Hi-C, desenvolvido pelo Aiden Lab. Ele automatiza desde o alinhamento das leituras até a geração de mapas de interação genômica em múltiplas resoluções (arquivos .hic).
Útil para explorar estruturas 3D do genoma — como TADs, loops e compartimentos — o Juicer é amplamente adotado em genômica estrutural.
Para mais informações, acesse https://github.com/aidenlab/juicer/wiki.
Carregando o módulo
Para habilitar o juicer no HPCC Marvin, você deve carregar o módulo juicer:
module load juicer/<versão desejada>
As versões disponíveis do juicer no HPCC Marvin são:
juicer/2.0 (D)juicer/1.6
(D) indica a versão padrão.Para acessar a documentação do modulo, utilize:
module help juicer
Executando o módulo
O script principal do juicer é chamado com o comando juicer.sh e pode ser executado conforme o exemplo:
juicer.sh -z [reference genome file]
Para mais informações detalhadas sobre o script do juicer, acesse a página de Usage do juicer.
Além do script principal, o módulo também conta com o pacote de ferramentas juicer_tools. Para obter informações sobre o uso e ajuda, execute:
juicer_tools -h
Para mais informações, acesse a página de Quick Start do juicer tools.
Note que, na wiki do juicer tools, ele estará referenciado como juicebox_tools.jar e chama o java para executar o .jar. Isso não é necessário no Marvin, apenas passe as opções e comandos diretamente.
Por exemplo, caso você queira executar o seguinte comando que está na wiki do juicer tools:
java -Xmx2g -jar juicebox_tools.jar pre data/test.txt.gz data/test.hic hg19
No Marvin, você executaria da seguinte forma:
juicer_tools pre data/test.txt.gz data/test.hic hg19
Submetendo jobs
A execução do juicer no HPCC Marvin é feita por meio de scripts de submissão no SLURM. Crie um arquivo de script, por exemplo juicer.sh, com o seguinte conteúdo:
#!/bin/bash
#SBATCH --job-name=juicer
#SBATCH --partition=short-cpu
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=8
#SBATCH --mem-per-cpu=4GB
module load juicer/2.0
REFERENCE_GENOME="caminho/para/genome/file"
juicer.sh -z "$REFERENCE_GENOME"
Para submeter o job, salve o script e utilize o comando sbatch:
sbatch juicer.sh
Para mais detalhes sobre os parâmetros do juicer, use:
juicer.sh -h