Informazio orokorra
0.2.2 bertsioa. clean_reads
programak Sanger, 454, Illumina eta Solid NGS (next generation sequencing) datuak garbitzen ditu. Kendu ditzake
- Kalitate txarreko aldeak
- Adaptadoreak
- Vektoreak
- Espresio regularrak
Kalitate eratainan eta luzeeran oinarritutako kalitate txarreko irakurketak eliminatu ditzazke ere. Paraleloan exekutatu daiteke.
Nola erabili
Kola sistemara lanak bidaltzeko erabili dezakezue
send_clean_reads
komandoa zinek galdera batzuen bitartez skripta prestatu eta bidaliko du.
Errendimendua
clean_reads
programak paraleloan exekutatu daiteke eta ondo eskalatzen du 8 kore arte. 12 koreentzako errendimendua asko jaisten da. Taulan ikus daite benchmarken emaitzak. Xeon E5645 procesadoreak erabiliz 12 koretako nodoan.
koreak | 1 | 4 | 8 | 12 |
Denbora (s) | 1600 | 422 | 246 | 238 |
Azelerazioa | 1 | 3.8 | 6.5 | 6.7 |
Errendimendua (%) | 100 | 95 | 81 | 56 |
Ondorengo komandoa exekutatu da
clean_reads -i in.fastq -o out.fastq -p illumina -f fastq -g fastq -a a.fna -d UniVec -n 20 --qual_threshold=20 --only_3_end False -m 60 -t 12