Las investigaciones actuales en organismos acuáticos hacen cada vez más uso de herramientas genómicas, entre las que se incluyen la secuenciación de genomas, transcriptomas, metagenomas y filogenia. Todas estas labores pueden requerir recursos informáticos que exceden las capacidades de una computadora personal. Para esto, hemos implementado en el ICML un servidor de análisis bioinformáticos preparado para datos genómicos con capacidades de alto rendimiento. Entre las características del servidor, se ofrece:
¡Muy sencillo! Sólo presenta información básica en este formulario de registro, y en breve, el administrador del servidor te enviará una cuenta de acceso.
En tu registro puedes indicar detalles sobre tu proyecto. Si la infraestructura que ofrecemos te resulta útil para alguna propuesta académica que te encuentres por someter, con mucho gusto te podemos apoyar brindando información más detallada o de acorde a tus metodologías y declaraciones de infraestructura disponible.
El principal modo de conexión a Chihuil es mediante un túnel SSH. Esto requiere de una terminal remota y conocimiento de líneas de comandos.
El servidor cuenta con tres unidades de almacenamiento:
/albatro (2x SSD SATA, 240Gb (RAID1), 6gbps)
Esta unidad alberga el sistema operativo (Ubuntu Server 19.10) y programas instalados (directorios /opt y /usr/local/bin). El arreglo RAID1 permite una velocidad de escritura superior a una unidad convencional, y provee seguridad en los datos instalados.
/marlin (1 NVME PCIe, 1Tb)
Esta unidad se encuentra dedicada para el almacenamiento de diversas bases de datos públicas (NCBI-nr, UniProt, TRembl, SILVA,
/botete (6x HDD SATA; 7.2Tb totales, RAID10)
Esta es la unidad donde radican los directorios HOME de cada usuario (p ej., /botete/usuario). Se conforma por varios discos integrados en un arreglo redundante tipo RAID10, lo que significa que en caso de que un disco sufra daño, otro disco mantiene una copia de la información, y su reemplazo (hot swap) reconstruye la estructura del arreglo original. Este arreglo también proporciona ventajas en la velocidad de lectura, en comparación a una unidad independiente.
A pesar de la implementación de un arreglo RAID para el almacenamiento redundante de la información, es responsabilidad de cada usuario mantener un respaldo de su directorio en un equipo o disco duro propio. Se recomienda hacer este respaldo regularmente empleando herramientas como rsync o scp vía conexión SSH
New! A partir de Junio de 2020 contamos con un nivel adicional de seguridad en el almacenamiento de la información, mediante la adquisición de una unidad de almacenamiento de respaldo NAS con 11 Tb totales en redundancia RAID-10. La periodicidad de este respaldo se realiza semanalmente (cada Sábado a las 7 pm), y se guarda una instantánea del entorno del sistema anterior (al menos cuatro semanas atrás). En caso de que experimentes una pérdida accidental de información en tu cuenta en /botete (digamos, por borrar un directorio equivocado), puedes reportarlo inmediatamente al administrador del servidor para realizar un rescate manual de la información. Esto no implica que la responsabilidad de realizar respaldos de tu información también corra por tu cuenta.
Al ser un servidor de bioinformática orientado para distintos usuarios y proyectos, muchos de los programas que pudieras requerir pudieran estar ya descargados e instalados. En caso de que no lo estén, contacta al administrador para que se descargue alguna versión apropiada.
Los programas de uso más frecuente (p ej, BLAST) generalmente son localizados en el directorio
Actualización: Abril de 2020.
Algunos programas requieren de la integración de herramientas gráficas, cuya instalación podría ser complicada. Para esto, tenemos la alternativa de instalar contenedores Docker, que consisten en sistemas operativos mínimos distribuidos por el autor del programa. Puesto que la instalación vía Docker debe tener acceso completo a $HOME, estos contenedores no pueden ser usados por distintos usuarios; para resolver esto hemos generado un usuario dummy user_docker (consulta al administrador para obtener contraseña). Un problema potencial es saturar el disco de sistema operativo (donde se ubica el $HOME del usuario) si el proceso requiere de una gran cantidad de datos. Para evitar esto, por favor genera un directorio de trabajo en tu propio home (en la unidad /botete/usuario) y coloca un link simbólico a éste en el HOME de user_docker. Así la información se depositará en tu HOME en /botete/usuario
Esta es una guía rápida de los comandos de Docker.
En caso de requerir alguna instalación de programas que se enlisten en los servidores de Conda, envía un correo al administrador y en breve el programa será instalado.
El servidor de bioinformática forma parte de la infraestructura científica adquirida mediante el proyecto “Consolidación de las capacidades bioinformáticas en la Unidad Mazatlán del ICMyL-UNAM” No. 300659, financiado por el Fondo de Infraestructura 2019 del Consejo Nacional de Ciencia y Tecnología CONACYT.
La operación y mantenimiento del servidor corren a cargo del Instituto de Ciencias del Mar y Limnología, Universidad Nacional Autónoma de México.
https://forms.gle/qmvpPis4uZsW3HXU9
Responsable del servicio
Dr. Raúl Antonio Llera Herrera
raul.llera@ola.icmyl.unam.mx
Investigador Asociado "C"
Unidad Académica Mazatlán
Instituto de Ciencias del Mar y Limnología , UNAM