audio_processor

module

v0.0.0-...-a6f1803 Latest Latest Go to latest Published: Jan 7, 2025 License: Apache-2.0

Details

Valid go.mod file
Redistributable license
Tagged version
Stable version
Learn more about best practices

Repository

github.com/Tomas-vilte/ButakeroMusicBotGo

README ¶

ButakeroMusicBot

ButakeroMusicBot es un microservicio diseñado para la descarga, procesamiento y subida de audios desde videos de YouTube a Amazon S3. Utiliza tecnologías modernas y está preparado para ser desplegado en la nube, Kubernetes o localmente con Docker Compose.

Tabla de Contenidos 📋

Características Principales
Requisitos Previos
Formas de Despliegue
Endpoints del API
Pruebas
Explicación de diagramas de Arquitectura
- 1. Arquitectura de la Aplicación en AWS ECS
- 2. Arquitectura en Kubernetes

Características Principales

🔍 Búsqueda de videos en YouTube por nombre o URL.
🎧 Descarga y procesamiento de audio.
☁️ Subida de archivos de audio a Amazon S3.
🗃️ Registro de operaciones y metadatos en DynamoDB.
🔄 Sistema de reintentos en caso de fallos.
📊 Monitoreo y métricas con Prometheus/Grafana
🔒 Seguridad y autenticación integrada

Requisitos Previos

Requisitos Generales

Go 1.21 o superior
Docker y Docker Compose
Cuenta de AWS con acceso programático
API Key de YouTube
Git

Para Despliegue en AWS

AWS CLI configurado
Terraform >= 1.0
Cuenta de AWS con permisos para:
- ECS
- ECR
- S3
- DynamoDB
- IAM
- VPC
- CloudWatch

Para Despliegue en Kubernetes

Kubernetes Cluster (1.24+)
kubectl configurado
Helm v3
Minikube (para desarrollo local)

Formas de Despliegue

El microservicio puede ser desplegado de distintas maneras, dependiendo del entorno en el que se desee correr. A continuación, se detallan las tres formas principales de despliegue:

1. Docker Compose

El despliegue con Docker Compose levanta los siguientes servicios:

Zookeeper
Kafka
MongoDB
Backend (usando el Dockerfile del proyecto)

Configuración Inicial

Docker y Docker Compose instalados en tu máquina.
Crea un archivo llamado test_local.env, en el directorio donde se encuentra el docker compose. Este archivo tiene que tener estas variables necesarias para ejecutar el servicio localmente. Lo principal que necesitas modificar es la variable YOUTUBE_API_KEY:

# Environment
ENVIRONMENT=local
LOCAL_STORAGE_PATH=data/audio-files
SERVICE_MAX_ATTEMPTS=7
SERVICE_TIMEOUT=2
YOUTUBE_API_KEY=TU_API_KEY_AQUI  # Modificar esto con tu API key
GIN_MODE=release

# Kafka Configuration
KAFKA_TOPIC=notification
KAFKA_BROKERS=kafka:29092
KAFKA_ENABLE_TLS=false

# Authentication
OAUTH2=false

# MongoDB Configuration
MONGO_USER=root
MONGO_PASSWORD=root
MONGO_PORT=27017
MONGO_HOST=mongodb
MONGO_DATABASE=audio_service_db
MONGO_COLLECTION_SONGS=Songs
MONGO_COLLECTION_OPERATIONS=Operations
MONGO_ENABLE_TLS=false
MONGO_REPLICA_SET_NAME=rs0

# YouTube Cookies
COOKIES_YOUTUBE=/root/yt-cookies.txt

Obtener YouTube API Key

Para obtener tu YouTube API Key, sigue estos pasos:

Ve a la Google Cloud Console
Crea un nuevo proyecto o selecciona uno existente
Habilita la YouTube Data API v3 para tu proyecto
Ve a "Credenciales"
Crea una nueva credencial de tipo "API Key"
Copia la API Key generada y colócala en la variable YOUTUBE_API_KEY del archivo test_local.env
Script de cookies de YouTube (opcional): Si encontras problemas con YouTube, como el error "Sign in to confirm your age", podes generar un archivo de cookies para evitar el bloqueo. Para ello, tenes que ejecutar previamente el script filter_youtube_cookies.sh que generará el archivo yt-cookies.txt.

bash filter_youtube_cookies.sh

Ejecutar con Docker Compose

El proyecto incluye un docker-compose.yml que levanta todos los servicios necesarios:

Zookeeper
Kafka
MongoDB
Backend (usando el Dockerfile del proyecto)

Para iniciar todos los servicios:

docker compose up -d

Para ver los logs de los servicios:

# Ver todos los logs
docker compose logs -f

# Ver logs de un servicio específico
docker compose logs -f backend-application

Para detener los servicios:

docker compose down

2. Kubernetes

Prerrequisitos

Kubernetes Cluster (1.24+)
kubectl configurado
Helm v3
Minikube (para desarrollo local)

Configuración de Credenciales

Antes de ejecutar el despliegue, debes configurar las credenciales en el archivo secret.yaml:

apiVersion: v1
kind: Secret
metadata:
  name: backend-secret
  namespace: backend
type: Opaque
stringData:
  YOUTUBE_API_KEY: "${YOUTUBE_API_KEY}"  # Tu API key de YouTube
  MONGO_USER: "admin-user"     
  MONGO_PASSWORD: "root"
  YT_COOKIES: "${YT_COOKIES}"   # Cookies de YouTube (opcional)

Obtener Cookies de YouTube (Opcional)

Para evitar errores de autorización en YouTube ("Sign in to confirm your age"), puedes configurar cookies:

Ejecuta el script:

bash filter_youtube_cookies.sh

Copia el contenido generado al campo YT_COOKIES del secret.

Despliegue Automatizado

El proyecto incluye un script deploy.sh que automatiza todo el proceso de despliegue. Este script:

Crea los namespaces necesarios:
- Kafka
- MongoDB
- Prometheus
- Backend
- Otros servicios
Configura RBAC y permisos para:
- Prometheus
- MongoDB
Instala y configura componentes esenciales:
- Cert-Manager para gestión de certificados SSL/TLS
- Operador de MongoDB
- Kafka con Strimzi
- Prometheus & Grafana para monitorización
- Backend de la aplicación

Para ejecutar el despliegue completo, simplemente ejecuta:

bash deploy.sh

El script se encargará de:

Verificar los prerrequisitos
Crear todos los recursos necesarios
Esperar a que los pods estén listos
Verificar el estado final del despliegue

Acceso Local a los Endpoints

Una vez completado el despliegue, puedes acceder a los endpoints localmente:

kubectl port-forward svc/backend-service 8080 -n backend

Esto te permitirá acceder al servicio en http://localhost:8080/api/v1/health

Verificar el Estado del Despliegue

Para verificar el estado de los pods:

# Ver pods en el namespace backend
kubectl get pods -n backend

# Ver pods en todos los namespaces
kubectl get pods --all-namespaces

Logs y Monitoreo

Para ver los logs del backend:

# Obtener el nombre del pod
kubectl get pods -n backend

# Ver logs
kubectl logs -f backend-application-hash -n backend

Para acceder a Grafana:

kubectl port-forward svc/grafana 3000 -n monitoring

3. AWS ECS con Terraform

Prerrequisitos

Terraform >= 1.0
AWS CLI configurado
Cuenta de AWS con permisos necesarios

Configuración del Backend Remoto

Advertencia:
Antes de seguir, es obligatorio generar las cookies con el script filter_youtube_cookies.sh. Muchas IPs de las instancias de AWS están baneadas o bloqueadas por YouTube, así que vas a tener que usar cookies válidas para evitar problemas de conexión. Si vas a desplegarlo en ECS, asegurate de hacer este paso antes.

Crear el bucket S3:

aws s3api create-bucket \
    --bucket song-download-tf-state \
    --region us-east-1

Habilitar el versionado del bucket:

aws s3api put-bucket-versioning \
    --bucket song-download-tf-state \
    --versioning-configuration Status=Enabled

Crear la tabla DynamoDB para el bloqueo del estado:

aws dynamodb create-table \
    --table-name terraform-lock-table \
    --attribute-definitions AttributeName=LockID,AttributeType=S \
    --key-schema AttributeName=LockID,KeyType=HASH \
    --provisioned-throughput ReadCapacityUnits=5,WriteCapacityUnits=5 \
    --region us-east-1

Configuración del Provider y Backend

El archivo provider.tf debe contener:

terraform {
  required_providers {
    aws = {
      source  = "hashicorp/aws"
      version = "~> 5.0"
    }
  }
  backend "s3" {
    bucket         = "song-download-tf-state"
    key            = "prod/terraform.tfstate"
    region         = "us-east-1"
    dynamodb_table = "terraform-lock-table"
    encrypt        = true
  }
}

provider "aws" {
  region = var.aws_region
}

Configuración

Movete al directorio donde se encuentra los archivos .tfs:

microservices/audio_processor/song-downloader-infra

Edita el archivo terraform.example.tfvars con tus configuraciones:

# Configuración básica
aws_region = "us-east-1"
project_name = "butakero-music-download"
environment = "prod"

# Configuración del servicio
gin_mode = "release"
service_max_attempts = 5
service_timeout = 2
youtube_api_key = "TU_API_KEY_AQUI"  # Modifica esto con tu API key de YouTube
oauth2_enabled = "true"
container_port = 8080
secret_name = "butakero-audio-service-secrets"

# Tags para recursos AWS
alb_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
ecs_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
storage_s3_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
dynamodb_table_operations_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
dynamodb_table_songs_tag = {
  Project     = "music-downloader"
  Environment = "production"
}
sqs_queue_tag = {
  Project     = "music-downloader"
  Environment = "production"
}
ecr_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
networking_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
cloudwatch_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
iam_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
security_group_tags = {
  Project     = "music-downloader"
  Environment = "production"
}
sm_tags = {
  Project     = "music-downloader"
  Environment = "production"
}

Pasos de Despliegue

Inicializa Terraform:

terraform init

Verifica los cambios que se realizarán:

terraform plan -var-file="terraform.example.tfvars"

Aplica la infraestructura:

terraform apply

Recursos Desplegados

El despliegue creará los siguientes recursos en AWS:

ECS Cluster con Fargate
Application Load Balancer
S3 Bucket para almacenamiento de archivos
DynamoDB Tables para operaciones y canciones
SQS Queue para mensajería
ECR Repository para imágenes de contenedor
CloudWatch para logs y monitoreo
IAM Roles y políticas necesarias
Security Groups para control de acceso
VPC y recursos de networking
Secrets Manager para gestión de secretos

Destruir la Infraestructura

Para eliminar todos los recursos creados:

terraform destroy

Endpoints del API

1. Iniciar el procesamiento de una canción

Método: POST
Endpoint: /api/audio/start
Query Params:
- song: El título de la canción o la URL del video de YouTube.
Descripción: Este endpoint inicia el procesamiento de la canción. Se puede enviar el nombre o la URL de la canción en el parámetro song. La API buscará el video en YouTube, descargará el audio, lo procesará y lo subirá a S3.

Ejemplo de solicitud:

curl -X POST "http://localhost:8080/api/v1/audio/start?song=linkin+park+the+emptiness+machine"

Respuesta:

{
  "operation_id": "19f6c66f-26f3-4ccf-bfc7-967449a95ad4",
  "song_id": "SRXH9AbT280"
}

2. Consultar el estado de una operación

Método: GET
Endpoint: /api/audio/status
Query Params:
- operation_id: El ID único de la operación iniciada.
- song_id: El ID de la canción procesada.
Descripción: Este endpoint devuelve el estado actual del procesamiento de audio utilizando el operation_id y el song_id. El estado incluye información detallada sobre la operación.

Ejemplo de solicitud:

curl -X GET "http://localhost:8080/api/v1/audio/status?operation_id=19f6c66f-26f3-4ccf-bfc7-967449a95ad4&song_id=SRXH9AbT280"

Respuesta (ejemplo de operación en curso):

{
  "status": {
      "id": "19f6c66f-26f3-4ccf-bfc7-967449a95ad4",
      "sk": "SRXH9AbT280",
      "status": "iniciando",
      "message": "",
      "metadata": null,
      "file_data": null,
      "processing_date": "",
      "success": false,
      "attempts": 0,
      "failures": 0
  }
}

Respuesta (ejemplo de operación finalizada):

{
    "status": {
      "id": "19f6c66f-26f3-4ccf-bfc7-967449a95ad4",
      "sk": "SRXH9AbT280",
      "status": "success",
      "message": "Procesamiento exitoso",
      "metadata": {
          "id": "63f48016-78cd-4387-99b9-c38af46e8e90",
          "video_id": "SRXH9AbT280",
          "title": "The Emptiness Machine (Official Music Video) - Linkin Park",
          "duration": "PT3M21S",
          "url_youtube": "https://youtube.com/watch?v=SRXH9AbT280",
          "thumbnail": "https://i.ytimg.com/vi/SRXH9AbT280/default.jpg",
          "platform": "Youtube"
      },
      "file_data": {
          "file_path": "audio/The Emptiness Machine (Official Music Video) - Linkin Park.dca",
          "file_size": "1.44MB",
          "file_type": "audio/dca",
          "public_url": "file://data/audio-files/audio/The Emptiness Machine (Official Music Video) - Linkin Park.dca"
      },
      "processing_date": "2024-12-24T05:39:58Z",
      "success": true,
      "attempts": 1,
      "failures": 0
  }
}

Respuesta (ejemplo de operación fallida):

{
  "operation_id": "19f6c66f-26f3-4ccf-bfc7-967449a95ad4",
  "status": "failed",
  "error": "Descripción del error ocurrido"
}

Pruebas

Para ejecutar las pruebas unitarias y de integracion del proyecto, podes correr:

go test ./...

Explicación de diagramas de Arquitectura

Diagrama de Secuencia

El diagrama de secuencia ilustra el flujo de interacción entre los diferentes componentes del microservicio durante el proceso de descarga y procesamiento de audio. A continuación, se describen los pasos clave:

Cliente: Inicia la solicitud de descarga de audio enviando la canción deseada al microservicio.
Microservicio: Recibe la solicitud y utiliza el servicio de YouTube para buscar el ID del video correspondiente a la canción.
YouTube API: Proporciona el ID del video y sus detalles (metadata) al microservicio.
Microservicio: Inicia una operación para el procesamiento del audio y devuelve el operation_id y song_id al cliente.
Proceso Asíncrono: En paralelo, el microservicio procesa el audio utilizando el ID de operación y los detalles obtenidos, permitiendo al cliente continuar con otras tareas sin esperar la finalización.

Este enfoque asíncrono asegura que el usuario reciba una respuesta inmediata, mejorando la experiencia del usuario.

Arquitectura de la Aplicación en AWS ECS

Componentes de la Arquitectura

1. VPC (Virtual Private Cloud)

Todo corre dentro de una VPC para asegurar que los recursos estén aislados y podamos aplicar reglas de seguridad específicas. Esto nos permite controlar el tráfico y proteger los servicios.

2. EC2 Instance

El tráfico llega primero a una instancia de EC2 que actúa como puerta de entrada. Desde aca, la aplicacion Nuestro Bot de musica envía requests a nuestra aplicación Donde se encuentra la logica de procesamiento de audio, que son redirigidas a través de un Application Load Balancer.

3. Application Load Balancer (ALB)

El ALB es clave en esta arquitectura. Recibe tráfico HTTP en el puerto 80 y lo distribuye a un Target Group configurado para enrutar las solicitudes a las tareas de ECS. Además, tiene configurado un health check que verifica cada 30 segundos el estado de las tareas para garantizar que solo las instancias saludables reciban tráfico.

4. ECS Cluster y Fargate

Estamos usando Fargate, lo que significa que no tenemos que gestionar la infraestructura de los contenedores. Las tareas de ECS se ejecutan dentro del clúster, sin la necesidad de manejar instancias EC2. Esto nos permite concentrarnos en el desarrollo, y Fargate se encarga del resto.

5. ECS Tasks

Las tareas de ECS son donde realmente se ejecuta nuestro código. Los contenedores están corriendo en el puerto 8080, y el ALB enruta el tráfico hacia este puerto desde el Target Group. Cada tarea tiene permisos para interactuar con servicios como S3 y DynamoDB a través de roles IAM configurados específicamente para esto.

Interacción con S3

Nuestras tareas ECS pueden acceder a S3 para subir o descargar objetos. Por ejemplo, usamos S3 para almacenar archivos multimedia por ej .dca. Las tareas hacen uso de la API de S3 para gestionar estos archivos.

Interacción con DynamoDB

Además, las tareas se conectan a DynamoDB para gestionar el estado de la aplicación, como el seguimiento de operaciones o el almacenamiento de metadatos. DynamoDB es rápido y se adapta bien a las necesidades de baja latencia de nuestra aplicación.

6. CloudWatch y Auto Scaling

El monitoreo está a cargo de CloudWatch. Configuramos métricas clave, como el uso de CPU y memoria en las tareas ECS. En base a estas métricas, tenemos configuradas políticas de Auto Scaling, que permiten escalar horizontalmente las tareas de ECS. Esto significa que si el uso de CPU o memoria supera ciertos umbrales, automáticamente se lanzan más tareas para manejar el tráfico adicional, y se reducen cuando ya no son necesarias.

Configuración del Auto Scaling

Configuramos el Auto Scaling usando CloudWatch como desencadenante. Cuando se alcanza un cierto umbral de CPU o memoria (por ejemplo, 75%), se activa la política que lanza nuevas tareas ECS hasta que los recursos vuelvan a estar en niveles normales. Esto asegura que nuestra aplicación se mantenga eficiente sin desperdiciar recursos.

7. IAM Roles y Seguridad

Cada tarea de ECS tiene asociado un IAM Role que le permite acceder a servicios específicos como S3 y DynamoDB, pero sin dar permisos innecesarios. Estos roles están configurados con permisos mínimos para garantizar la seguridad. Por otro lado, usamos Security Groups para controlar el tráfico entrante y saliente en la VPC, asegurando que solo el tráfico autorizado llegue a los contenedores.

Flujo de Tráfico

Applicacion bot de musica: Envía una requests desde un cliente EC2.
ALB: La solicitud llega al ALB, que se encarga de dirigir el tráfico al Target Group.
Target Group: Este grupo enruta el tráfico a las tareas de ECS corriendo en Fargate.
ECS Tasks: Las tareas procesan la solicitud y, si necesitan, acceden a S3 y DynamoDB para manejar los datos.
CloudWatch: Monitorea el rendimiento y activa políticas de escalado si se detectan problemas de capacidad.

Arquitectura en Kubernetes

Nuestra aplicación está desplegada en Kubernetes utilizando una arquitectura de microservicios que consta de varios componentes clave:

Componentes Core

Servicio Backend
- Punto de entrada para todas las solicitudes de clientes
- Desplegado como un servicio de Kubernetes con capacidades de balanceo de carga
Capa de Aplicación
- Contiene los nodos de Backend en tiempo real
- Desplegado como StatefulSet para mantener el orden de procesamiento
- Escala horizontalmente según la demanda
Procesamiento de Mensajes
- Servicios de Kafka y MongoDB para el manejo y almacenamiento de mensajes
- Utiliza PVC (Persistent Volume Claims) para persistencia de datos
- Desplegado usando operadores de Kubernetes para gestión automatizada

Operadores de Kubernetes

El sistema utiliza operadores especializados para gestionar aplicaciones con estado:

Operador Strimzi: Gestiona los clusters de Kafka
Operador MongoDB: Maneja los despliegues y escalado de MongoDB

Stack de Monitoreo

Prometheus: Recolecta métricas de los servicios
Grafana: Visualiza datos de monitoreo
Colectores de Métricas:
- Node exporter para métricas del sistema
- Service monitor para métricas de aplicación

Almacenamiento y Gestión de Estado

Almacenamiento persistente usando PVC para:
- Datos de MongoDB
- Logs de Kafka
- Metadatos de operaciones
- Almacenamiento de canciones

Seguridad

Cert-manager: Gestión de certificados TLS
Comunicación segura entre servicios usando TLS
Políticas de red para control de comunicación interna

Escalabilidad y Confiabilidad

Componentes replicados para alta disponibilidad:
- Clusters de Kafka con múltiples réplicas
- ReplicaSets de MongoDB
- Múltiples instancias del Backend en tiempo real

Directories ¶

Path	Synopsis
cmd
aws
aws/server
local
local/server
internal
config
domain/factory
domain/model
domain/port
domain/service
infrastructure/api
infrastructure/downloader
infrastructure/encoder
infrastructure/factory
infrastructure/queue/kafka
infrastructure/queue/sqs
infrastructure/repository/dynamodb
infrastructure/repository/mongodb
infrastructure/secretmanager
infrastructure/storage/cloud
infrastructure/storage/local
interface/http/handler
interface/router
logger
middleware
usecase
utils
tests
testutil/mongodb
unit

?	: This menu
/	: Search site
f or F	: Jump to
y or Y	: Canonical URL