ANCHO DE BANDA Y LATENCIA
La principal característica de las redes que soportan aplicaciones multimedia es que funcionan en tiempo real, es decir, se necesita una respuesta inmediata por parte de la red a la hora de enviar la información de un terminal a otro. Este parámetro depende totalmente del ancho de banda que sea capaz de manejar la red.
Los retardos que puede sufrir un paquete de datos serán debidos principalmente a los tiempos de respuesta de los conmutadores de paquetes (switches), así como por el tiempo que tarda la señal en viajar por los distintos enlaces físicos (más significativos en redes de cable de cobre que en redes de fibra).
El ancho de banda de una red se define por la cantidad de bits por segundo que puede transmitir una red. Dicho de otro modo, podría definirse como la velocidad máxima de la red.
Las redes para sistemas de audio suelen basarse hoy en día en el protocolo Gigabit Ethernet, que permite un ancho de banda de 1000 Mbps. Esto hace necesaria la utilización de cables de Categoría 5e o superior, así como el uso de switches compatibles con esta tecnología.
En instalaciones, siempre se intentará diseñar una red de datos específica y separada para los equipos de audio (en algunos casos, el tráfico compartido es totalmente imposible), por lo que no suele ser necesario configurar prioridades entre los distintos paquetes, servicio que se conoce como Quality Of Service (QoS). En caso de que existiera un tráfico compartido con otro tipo de datos, sería necesario dar a las aplicaciones multimedia una prioridad sobre el resto del tráfico, para reducir en lo posible el retardo en los buffers de los conmutadores.
GESTIÓN DE RED
La facilidad de gestión de la red es un parámetro crucial para detectar errores y repartir los recursos. Por tanto, es necesaria la capacidad de monitorización de los equipos de la red para comprobar el estado del tráfico de paquetes y la cantidad de errores que se generan en la red. Para ello, se plantea una arquitectura en la que una entidad gestora controla y vigila diversos equipos gestionados.
Existen varios protocolos de control para redes de datos que monitorizan la red y controlan el tráfico:
- SNMP: Simple Network Management Protocol es un protocolo de comunicación de información de control para equipos gestionados en una red.
- ICMP: Internet Control Message Protocol es un sub-protocolo asociado a IP utilizado para el envío de mensajes de control y de error. La aplicación ping, basada en este protocolo, es muy utilizada para comprobar si la conexión IP entre dos terminales es correcta.
- RTCP: Real-time Transport Control Protocol es el protocolo de control asociado al uso del Real-time Transport Protocol (RTP), muy utilizado en aplicaciones multimedia. Su misión principal es informar de la calidad de servicio y coordinar los distintos paquetes de datos para que las aplicaciones puedan adaptarse a las condiciones de la red.
- IGMP: Internet Group Management Protocol gestiona la pertenencia de los equipos a grupos Multicasts⁵. El buen manejo de estos grupos es esencial para el buen aprovechamiento del ancho de banda. En una red multimedia, un equipo que genera contenido querrá en varias ocasiones enviar ese contenido a varios receptores. Si se genera un envío Unicast para cada receptor, se realizan tantos envíos como receptores. En el caso del Multicast, sólo se realiza un envío.
REDUNDANCIA Y RESPUESTA A ERRORES
Dependiendo de la aplicación, la red asociada a una instalación de audio deberá tener mayor capacidad de respuesta ante fallos críticos para mantener unos servicios mínimos. Por ejemplo, el sistema de alarmas de un parque de bomberos debe funcionar, aunque deje de hacerlo cualquiera de sus equipos. Esto se consigue mediante el uso de equipos redundantes o mediante la programación para cambiar los enrutamientos por la red.
La mayoría de equipos de audio incorpora un segundo puerto de salida redundante. Esto permite el diseño de una red secundaria que sea capaz de entrar en funcionamiento cuando falla el sistema principal. Así mismo, muchos equipos de red en el mercado permiten la configuración como redundante, que mantiene el equipo a la espera y se activa si el principal detecta un fallo.
![]() |
Ejemplo de una red con redundancia (en caso de fallo del switch principal, tan solo los equipos 4 y 5 quedarán sin conexión) |
⁵ Un grupo Multicast es un conjunto de equipos que responden a una misma dirección IP. Cada equipo tendrá una dirección Unicast asociada y única, y puede pertenecer a uno o más grupos Multicast. Por último, existe la dirección Broadcast (que generalmente consta de todos los bits a '1') a la que responden todos los equipos de la red.
PROTOCOLOS DE AUDIO ACTUALES
El transporte de canales de audio sobre redes de computadores es una tecnología que aparece en la década de los 90. Desde entonces, distintas marcas y fabricantes han desarrollado sus soluciones de forma similar, aunque no se ha logrado establecer un estándar que reúna todos los protocolos del mercado.
Actualmente existen intentos de estandarización por parte de organismos como AES (mediante el AES- 67), pero la aceptación de los fabricantes no es demasiado prometedora en la fecha actual.
A continuación, se detallarán las características de los protocolos Cobranet, AVB, Dante y BLU Link.
![]() |
Evolución de los principales protocolos del mercado |
COBRANET
"Cobranet es una combinación que incluye software, hardware y un protocolo de red para la distribución de diversos canales en tiempo real" [web de Cobranet, Technology FAQ]. Este sistema fue diseñado en 1996 por Peak Audio y vendido a Cirrus Logic. Muchos de los grandes fabricantes de equipos de audio (QSC, Yamaha, Biamp, Harman, etc.) incluyen en sus equipos la posibilidad de utilizar Cobranet.
CANALES Y BUNDLES
El principio de funcionamiento de Cobranet se basa en la asignación de canales en bundles. Cada bundle puede contener hasta 8 canales con una calidad de 48 kHz y 20 bits/muestra. Esta calidad puede aumentarse disminuyendo el número de canales por bundle o disminuirse (por lo que el número de canales aumenta). La calidad máxima de cada canal será de 96 kHz y 24 bits/muestra. La limitación de canales viene dada por la capacidad de envío de la trama Ethernet, que son 1500 bytes por trama.
Cada bundle tendrá un equipo origen específico, con una dirección única numerada del 1 al 65535, y uno o más receptores dependiendo de su categoría. Existen tres tipos de bundle en Cobranet:
- Multicast (1-255): enviados a todos los equipos de la red a través de una dirección Ethernet broadcast. Este tipo de paquetes pueden provocar un crecimiento desproporcionado del tráfico de red, por lo que debe ser utilizado con precaución.
- Unicast (256-65279): en los que cada envío se realiza a un solo dispositivo. Esto no quiere decir que un bundle Unicast tenga un solo destinatario, sino que para enviarlo a varios equipos deberán realizarse múltiples copias.
- Private (65280-65535): son bundles que se envían con la dirección MAC del emisor. Para recibir este tipo de paquetes, es necesario especificar los dos identificadores del bundle (número y MAC).
![]() |
Ejemplo de entrada/salida de un equipo Cobranet con distintas calidades de Señal |
TRANSMISIÓN Y LATENCIA
La transmisión de los paquetes Cobranet se realiza en la mayoría de los casos en redes Fast Ethernet (100Base-X) ya sean de cable estructurado o de fibra óptica. Versiones más actuales permiten la compatibilidad con el estándar Gigabit Ethernet. La latencia de transmisión en Cobranet puede fijarse para cada equipo. Menores períodos de latencia implican el envío de una mayor cantidad de paquetes de menor tamaño (menor duración de audio), lo que hace que puedan enviarse mayor cantidad de canales en alta calidad sin llegar a exceder el limite de 1500 bytes de Ethernet. El problema residirá en gestionar el ancho de banda para que esta mayor cantidad de paquetes no sature la red.
En cuanto a la comunicación entre equipos, destacan tres aclaraciones importantes:
- Sincronización: toda la red Cobranet toma la referencia de un solo equipo. Este equipo es el denominado Conductor. Pueden existir varios equipos configurados como Conductor en una red. En ese caso, el primero que se conecta sirve como referencia y los demás quedan a la espera para convertirse en Conductor en caso de fallo del actual. Esta conmutación se realiza en milisegundos, ya que la red no puede funcionar sin una referencia.
- Estructura de la red: Cobranet es un protocolo que se encapsula directamente en la trama Ethernet. Por tanto, un router IP no será capaz de analizar un paquete Cobranet. Esto significa que las redes Cobranet sólo pueden mantenerse en el ámbito LAN.
- Tipos de paquetes: existen cuatro tipos de paquetes de comunicación entre dispositivos Cobranet. Los paquetes Beat son enviados por el Conductor para establecer la sincronización de la red (a un ritmo de 750 paquetes por segundo). Los paquetes de Audio envían la información asociada a un solo bundle. Los paquetes de Reserva gestionan la comunicación y el ancho de banda de cada enlace. Los paquetes Serial bridge se utilizan para enviar información de control de equipos para su control remoto⁶ (protocolos RS-232, MIDI, etc.).
Si bien los sistemas Cobranet tienen la capacidad de insertarse en redes de uso compartido, esta práctica está desaconsejada, ya que no existe una capacidad de control de tráfico que garantice el buen envío de la información de audio.
HARDWARE Y SOFTWARE ASOCIADO
Los dispositivos compatibles con Cobranet incorporan una tarjeta de red que incluye un puerto primario y un puerto secundario o redundante. Existen diversos modelos de estas tarjetas distribuidos por el fabricante, que permiten el envío de más o menos canales dependiendo de la aplicación que se quiera diseñar.
Para el diseño y gestión de redes Cobranet, existen herramientas software como CobraCAD, que permiten hacer simulaciones de rendimiento al introducir la topología de red que se desea diseñar, o Cobranet Discovery, que gestiona y monitoriza el conexionado.
AVB
Audio Video Bridging es un estándar para la transmisión de audio y vídeo sobre redes LAN. Está basado en una serie de estándares desarrollados por el comité del IEEE 802.1, que establece normas como la temporización, reserva de recursos para garantizar la calidad, etc.
TRANSMISIÓN Y LATENCIA
Las redes que soportan AVB se basan en los estándares Fast Ethernet, Gigabit Ethernet y 10 Gigabit Ethernet, con la excepción de que los switches deben ser compatibles con AVB. En cuanto a la calidad de audio, AVB maneja frecuencias de muestreo de hasta 192 kHz y 32 bits/muestra.
Al igual que ocurre con Cobranet, AVB es un protocolo que se encapsula directamente sobre Ethernet, así que no puede transmitir información entre distintas subredes vLAN. Sin embargo, la capacidad de transporte de canales no viene dada por el protocolo, como ocurre en Cobranet, sino que es dada por los propios dispositivos. Lo mismo ocurre con la organización de canales en Streams (unidad de transporte similar al bundle); cada equipo o fabricante especifica la capacidad de los Streams que se transmiten por la red.
Las funciones principales que realizan los switches AVB son:
- Gestión del QoS: la gestión de prioridad de los paquetes multimedia se realiza automáticamente en AVB.
- Traffic-Shaping (conformado de tráfico): esta función protege a la red de sobrecargas causadas por grandes ráfagas de tráfico causadas en un momento determinado.
- Reserva de ancho de banda: los switches AVB reservan una parte de los recursos de la red exclusivamente para las comunicaciones de audio/video.
La gestión de latencia y sincronización en AVB están garantizados por una serie de normativas IEEE (802.1AS o 802.1Qat son algunos ejemplos). En general, la sincronización sigue el proceso de elegir un terminal de la red que se establece como Grand Master (referencia de reloj). En cuanto a la latencia, se ha logrado establecer un tiempo medio de 2 ms por transmisión, aunque puede reducirse este tiempo disminuyendo el número de pasos por switches (hops) que realiza el paquete.
En cuanto a la redundancia, no existe una normativa generalizada, por lo que cada fabricante gestiona esta característica según sus propios criterios.
AVNU ALLIANCE
Para garantizar la interoperabilidad entre distintos fabricantes, en el año 2009 se funda la AVnu Alliance, encargada de certificar compatibilidad con el estándar AVB. Grandes fabricantes como Harman, Biamp o Beyerdynamic forman parte de este organismo.
![]() |
Logotipo de Avnu Alliance |
DANTE
Dante (Digital Audio Network Through Ethernet) es un protocolo propietario de la empresa Audinate desarrollado en el año 2006. Este protocolo ha sido ampliamente aceptado por el mercado y es actualmente el protocolo con mayor cuota de mercado.
![]() |
Logotipo de Dante |
TRANSMISIÓN Y LATENCIA
Dante es compatible con los protocolos Fast y Gigabit Ethernet, al igual que Cobranet o AVB. Sin embargo, este protocolo no se encapsula directamente en la trama Ethernet, sino que también emplea el protocolo IP. Esto quiere decir que los paquetes Dante son capaces de viajar a través de distintas vLAN.
Dante organiza los envíos de canales en Flows de hasta 8 canales, aunque la asignación se hace de forma transparente al usuario. Estos Flows son Unicast por defecto, aunque pueden configurarse como Multicast de forma manual. El número de canales admitido depende del dispositivo al que se conecta, aunque un enlace nunca podrá superar los 1024 (512 entradas y 512 salidas) canales.
Los switches o routers utilizados en redes Dante deben de tener las siguientes capacidades de gestión:
- DiffServ QoS: añade una clasificación de 6 bits al datagrama IP que permite establecer una prioridad de envio en las colas de entrada de los conmutadores.
- IGMP Snooping: esta herramienta permite analizar el tráfico para realizar un mapa que determina la pertenencia de equipos a cada grupo Multicast, reduciendo el número de envíos broadcast que se producen en la red.
En cuanto a la calidad de audio, Dante permite el envío de canales con una calidad máxima de 192 kHz de frecuencia de muestreo y una profundidad de palabra de hasta 32 bits.
La sincronización de la red se realiza mediante un dispositivo Master que sirve de referencia a todos los equipos de la red (de manera similar a como ocurre en Cobranet o AVB). Esta referencia puede ser asignada automáticamente por el sistema o de forma manual. En caso de fallo de sincronización, Dante es capaz de silenciar la salida del dispositivo para evitar problemas de emisión de ruidos.
La latencia en los sistemas Dante es determinada por el tamaño de la red, variando entre 0,15 ms (redes de un solo switch) hasta los 5 ms.
En cuanto a la redundancia, el puerto primario se encuentra siempre reflejado en el puerto secundario (ambos tienen en todo momento el mismo tráfico). Es por esto que las redes primaria y secundaria siempre deben estar separadas totalmente la una de la otra.
SOFTWARE ASOCIADO
La gestión de todos los parámetros de la red Dante puede realizarse desde un PC conectado a la red utilizando el Dante Controller, un software desarrollado por Audinate para proporcionar una interfaz de uso muy intuitiva para el usuario. Las funciones principales de este controlador son:
- Gestión y monitorización del conexionado: ruteo de todos los canales presentes en la red, gestión de los grupos Multicast, etc.
- Monitorización del estado de los equipos: control de su estado de conexión, sincronización, latencia.
- Gestión de sincronización y latencia: elección del Master de la red y elección de la latencia máxima permitida.
- Diseño de presets de configuración: para realizar cambios en el sistema de forma rápida y sencilla. Por ejemplo, para sistemas con más de un escenario de uso.
![]() |
Ventana principal (conexiones) del Dante Controller |
Por otra parte, existe también la Dante Virtual Soundcard, que permite la inserción en la red de un PC o Apple Mac como interfaz de hasta 64 canales de audio sin compresión.
![]() |
Ventana de configuración del Dante Virtual Soundcard |
Esta herramienta es compatible con el protocolo ASIO, un estándar de facto en los sistemas de grabación por ordenador diseñado por la empresa Steinberg. Esto hace posible el reconocimiento de la interfaz Dante por la mayoría de entornos de producción y edición de audio profesionales que existen actualmente, tanto para PC como para Apple Mac.
BLU LINK
BLU Link es un protocolo propietario del grupo Harman, uno de los mayores fabricantes del mundo que incluye marcas como JBL, BSS o Crown, entre otras.
A diferencia de los otros protocolos citados anteriormente, BLU Link no está basado en Ethernet, aunque sí que comparte la mayoría de características del Nivel físico.
TRANSMISIÓN Y LATENCIA
Las redes basadas en BLU Link utilizan cable de Categoría 5e o enlaces de fibra óptica monomodo. Esta tecnología no utiliza conmutadores de ningún tipo, sino que todas las conexiones se realizan terminal a terminal. Existen por tanto dos topologías de red: daisy-chain (cadena) o anillo, siendo esta última la más utilizada ya que permite a la red seguir funcionando en caso de fallo de alguno de sus componentes. Una red BLU Link puede contener hasta 60 equipos.
![]() |
Tipologías Blu Link |
Los equipos BLU Link tienen un puerto de entrada y uno de salida. Si bien ambos puertos son bidireccionales (lo que permite a la topología de anillo funcionar cuando cae algún equipo), no se puede realizar una conexión IN-IN ni OUT-OUT. La comunicación de información de gestión se realiza por un puerto de control conectado a una red Ethernet independiente.
La limitación de canales total en la red es de 256 canales con una frecuencia de muestreo de 48 kHz (128 canales a 96 kHz) con una profundidad de palabra fija de 24 bits/muestra. Todos estos canales se consideran broadcast.
La latencia de transmisión es de 11 muestras (0,23 ms a 48 kHz) para la primera transmisión de la cadena, por ejemplo, del equipo A al equipo B. En las siguientes transmisiones, la latencia será de 4 muestras (0,083 ms a 48 kHz), por ejemplo, del equipo B al C, del C al D, etc.
![]() |
Ejemplo de latencia en una red Daisy-Chain con retardo total 0,48milisegundos (ref, BSS Technoloy Training. Cap 6) |
OTROS
Existen otros muchos protocolos sobre los que no se realizará un estudio en mayor detalle por su poca acogida en el mercado actual. Dos de esos protocolos son EtherSound y Ravenna:
ETHERSOUND
Es uno de los primeros protocolos que aparecieron en el mercado. Diseñado por Digigram en 2001, es compatible con los estándares Fast y Gigabit Ethernet.
Existen dos versiones de EtherSound con distinta capacidad:
- ES-100: basada en redes Fast Ethernet, con una capacidad de 128 canales de entrada/salida (64x64).
- ES-Giga: basado en Gigabit Ethernet. Tiene una capacidad máxima de 512 canales de entrada/salida.
Las redes EtherSound utilizan switches Ethernet normales (siendo recomendados switches Gigabit Ethernet). La estructura de la red puede ser en topología Daisy-chain, anillo, estrella o una combinación Daisy-chain/anillo.
Los canales de EtherSound pueden transmitir señal de hasta 96 kHz de frecuencia de muestreo y 24 bits de profundidad de palabra. La latencia mínima de transmisión es de 0,104 ms, añadiéndose 0,14 ms por cada nodo por el que pase el paquete. Al igual que ocurre con Cobranet, EtherSound necesita un ancho de banda mínimo para funcionar correctamente, por lo que se recomienda utilizar una red dedicada para el sistema de audio.
RAVENNA (AES-67)
AES-67 es un estándar desarrollado por la Audio Engineering Society en 2013. La función de esta estandarización es asegurar la interoperabilidad entre protocolos de audio en red. Un ejemplo destacable de protocolo compatible con AES-67 es el propio Dante; otro ejemplo, destacable por sus capacidades, así como por el hecho de ser una tecnología abierta, es Ravenna.
![]() |
Logotipo Ravenna |
El protocolo Ravenna, desarrollado en 2010, está basado en IP, al igual que Dante. Esto implica que es un protocolo capaz de saltar entre distintas vLAN. Los Streams que envía Ravenna están basados en el protocolo RTP, lo que hace compatible este protocolo con envíos tanto de audio como de video.
La transmisión por la red se realiza de forma similar a Dante, el QoS se realiza por DiffServ y la gestión de emisión Unicast o Multicast se puede configurar para cada Stream. En cuanto a la calidad de la señal, Ravenna permite gran variedad de formatos, con calidades que alcanzan los 384 kHz de frecuencia de muestreo y 32 bits de profundidad de palabra. Ravenna también es compatible, por ejemplo, con sistemas de codificación DSD⁷. El número de canales por Stream depende del dispositivo y de la aplicación utilizada.
La latencia puede ser ajustada para cada Stream en la red, permitiendo ajustarse a cada aplicación existente. La latencia total dependerá principalmente de la capacidad de la red sobre la que se apoya Ravenna. La sincronización utiliza el protocolo PTPv2 (Precision Time Control) para proveer al sistema de un reloj sincronizado en fase acorde con las exigencias de la normativa AES-11.
⁷DSD (Direct-Stream Digital) es un método de codificación de la señal en el que se envían estados de un solo bit con una frecuencia de 2,82 MHz. Estos estados informan de la pendiente que toma la señal en ese momento, lo que debido a su alta frecuencia permite reconstruir la señal analógica
Diego Sánchez de León Cenjor