Los sonidos que conforman una banda sonora vienen de la mano de las voces, efectos sonoros y música que complementan el repertorio visual del film (a los cuales cabría añadir el silencio). Mientras que el sonido diegético está justificado por algún elemento de la historia, el extradiegético no puede emanar de ningún objeto de la misma ni ser ubicado en ella.
El sonido in es todo aquél cuya fuente se sitúa en el interior del encuadre. La fuente del sonido off, en cambio, está situada fuera de campo. En segundo lugar, el sonido interior provendrá del interior de un personaje y será únicamente escuchado por él, mientras que la escucha del sonido exterior será compartida por el resto de personajes. En relación a esto último, el sonido out, será el diegético interior, mientras que el sonido over será el no diegético. Por su parte, Michel Chion utiliza el término acúsmetro para designar al emisor de un sonido diegético cuya fuente se encuentra fuera de campo y en un punto espacial indeterminado.
El final de Muerte en Venecia (Morte a Venezia, Luchino Visconti, 1971) comienza con el sonido diegético del ambiente y las voces pertenecientes al mar u otros elementos que se encuentran en la playa en que se ubica la escena. Sin embargo, según se va consumiendo el decadente compositor Gustav von Aschenbach, el acompañamiento musical extradiegético de la 5ª sinfonía de Mahler se sobrepone al sonido ambiente y refuerza el carácter crepuscular de los últimos instantes de Aschenbach, que muere mientras contempla extasiado la silueta lejana, envuelta en destellos marinos, del efebo que le ha cautivado en la playa veneciana.
La voz también forma parte del campo sonoro, y por tanto una clasificación de la misma tiene sentido en este apartado.
La voz off resulta la proveniente de un personaje fuera de campo pero perteneciente a la diégesis del relato. También la voz out pertenece al interior del universo representado, en concreto al monólogo interior o pensamiento de un personaje que ejerce de narrador. La voz over, en cambio, alude a una instancia ajena a la diégesis.
Revolutionary Road (Sam Mendes, 2008) cierra su drama con una ironía formal construida a través del recurso de la auricularización interna primaria. La última escena la protagonizan el matrimonio vecino de los Wheeler, protagonistas del film. La mujer, interpretando al estereotipo de vecina fisgona, critica el destino de los Wheeler mientras su marido parece escucharla. Sin embargo, éste decide bajar el volumen de su audífono para desentenderse de las palabrerías de su esposa. A los espectadores se nos hace partícipes de forma directa de esta desconexión sonora que identificamos como la escucha subjetiva del marido: progresivamente dejamos de escuchar a la mujer porque la enunciación baja el volumen¬. De este modo, el discurso enfatiza la problemática nuclear de la cinta de Mendes: el hastío que provoca el ideal del sueño americano, comprometido de forma cotidiana con los deseos que la corrección moral silencia.
En la auricularización cero el sonido se pliega a criterios de inteligibilidad, habitabilidad y credibilidad siendo fiel a las distancias entre los personajes.