Spectre, spectre instantané et sonagramme

Spectre instantané | L'objet sonore | Le spectrogramme | Bandes étroites versus bandes larges | Que peut-on tirer d'un spectrogramme ?
 

Spectre instantané

On peut isoler des « tranches » de signal et leur appliquer la transformation de Fourier. En multipliant ces analyses, on peut obtenir une représentation graphique dans les trois dimensions du temps, de la fréquence et de l'amplitude.

TOP ^

L'objet sonore

Nous avons déjà vu que l'on peut réduire la description du son à trois grandeurs physiques : la fréquence (Hz), le temps (s) et l'amplitude (dB). Par exemple, un son simple (sinusoïdal) est complètement décrit par les trois mesures suivantes : f = 440Hz, t = 1s, a = 60 dB. Par contre un son complexe sera défini, par exemple, de la manière suivante :

  • t = 5s ;
  • f1 = 100Hz et a1 = 70dB (fondamental) ;
  • f2 = 200Hz et a2 = 65dB (2e harmonique) ;
  • f3 = 300Hz et a3 = 50dB (3e harmonique).

Une telle représentation devient très complexe lorsque le signal étudié possède de nombreuses harmoniques : un signal à vingt-cinq harmoniques nous obligerait à reporter cinquante-deux valeurs dans notre tableau pour le décrire exhaustivement. Qui plus est les sons musicaux et ceux de la parole ne sont jamais stables dans le temps, ce qui fait du tableau de valeur une méthode impraticable pour traiter des cas non théoriques.

À partir de ces constatations, on a eu l'idée d'associer deux à deux les trois grandeurs physiques évoquées ci-dessus et de tracer les graphes de ces associations. On obtient ainsi :

  • le plan dynamique (temps x amplitude) ;
  • le plan du spectre (fréquence x amplitude) ; ce qui est dessiné sur ce plan est le spectre instantané, obtenu par la transformée de Fourier, en un temps donné du son considéré ; le spectre d'un son n'est jamais constant : on devrait, en fait, avoir recours à une infinité de plans spectraux ;
  • le plan mélodique (temps x fréquence).

On peut considérer les trois graphes ci-dessus (figures 6.17, 6.18 et 6.19) comme les projections planes, sur les plans élémentaires, d'un objet sonore en trois dimensions. On établit les correspondances suivantes :

  • au plan de base - axes x et y - correspond le plan mélodique ;
  • au plan de coupe - axes y et z - correspond le plan dynamique ;
  • au plan de profil - axes x et z - correspond le plan du spectre.

Dans notre représentation en trois dimensions : sur l'axe des x (abscisses), on reporte la fréquence ; sur l'axe des y (ordonnées), on reporte le temps ; sur l'axe des z, on reporte l'amplitude.

TOP ^

Le spectrogramme

Dans cette perspective, on obtient un spectrogramme acoustique sonagramme (appelé aussi sonagramme) en projetant l'objet sonore sur le plan de base (axes x et y). Les variations d'amplitudes seront marquées par le noircissement plus ou moins grand des bandes. (On peut aussi représenter l'amplitude par des courbes de niveau tracées tous les 6dB - utile surtout pour l'acoustique architecturale, pas pour l'analyse de la parole.)

Au niveau des formants, les sorties sur papier des sonagraphes présentent parfois des défauts au niveau de la résolution, en particulier en ce qui concerne les amplitudes (marquées par le degré de noircissement) dont on obtient généralement une représentation ne dépassant pas l'échelle 1/5.

Il faut garder un certain nombre de choses à l'esprit pendant l'analyse d'un spectrogramme :

  • le fait qu'on réduit à deux dimensions un « objet » qui en possède trois ;
  • l'existence d'une relation d'incertitude entre temps et fréquence ;
  • la plupart des mesures sont réalisées à l'aide d'un sonagraphe (aussi appelé spectrographe acoustique). Un sonagraphe est essentiellement un filtre passe-bande : le choix de la fréquence de filtrage joue un rôle fondamental (en général, on effectue plusieurs échantillonnages, typiquement à 10, 45, 150 et 300 Hz).

(On peut, d'autre part, utiliser un enregistreur logarithmique pour étudier le plan dynamique et un « mélographe » pour le plan mélodique.)

TOP ^

Bandes étroites versus bandes larges

Il s'agit essentiellement d'effectuer un choix entre les paramètres qui nous intéressent :

  • un spectrogramme à bandes étroites (10-45Hz) offre une bonne résolution au niveau fréquentiel, mais l'analyse temporelle est moins fine ;
  • inversement, un spectrogramme à bandes larges (150-300Hz) offre une meilleure résolution temporelle et permet de dégager les formants vocaliques, mais apporte moins d'éléments pour l'étude du domaine fréquentiel.

TOP ^

Que peut-on tirer d'un spectrogramme ?

  • En repérant les instants de transition, on peut faire correspondre des symboles phonétiques à diverses phases du spectrogramme.
  • On peut étudier l'évolution mélodique d'un signal, liée, en première approximation, au fondamental, mais on se sert en pratique d'un harmonique de rang élevé (le dixième pour une voix d'homme, le cinquième pour une voix de femme ou d'enfant).
  • On peut étudier le rythme du signal en observant l'évolution des durées des segments phonétiques qui le composent.

TOP ^

Suivez nous:        
Partagez: