LE VERBE ET L'IMAGE

Jean-Paul Desgoutte

 

III

La mise en scène de l’entretien

Interviews, entretiens, débats, talk-shows constituent une part importante des programmes de télévision [1]. Ils se proposent pour la plupart comme des moments et des lieux d’échanges, neutres et non partisans, dont la vocation est de faciliter la diffusion des idées afin de favoriser la formation, voire l’expression, de l’opinion publique. Mais quelles sont les contraintes réelles inhérentes aux dispositifs de mise en scène et jusqu’à quel point la procédure énonciative peut-elle inférer sur le déroulement des débats, d’une part, sur leur interprétation par le spectateur d’autre part ? Le présent travail se propose d’établir les bases d’une théorie pragmatique de l’entretien qui puisse faciliter l’interprétation des processus interactifs propres à la représentation audiovisuelle.


1. Champ sémiotique, champ sémantique

Tout acte de communication se développe dans deux champs complémentaires : le champ référentiel, informatif ou constatif, et le champ relationnel, que l’on peut encore qualifier de performatif ou d’énonciatif. Ces deux champs correspondent aux deux fonc­tions canoniques du langage, la fonction de représentation ou de constat d’une part, la fonction pragmatique discursive, d’autre part. Le langage sert à la fois à décrire et à agir.

Plus qu’opposées, ces deux fonctions sont complémentaires, voire indissociables. Il n’y a pas de récit sans discours, d’histoire sans narrateur, ni non plus de discours sans récit, de message sans contenu, de relation sans contexte. L’interpénétration du discours et du récit, du sémantique et du sémiotique, a été décrite par Émile Benveniste (1969 et 1974) à partir d’une analyse de la subjectivité dans le langage qui met en évidence le caractère intentionnel de la production du sens.

Le sens n’est pas confiné dans les lexiques virtuels des langues naturelles – comme l’or des États-Unis dans les caves de Fort Knox – mais se retrempe et se métamorphose continuellement à l’usage infini du discours quotidien intersubjectif qui constitue le jeu social. C’est ainsi que les énoncés portent toujours deux valeurs de signification, un sens dénotatif, cristallisé, lexicalisé, sémiotique, qui renvoie au système de la langue, et un sens projectif, sous contexte, sémantique, qui rend compte ou qui organise l’échange intersubjectif. Cette valeur sémantique de l’énoncé n’est pas soumise à une simple intelligence de l’interlocuteur mais bien à une interprétation dont il est en fin de compte le seul juge.

2. Le discours et le récit

Tout énoncé mêle une fonction informative, référentielle, à une fonction relationnelle, pragmatique, mais on peut distinguer les énoncés discursifs, à vocation pragmatique dominante, des énoncés narratifs qui manifestent une plus ou moins grande autonomie par rapport au contexte de leur énonciation. La conversation et l’entretien se déroulent dans le hic et nunc d’un échange intersubjectif actuel, tandis que le récit se déploie dans un jeu intersubjectif dissocié, à l’intention d’un public passif ou virtuel. La chaîne verbale, constitutive du discours, se caractérise par l’alternance des points de vue propres aux locuteurs, alors que la chaîne verbale constitutive du récit se caractérise par la permanence et l’unicité du point de vue énonciatif – quelle que soit au demeurant la variété des artifices narratifs.

Le discours est une concaténation de segments qui se caractérisent chacun par le locuteur qu’ils manifestent, l’information qu’ils donnent et l’intention qu’ils véhiculent, mais l’alternance des propos ne peut s’organiser et se perpétuer que si les acteurs s’accordent a minimo sur l’enjeu implicite de l’échange. Ils se doivent donc d’élaborer un même point de vue sur le sens de ce qui se joue. Autrement dit, l’isotopie sémantique de la conversation n’est concevable que du point de vue abstrait d’un tiers virtuel auquel chacun des interlocuteurs accepte de s’identifier.

3. L’alternance des propos

Ce processus d’élaboration d’une cohérence sémantique se situe de façon privilégiée dans l’organisation de l’alternance des propos. Chevauchements, silences, interruptions, dénégations, etc. sont – paradoxalement – autant de procédures qui visent à pérenniser le contact dans l’assentiment de l’autre. Ces artifices, qui ordonnent et réduisent l’expression des subjectivités, sont tout à fait comparables aux procédés de narration. Les règles qui organisent le "tour de parole" sont les règles mêmes qui président à la construction de tout récit.

Les segments narratifs, constitutifs du récit, rendent compte dans leur concaténation et dans leur syntaxe du processus de ponctua­tion propre au discours. Ils décrivent d’une part le contenu brut du discours – on parlera en ce cas de segments référentiels – et ils proposent d’autre part une interprétation de la signification implicite de l’échange – et on peut parler alors de segments énonciatifs.

Segments énonciatifs et segments référentiels se mêlent plus ou moins intimement dans le déroulement du récit, non sans manifester le point de vue qui leur est propre et la fonction qu’ils assument. Les segments référentiels rendent compte des points de vue internes à la diégèse, alors que les segments énonciatifs rendent compte du point de vue du narrateur, voire de celui du lecteur ou du spectateur. Le mouvement même du récit est une oscillation permanente entre le champ de la diégèse et l’univers de l’énonciation, de même que la dynamique du discours se règle dans l’alternance des propos. La tension narrative qui entretient l’intérêt du lecteur ou du spectateur est fondamentale­ment de même nature que la tension discursive qui entretient ou pérennise l’échange verbal.

4. Point de vue et point d’écoute

Nous avons précédemment formulé l’hypothèse (Desgoutte, 1997, pp. 97-109) que le récit audiovisuel peut être analysé, à l’instar du récit verbal, comme une concaténation de propositions – usuellement appelées plans – qui se rapportent chacune à un point de vue interne ou externe à l’histoire racontée. En ce sens, la narration audiovisuelle est constituée d’un enchaînement de segments diégétiques ou énonciatifs, qui alternent les points de vue simulés des acteurs de l’histoire racontée et les points de vue externes du narrateur et/ou du spectateur.

Cette formulation nous permet de mieux comprendre ce qui se joue dans l’enregistrement d’un débat ou d’un événement. Le contenu de l’émission enregistrée adresse au spectateur un certain nombre d’éléments référentiels, directement puisé dans l’événe­ment, et un certain nombre d’éléments énonciatifs qui sont le fait du metteur en scène et visent soit à rendre explicites le sens de ce qui s’échange, soit à manifester le point de vue du narrateur quant à ce qui s’échange.

L’entretien et le débat audiovisuels ont à vrai dire un statut un peu particulier par rapport au récit audiovisuel « canonique », en ce sens que les acteurs y ont une véritable autonomie de comportement. Ils sont là pour débattre et inventent ensemble le déroulement du propos. Ils règlent entre eux, avec la participation éventuelle d’un animateur, l’enchaînement des tours de parole. La structure de la « narration » (la syntaxe du programme) est donc le résultat d’une interaction ou d’un compromis entre la logique du discours de référence et la rhétorique de la mise en scène ou de la mise en image.

Si le réalisateur n’a pas de maîtrise directe sur le contenu de l’échange ni sur la ponctuation des propos, il a en revanche une grande liberté de traitement de l’image puisqu’il peut choisir le contenu, la valeur du plan et les mouvements de caméra, et contrôler également l’usage des micros et l’enregistrement du son.

Cette position particulière du réalisateur n’est pas sans influence sur l’évolution du débat dont elle peut tendre à accentuer ou au contraire à effacer certains aspects. Le réalisateur est en position d’analyste par rapport à la « chorégraphie » du débat dont il peut anticiper ou retarder la représentation, quant au tour de parole en particulier.

Si le discours ou l’entretien se fondent prioritairement sur un échange de paroles, ils donnent lieu également à un échange de regards et d’expressions, de comportements et de postures qui ajoutent à la signification du « dit » une signification du « montré ». La restitution du jeu des regards, des expressions et des comportements exige un dispositif particulier d’enregistrement qui prenne en compte la spécificité visuelle de l’échange.

Le point de vue de la caméra rend compte de l’angle de narra­tion (J.-P. Desgoutte, 1997, p. 125), c’est-à-dire de la position du narrateur dans le dispositif énonciatif, soit qu’il adopte le regard (intradiégétique) de l’un ou l’autre des acteurs, soit qu’il reste extérieur à la scène référentielle. La dissociation du son et de l’image permet de sophistiquer le jeu énonciatif en séparant le (ou les) point d’écoute du (ou des) point de vue. De même que l’enregistrement du son simule par l’usage d’un ou de plusieurs micros une position d’écoute du spectateur, de même l’enregistrement de l’image simule par l’usage d’une ou de plusieurs caméras un point de vue du spectateur. Mais alors que le contexte sonore d’un événement est peu ou prou commun à l’ensemble de ses acteurs (chacun entend plus ou moins la même chose que les autres), la restitution du contexte visuel nécessite l’identification des divers points de vue à l’œuvre.

5. Les catégories personnelles de l’image

Le discours est à la fois un échange de propos et de comportements. Le sujet se manifeste simultanément par ce qu’il dit et par ce qu’il montre. En plus du contenu verbal du message qu’il adresse à son interlocuteur, il manifeste, délibérément ou non, un certain nombre d’attitudes et d’expressions, qui révèlent ses émotions, ses sentiments ou ses intentions. Il propose donc à son interlocuteur une image de soi dont on peut dire qu’elle se partage en deux composantes, une composante expressive – involontaire ou spontanée – et une composante impressive, délibérée, intentionnelle. Ces deux images, focalisées l’une sur le sujet, l’autre sur son vis-à-vis, accompagnent à chaque instant le jeu d’échange verbal. Le regard (comme la parole) peut être caractérisé par sa polarisation émotive ou conative, selon les termes de Roman Jakobson (1963) – expressive ou impressive, selon nos propres termes. On peut ainsi appeler fonction JE la dominante expressive et fonction TU la dominante impressive (J.-P. Desgoutte, 1997, pp. 117-118). Le mouvement du dialogue mêle sans cesse les images de l’un et de l’autre interlocuteurs, dans un jeu quasi chorégraphique où alternent mouvements vers l’autre et replis sur soi. Le foyer de l’échange, verbal et visuel, oscille sur la ligne des regards, privilégiant parfois l’un, parfois l’autre, donnant lieu également à des affrontements, des conflits de territoire, ou encore à des silences où chacun se retrouve au plus intime de lui-même.

Ce mouvement caractéristique du jeu intersubjectif, a été décrit, dans sa dimension verbale, par Émile Benveniste. Il se manifeste dans toute langue par le jeu plus ou moins complexe des pronoms personnels. Nous nous proposons ici d’en formuler de façon analogue la dimension visuelle en posant qu’il existe trois images de tout sujet :

·        L’identité du sujet est l’image dénotative ou descriptive simple. Elle est présumée libre de toute expression et de toute intention. On peut dire qu’elle appartient au référent social.

·        L’expression du sujet manifeste – hors de toute intention – la subjectivité du locuteur.

·        Le regard du sujet rend compte du rapport intentionnel que le sujet entretient avec son vis-à-vis.

Cette transposition des catégories verbales personnelles dans le domaine visuel est liée au développement depuis un siècle d’une « grammaire implicite de l’image animée ». Le cinéma et plus encore la télévision, ont systématisé la simulation, l’enregistrement et la diffusion des dialogues, conversations et débats. Les réalisateurs et metteurs en scène ont ainsi été amenés à élaborer de façon empirique des dispositifs de représentation qui tendent à rendre compte, le mieux possible, de l’ensemble de l’événement concerné, dans sa totalité et dans ses parties.

Cette élaboration d’un dispositif de représentation n’est rien d’autre, dans le fond, qu’une théorie implicite de l’échange qui propose de façon empirique un certain nombre de paradigmes visuels représentatifs de la dynamique propre au discours. La pratique de la réalisation conduit ainsi à faire un certain nombre de choix de points de vue, cadrages, angles, etc. qui sont autant de propositions d’analyse de l’événement. Le découpage technique, propre à toute représentation audiovisuelle, se propose, de fait et par la force des choses, comme une théorie de l’action sociale. Il mêle intimement une analyse « logique » de l’événement à une interprétation énonciative, inhérente à toute procédure de représentation.

6. Le modèle de l’interview

Nulle part mieux que dans l’interview ne se révèle le jeu d’implication qui lie l’instance référentielle et l’instance énoncia­tive. En effet, le principe même de l’interview [2] est d’établir un passage – voire une confusion – entre discours et récit, performance et constat. L’interview mêle donc les deux instances, topique, où la personne interrogée, se livre à un échange discursif avec son interlocuteur, et énonciative, où l’interviewer met en scène le propos selon un dispositif plus ou moins complexe à l’usage du public.

Le rôle de l’interviewer est d’ordonner, selon un schéma narratif interprétable par un destinataire absent, les propos de l’interviewé. Il intervient comme narrateur des deux côtés de la frontière que constitue le cadre de l’entretien. Il est partie prenante du discours qu’il ordonne, sans toutefois s’y impliquer personnellement, mais il est également narrateur du récit destiné au public. Son rôle est modulable, de la présence opaque à la transparence complète. Présent dans la scène, il est acteur du drame. Silencieux, voire absent du cadre, il tend à se confondre avec le destinataire virtuel du propos. L’interviewer trace le cadre énonciatif où le propos de l’interviewé viendra s’inscrire. Il autorise ainsi la manifestation d’une logique immanente au personnage en le conduisant à donner de lui-même un récit structuré [3] .

7. Dialogue et conversation

La conversation et le dialogue, peuvent être analysés à partir d’une généralisation du modèle de l’interview. La représentation de la conversation est assimilée, dans ce cas, à un double jeu d’interviews simultanées où chacun prend à son tour le rôle de narrateur-miroir. Chacun des interlocuteurs assume donc le triple rôle d’émetteur, de récepteur et de témoin.

Émetteur, il crée l’événement en soumettant à son vis-à-vis une proposition dont les fonctions sont multiples.

Récepteur, il propose un cadre et une trame à l’image et au propos de son interlocuteur, dont il produit une analyse instantanée. La logique du propos de l’émetteur est donc déterminée par la réac­tion du récepteur. Cette fonction du récepteur est à rapprocher de celle de l’interviewer, en ce sens que le récepteur est en position d’observateur par rapport à l’émetteur et à son propos.

La réaction du récepteur peut elle-même être objectivée du point de vue d’un tiers. Autrement dit, le tiers institue une deuxième instance d’observation qui révèle l’interactivité propre à la conversation. Ce cadre est à la fois le lieu d’un éventuel témoin et celui du réalisateur-narrateur. Mais c’est également le lieu d’où l’émetteur observe la réaction de son vis-à-vis à son propos. Ce qu’il lit, dans le regard de l’autre, c’est sa propre image.

Il y a donc deux niveaux de narration qui s’enchâssent. Le premier est assuré par la présence active du vis-à-vis et le second par la présence explicite ou implicite du tiers. L’interversion des rôles d’émetteur et de récepteur présuppose ou induit l’existence d’un champ d’observation externe au dialogue où le jeu intersubjectif est observable dans sa totalité. C’est le lieu où s’élabore une logique commune aux propos de l’un et de l’autre.

Le référent – l’événement – est constitué de plusieurs points de vue qui peuvent et doivent être décrits dans leur unicité et dans leur interrelation.

Si A, B et C sont respectivement locuteur, destinataire et témoin de l’échange, la représentation de l’échange doit rendre compte à la fois du point de vue de A sur B, du point de vue de B sur A et du point de vue tiers du témoin C, qui encadre les deux précédents.

En ce lieu commun s’élabore la logique du propos, qu’elle soit assumée par le jeu intersubjectif, et donc immanente à l’événement, ou qu’elle soit prise en charge par le narrateur, et donc transcendante à l’événement.

Quand A parle, B fait fonction de miroir de A, C révèle quant à lui, le jeu de B par rapport à A. C’est la position de témoin qui juge des interférences logiques entre A et B.

Il y a donc trois degrés d’enchâssement. B est en position d’extériorité par rapport à A, et C en position d’extériorité par rapport à {A ® B}. Le rapport de C à A est médiatisé par B. Si le sens du message s’inverse, le jeu d’enchâssement se transforme : le rapport de C à B est médiatisé par A.

La problématique de l’interview se ramène donc à la métamorphose d’un discours – par nature discontinu et intersubjectif – en un récit cohérent, structuré, accessible et interprétable par un tiers.

Cette problématique de la métamorphose du discours en récit (ou, plus généralement, de la parole en écriture) met en évidence la nécessité d’un dispositif de médiation qui explicite les éléments pragmatiques propres au discours. Le discours est fondamentalement ininterprétable en dehors de son contexte de manifestation, alors que le récit se doit de pérenniser sa signification indépendamment du contexte de son énonciation.

L’explicitation du discours ne peut se faire que du point de vue du tiers. Elle est prise en charge, d’une façon très générale, par les médias. Le processus médiatique lève l’ambiguïté propre au jeu intersubjectif dont il donne une représentation ou, plus exactement, il en transforme la nature et il en déplace le lieu. L’interprétation de ce qui s’échange ne se joue plus à l’intérieur du discours de référence mais entre les acteurs du jeu énonciatif.

Le travail de mise en scène propre aux médias a pour nécessité – et pour objet – de déplacer le processus performatif, créateur de sens, de l’univers propre au discours de référence à l’univers énonciatif, autrement dit de la « scène » à la « salle ».

C’est ainsi que l’espace d’interprétation offert au spectateur est déterminé à la fois par le support de médiation et par la sophistication relative des choix de mise en scène.[4]

8. Les aspects du récit audiovisuel

Qu’est-ce donc que rapporter un propos ? Est-ce se situer à la place de la personne qui le profère ? A celle de celui à qui il est destiné ? Ou encore en un troisième lieu qui serait soit la place d’un témoin de l’événement, soit la place d’un observateur exté­rieur à l’événement [5]? Faut-il mêler tous ces points de vue ou, à chaque instant, privilégier l’un ou l’autre suivant en cela quelque progression logique qui serait soit inhérente à l’événement soit révélatrice de l’intelligence du narrateur ?

La volonté de donner une représentation immanente et totalisante de l’événement peut amener le narrateur à analyser l’événement en autant de récits qu’il existe de points de vue. On peut imaginer pour ce faire un dispositif enregistrant les perceptions sonores et visuelles de chacun des acteurs et les restituant sur un ensemble de moniteurs. Dans le cas d’un dialogue, on aurait deux écrans côte à côte [6], simulant chacun le regard et l’ouïe de l’un des interlocuteurs. Mais quelle serait donc la réalité du point de vue du spectateur observant les deux écrans ? Point de vue du tiers exclu (voyeur) ? Certes non, mais bien point de vue artificiellement reconstitué d’une double présence simultanée à l’événement. Le spectateur serait censé être à la fois l’un et l’autre des interlocuteurs.

Si la simulation est parfaite, le spectateur aura l’étrange sensation que l’un et l’autre interlocuteurs ne conversent pas ensemble mais s’adressent à lui spectateur. En ce cas, il se trouve en effet projeté dans le lieu de l’énonciation à la place même de l’un et l’autre interlocuteurs. Il cesse dès lors d’être spectateur sans pour autant acquérir le rôle d’acteur. Confronté aux images simultanées des deux interlocuteurs, le spectateur concentre alternativement ses regards sur l’un ou l’autre de ses vis-à-vis, suivant la trajectoire du message, et révèle ainsi un parcours signifiant de l’événement. Ce mouvement manifeste que les divers points de vue ne sont pas identiquement porteurs de signification par rapport à l’événement. Le choix parmi les points de vue disponibles, donne lieu à une segmentation du propos qui est le propre du narrateur (i.e. du réalisateur).

Pour restituer le discours d’un orateur doit-on filmer la salle (on révèle l’effet de la fonction impressive du discours) ou le visage (voire le corps) de l’orateur (on révèle la fonction expressive, l’intention consciente ou inconsciente de l’orateur) ?

Doit-on filmer les deux simultanément et laisser au spectateur le soin d’interpréter les interactions visibles entre le propos de l’un et le comportement des autres ?

Ou encore, montrera-t-on alternativement les uns et les autres, mais le choix du narrateur n’influera-t-il pas alors sur l’interprétation de l’événement par le spectateur ?

À vrai dire, les trois cadres disponibles ne sont pas équivalents ; ils sont subordonnés les uns aux autres. Ainsi que nous l’avons vu précédemment, l’accès à l’expression du sujet est médiatisé par le regard de l’autre. Explicite ou implicite, présent en amorce ou en contre­champ, l’autre est un cadre à franchir pour accéder au sujet. Ce que l’on peut formuler de la façon suivante : la médiatisation imaginaire est nécessaire à l’interprétation du référent.

En fait, s’il y a une place pour un tiers dans une conversation, place de témoin ou de narrateur qui comprend quelque chose à ce qui s’échange, c’est que cette place est toujours déjà présente dans le jeu intersubjectif. L’acteur a toujours trois types de rapport à l’événement : un rapport réflexif, un regard qui interpelle et un regard qui constate.

Le rapport réflexif est expressif, le regard qui interpelle saisit le regard de l’autre, le regard qui constate voit sa propre image dans les yeux de l’autre. Et cette image-là est objective, étrangère. Elle ne peut être perçue que parce que le sujet se situe alors en un lieu tiers, hors de son propre corps. Le lieu où le locuteur se voit en même temps que l’autre est le lieu du tiers ou du narrateur. La restitution d’un discours simule l’évolution du message – sa trajectoire sursignifiante – en jouant alternativement sur les regards et sur les points de vue de l’un et de l’autre. Elle tend ainsi à déterminer une place du narrateur où viendra également s’installer le spectateur.

Il existe un point de vue logique sur le récit, qui donne une image de l’ensemble des fonctions à l’œuvre. Ce point de vue mêle la logique immanente au propos et la logique propre au regard du narrateur. Nous en venons ainsi à l’idée que l’espace du discours n’est pas homogène par rapport au sens de ce qui s’y produit mais qu’à chaque instant un ou plusieurs foyers de signification s’y révèlent, instituant un ordre dans l’émergence des signifiants ou encore un parcours du message. Ce foyer de la signification est un lieu potentiellement consensuel, c’est-à-dire que l’ensemble des acteurs s’y rejoignent en position de témoin ou de narrateur (sans doute pas toujours, et sans doute pas de façon continue mais c’est bien l’ensemble des segments consensuels qui constituent à proprement parler le résultat de l’échange ou encore son récit potentiel). Participer à une conversation, c'est donc essayer de rejoindre l'autre en un lieu où l'on est à la fois témoin de sa propre performance et de la performance de l'autre. À chaque instant, l’évolution du message et de la situation de communication tend à privilégier un cadre. Un événement en effet ne se réduit pas à l’addition des subjectivités à l’œuvre mais plutôt à la circulation et à la métamorphose d’un message qui est premier et constituant de la situation. Cette circulation du message dans le discours donne lieu à une confrontation entre les acteurs qui, d’une certaine façon, sont soumis à son parcours, alors que dans le récit tout se passe comme si le narrateur était lui-même le deux ex machina qui élucide ou élabore a priori la nécessité et la logique de l’échange. Du discours au récit, le sujet passe d’une situation de soumission au message et au jeu intersubjectif, à une situation de maîtrise et de création. La représentation, en révélant le parcours du message, métamorphose l’ordre réel en ordre logique [7].

L’événement est à la fois l’expérience vécue par chacun de ses acteurs (l’idée que chacun se fait de ce que vivent les autres ou l’idée que chacun se fait du regard de l’autre) et la somme « géométrique » que le narrateur (ou celui qui pour une raison ou pour une autre veut bien prendre en charge le récit) réalise de l’événement. A strictement parler, le récit dans sa fonction totalisante et réductrice, se fait toujours du lieu du tiers. Le récit ne commence que lorsque l’événement est clos. Ainsi toutes les formes propres au discours, qui parsèment le récit, ne fonctionnent que comme des parenthèses « mimétiques ».

Le metteur en scène, narrateur de l’événement, a la liberté de privilégier l’un ou l’autre des cadres disponibles. Il peut adopter, indifféremment l’un ou l’autre des points de vue. Le choix des cadres et des angles de narration lui permet de révéler les fonctions multiples du message et/ou d’en privilégier l’un ou l’autre. La logique de la mise en scène peut ainsi tendre à épouser la logique propre à l’évolution de l’événement ou l’interpréter en toute liberté.

9. Typologie de l’entretien audiovisuel

L’étude des dispositifs narratifs audiovisuels propres à l’interview, offre un vaste panorama des relations que peuvent entretenir les univers référentiel et énonciatif. L’interview, dans ses multiples avatars, est en effet un lieu d’observation privilégié des contradictions pragmatiques propres aux programmes télévisuels.

L’interviewer joue le rôle d’un miroir intelligent qui radicalise, en l’objectivant, le rapport que tout individu entretient à sa propre image. Les choix de mise en scène portent à la fois sur le décor, la durée de l’entretien et la ponctuation des propos.

Ø      Le décor tend à organiser ou à structurer l’espace de l’échange pour en faciliter le développement ainsi que la représentation. Il prend donc en compte à la fois les contraintes propres à la dynamique de l’échange et à la logique de la diffusion. Il anticipe les rôles de chacun des acteurs et ménage les effets de mise en scène (quant à la po­sition et aux mouvements des caméras, en particulier). Les places attribuées à chacun des protagonistes se distribuent à la fois selon le ou les axes de référence de la dynamique de l’échange et selon le ou les axes de référence de la logique énonciative. Toutes ces conventions évoluent selon un usage soumis aux modes et aux enjeux de la programmation.

Ø           La durée de l’entretien répond le plus souvent à la logique du dispositif de diffusion. Ce qui n’est pas sans influence sur la configuration et le rythme de la ponctuation discursive. La durée et le rythme de l’échange en conditionnent évidemment le contenu.

Ø           La ponctuation, ou l’enchaînement des tours de parole, qui est souvent le lieu privilégié d’observation de l’évolution de l’échange, est également l’objet de toutes les convoitises intradiégétiques et extradiégétiques. Elle peut donner lieu à un accord ou rester le privilège du meneur de jeu, représentant le metteur en scène, mais reste en tous cas sous le contrôle du réalisateur qui impose en dernier recours le découpage final. La ponctuation du propos détermine en dernière analyse la durée de présence de chacun des interlocuteurs à l’image.

Nous notons dès à présent que les logiques diégétique et énonciative développent des stratégies autonomes, ou largement indépendantes, à l’intérieur d’un même projet narratif. Cette situation ne peut manquer de donner lieu à des conflits ou des contradictions entre contenu et mise en scène. Ces conflits pragmatiques sont un enjeu essentiel de l’interprétation en ce sens que contrai­rement à l’idée communément admise, la réalité – sinon la vérité – n’est pas du côté du contenu mais bien du côté de la mise en scène[8]. Le cadre en effet sépare le champ – imaginaire – du spectacle de l’espace – réel – de son énonciation.

10. La diffusion en direct

La diffusion en direct respecte l’événement dans son intégrité. Le dispositif narratif peut être réduit au minimum, une caméra fixe couvrant la totalité du champ, pendant la totalité de l’événement. L’angle que fait l’axe de la caméra par rapport à l’axe de la conversation est alors la seule manifestation concrète du projet narratif. En effet, si l’objet de l’enregistrement est bien une interview (et non une conversation : voir supra), l’angle de prise de vues privilégiera la personne interviewée, tendant par là même à éloigner l’interviewer du foyer de l’événement et à le rapprocher du point de vue extradiégétique d’où se fait l’énonciation (i. e. l’objectif de la caméra). Plus l’interviewer tend à limiter son intervention à une fonction sémantique, c’est-à-dire à entretenir et à relancer la parole, ou encore à manifester les liens logiques latents aux propositions émises par l’interviewé, plus il s’efface du champ. En effet, la présence physique de l’interviewer, ses gestes, ses expressions, révèlent soit la fonction expressive de ses questions, soit la fonction impressive des propos de son interlocuteur, toutes manifestations qui gênent le rapport direct de l’interviewé au spectateur. Dans le même ordre d’idée, les interventions verbales de l’interviewer sont alors réduites au minimum : elles n’ont pour strict objet que de lancer, de faire rebondir ou de clarifier la logique immanente au propos.

La présence de l’interviewer en amorce révèle parfois son appartenance aux deux champs disjoints de l’événement et de l’énonciation. L’amorce manifeste l’ambivalence du personnage qui est à la fois partie prenante du jeu intersubjectif propre à l’échange, et metteur en scène, médiateur d’un récit qui s’adresse au spectateur.

Le parti pris d’extraire complètement l’interviewer du champ du spectacle, le fait basculer dans le champ de la narration, du côté du spectateur. En ce cas de figure, il existe encore une progression narrative, qui est liée à l’ouverture relative de l’angle de narration. Plus l’angle est aigu, plus l’interviewer est identifié au narrateur, voire au spectateur, plus il est large, plus l’interviewer est perçu comme appartenant au hors champ (et non au hors cadre) de l’événement.

Le cas limite est celui où l’angle est nul. En ce cas, la caméra et l’interviewer se situent en un même lieu. Cette situation est assez rare en raison des problèmes techniques et logistiques qu’elle soulève. On l’identifie souvent, à tort, à la position occupée par le présentateur du journal télévisé, qui s’adresse, à travers la caméra, au spectateur. L’interviewé confronté à un « homme-ca­méra » ne s’adresse pas, quant à lui, au spectateur mais bien au narrateur du récit (qu’il est en train de faire !) dont la présence, transparente ou implicite, est indiscutable.

La position de l’interviewer simule en fait une fonction interne au sujet. La fonction narrative logique, sans cesse à l’œuvre, permet au sujet de s’objectiver par rapport à lui-même, de struc­turer son image et son histoire. C’est pourquoi la simulation de la subjectivité du sujet (narrateur de sa propre his­toire), pour peu qu’elle n’entende pas se limiter à la fonction sensorielle, ne révèle pas le regard du sujet, mais bien son expression. Le Je de la parole ne correspond pas au regard porté sur l’objet mais à l’image que le sujet a de lui-même du point de vue du miroir que simule le narrateur. Le sujet qui dit Je se regarde en miroir.

11. La diffusion en différé

Un pas de plus dans l’élargissement du dispositif narratif peut être franchi si l’interview est transmise en différé. En effet, la transmission en différé offre au réalisateur la possibilité d’intervenir sur la structure de l’interview. Cette intervention peut prendre la forme d’une segmentation ou d’un effacement de l’une ou l’autre partie du propos. Elle peut également prendre la forme d’un réarrangement des éléments fragmentés. Cette intervention a posteriori du narrateur peut être, ou non, rendue manifeste dans le produit final, selon qu’elle épouse, ou non, les fractures propres à la logique du propos [9].

Le montage sonore se fonde, dans le meilleur des cas, sur le respect de la cohérence morphologique interne des unités verbales et sur la cohérence sémantique implicite externe au discours. Il est facilité par les temps de « silence » caractérisant la fragmenta­tion du discours. Le montage visuel, s’il veut simuler de même une continuité, est tenu d’analyser et de prendre en compte les unités propres à la perception visuelle. Le rapport entre la parole et le silence dans l’univers sonore est un rapport d’intensité. La parole se surimpose à l’ambiance sonore. On peut dire que la parole est un objet sonore qui recouvre en partie le décor sonore ambiant. De même, un objet ou un personnage sont-ils identifiés comme se détachant sur un décor ; d’où le double usage, fréquent dans le montage d’interview, du fondu et du plan de coupe. Le fondu au noir, suivi d’une ouverture au noir, accompagne la baisse d’intensité sonore caractérisant la fin de la proposition verbale ; le plan de coupe manifeste le retour au décor ambiant caractérisant la fin d’un mouvement visuel. Ces deux procédés classiques du montage d’interviews ont le défaut de révéler plus ou moins l’intervention du narrateur. Une autre technique est donc utilisée qui se fonde non plus sur la structure logique propre à l’objet représenté mais sur la structure logique propre au nar­rateur (voire au spectateur). Le problème en ce cas n’est pas (seulement) d’analyser les fractures propres à l’événement — fin d’un mouvement, clignement d’œil, gestes divers, etc. — mais de simuler les fractures propres à l’attention du narrateur ou du spectateur. Il s’agit de faire basculer l’image du côté de la narration.

Deux procédés sont utilisés pour ce faire : d’une part la multiplication des points de vue, d’autre part l’utilisation du contrechamp. Dans l’un et l’autre cas, la position de l’interviewer cesse de se confondre avec celle du narrateur. On tend donc à une séparation plus nette des deux instances de l’événement et de la représentation correspondant à une mise en scène plus élaborée du propos.

La multiplication des points de vue et des cadrages nécessite soit l’utilisation de plusieurs caméras, soit un déplacement, objectif ou subjectif, de la caméra utilisée. En chaque cas la logique propre aux mouvements de caméra relève de la logi­que du narrateur, qu’elle soit déléguée à l’opérateur ou révélée par le mixage en direct. Cette logique de la prise de vues, puis du montage direct ou différé, s’inspire soit de la logique du propos (on profite des temps faibles pour déplacer la caméra, on accentue les temps forts en serrant le cadre) soit du projet ou de la lecture du narraur (qui peut fausser ou contredire la logique immanente au propos, en accentuant les défauts, en mettant l’accent sur les contradictions, etc.).

En tous cas, le montage qui peut être réalisé en différé à partir des éléments ainsi filmés, a la possibilité de faire alterner, selon une continuité subjective, un ensemble de prises de vues qui manifestent ainsi à la fois des éléments objectifs (diégétiques) et des éléments subjectifs (narratifs). Ce qui est proposé dès lors au spectateur n’est plus le spectacle d’un événement mais son récit, c’est-à-dire la manifestation du regard et de la logique du narrateur. La continuité du récit se substitue à la continuité de l’événement.

Conclusion

Le récit audiovisuel est le lieu d’une double confrontation entre logique de l’énoncé et logique de l’énonciation d’une part, logique du verbe et logique de l’image d’autre part. C’est ainsi que le sens de ce qui est donné à voir et à entendre au spectateur procède d’une synthèse complexe entre contenu (référentiel) de l’image et du son d’une part, mise en image et commentaire d’autre part.

L’enregistrement et la représentation des entretiens et des débats procède de la même logique et relève des mêmes contraintes. La révélation du dispositif énonciatif permet donc la mise en évidence des tensions, contradictions – voire paradoxes – pragmatiques qui procèdent de la combinaison de logiques hétérogènes ou de partis pris, conscients ou inconscients du narrateur-réalisateur.


Notes

[1] Cet article a été publié dans La mise en scène du discours audiovisuel, l'Harmattan, Jean-Paul Desgoutte, éd. (1999).

[2]  L’utilisation spécifique du mot interview et la pratique même de l’interview sont attachées aux débuts du journalisme moderne tel qu’il a été inventé et mis en œuvre par les Anglo-saxons. Le journaliste est un témoin sans qualité particulière. Il est censé représenter le public le plus large. Les questions qu’il se pose doivent être celles que se poserait tout un chacun à sa place. Ce n’est donc pas un spécialiste. Ce n’est pas non plus, à proprement parler, le représentant d’un groupe ou d’une institution. Il n’a pas d’autre mission avouée que de raconter ce qu’il voit, de dire ce qu’il entend. En ce sens, il n’appartient pas à la scène qu’il décrit mais bien à la mise en scène, au dispositif énonciatif, au canal médiatique. L’interview, à l’instar du roman réaliste, prétend donner accès à la réalité même du référent, hors de toute déformation énonciative.

  « Le réalisme n’est pas seulement un discours aussi particulier et aussi réglé que les autres ; l’une de ses règles a un statut bien particulier : elle a pour effet de dissimuler toute règle et de vous donner l’impression que le dis­cours est en lui-même parfaitement transparent, autant dire inexistant, et que nous avons affaire à du vécu brut, à une "tranche de vie" ». Tzvetan Todorov (1982, p. 9)

Mais de fait l’interview n’est qu’un genre littéraire dont la forme et le destin sont liés au développement des médias de masse. Le journaliste de presse écrite est le premier médiateur à se prétendre libre de toute interprétation de la réalité qu’il décrit. Il donne accès au réel afin de laisser le lecteur libre de ses opinions et de ses jugements. Le dévelop­pement technologique va renforcer cet effet de réel. La radio en restituant les caractéristiques individuelles de la parole, propose en plus du contenu du propos le contexte psychologique affectif tel qu’il se manifeste dans le timbre, l’intensité et l’intonation de la voix. Et l’image de cinéma, puis de télévision, parachève l’effet de réalité en offrant au spectateur le contexte visuel, spatial de l’entretien.

[3] Il tend, autrement dit à effacer le caractère intersubjectif de l’échange. En ce sens, l’interview n’est pas un discours, à peine un échange, mais le lieu et le dispositif (narratif) qui autorisent à l’interviewé la manifestation d’une parole pleine à l’usage d’un public virtuel. La parole est d’abord une pratique du dialogue et le sujet construit son identité linguistique, son JE, à partir des réponses de l’autre, qui sont autant d’images spéculaires de ses propos. C’est en ce sens que l’inconscient se niche dans le discours de l’autre (Lacan, 1966). L’accès au récit, l’accès au monologue suppose une phase ultérieure de construction linguistique où le sujet intériorise son double en se situant lui-même en position de tiers. Le dialogue avec soi-même, qui achève l’image de soi, exige une scission du sujet, car une parole pleine est une parole double, unifiée du point de vue du tiers. C’est là que prend place la talking cure freudienne, tout près de l’interview journalistique en ce sens que le thérapeute offre au patient un lieu d’observation qui ne porte pas sur le contenu référentiel de ses propos mais sur leur cohérence énonciative. L’analyste comme le journaliste socialise la parole du sujet en la confrontant au défilé radical de la mise en scène.

 

[4]   Le développement et la popularisation de l’interview, sous ses multiples formes audiovisuelles, sont liés à deux phénomènes concomitants, d’une part l’essor d’un journalisme attentif à l’individu – à l’homme sans qualités particulières – représentant présumé de l’opinion collective, et d’autre part la sophistication des moyens d’enregistrement et de diffusion du son et de l’image. L’anonymat et le réalisme font là fonction de garanties d’authenticité – ou facilitent plus exactement la reconnaissance et l’identification d’un public, devenu, par le biais de l’audimat, de la consommation et des élections, le véritable producteur des programmes. Le processus de mise en scène permet d’adapter le produit de consommation aux réactions du consommateur et l’interview peut devenir le lieu privilégié d’une mystification, qui fait passer de la forme pour du contenu – le médiateur usant de son privilège d’interprète pour cacher sa mise en forme derrière la prétendue transparence du support. De fait et contrairement à ce qu’il donne à voir, l’écran énonciatif – le dispositif de représentation – implique dans son effort même de transparence une mise en scène de plus en plus sophistiquée.

[5] Sous une forme ou sous une autre, cette question traverse la « narratologie » : « [...] Il nous semble que le découpage ordinaire est un compromis entre trois systèmes d’analyse possible de la réalité :1° une analyse purement logique et descriptive (l’arme du crime près du cadavre) ; 2° une analyse psychologique intérieure au film, c’est-à-dire conforme au point de vue de l’un des protagonistes dans la situation donnée (le verre de lait – peut-être empoisonné – que doit boire Ingrid Bergman dans Notorious ou la bague au doigt de Thérésa Wright dans l’Ombre d’un doute) ; 3° enfin, une analyse psychologique en fonction de l’intérêt du spectateur ; intérêt spontané ou provoqué par le metteur en scène précisément grâce à cette analyse : c’est le bouton de porte tournant à l’insu du criminel qui se croit seul (« attention ! » crieraient les enfants à Guignol que le gendarme va surprendre) ». André Bazin (1981,  pp. 145-146)

[6] On note l’apparition, au début des années quatre-vingt-dix, d’une figure narrative télévisuelle intéressante, qui consiste à introduire dans le champ du locuteur un moniteur révélant l’image de l’allocuteur. Le cadre propre à la fonction impressive du propos est ainsi rendu manifeste. Le contrechamp est inscrit dans le champ, ce qui met en évidence la fonction de subordination.

[7] L’univers réel est continu. Du point de vue du sujet, l’espace réel est explorable dans sa continuité. Le sujet n’a pas la possibilité réelle d’explorer l’espace de façon discontinue ou fragmentaire. La trace de son parcours dans l’espace, sa trajectoire, est continue. Parallèlement, et de même, le temps du sujet est continu, orienté et irréversible. Ajoutons que la conscience d’un espace et d’un temps réel, qui outrepasse et englobe celui reconnu par l’expérience réelle du sujet, procède et présuppose la reconnaissance de l’autre comme double de soi. Je ne partage l’espace que si je reconnais l’autre comme mon identique ou mon double. En reconnaissant l’autre comme mon double, je prends place dans le monde à travers son regard. En acceptant que l’autre puisse exister en dehors de ma présence (hors de mon champ), j’accorde au monde réel une existence objective indépendante de moi. Ce n’est que par un détour imaginaire que je peux accorder au monde une existence réelle. Il en est de même du temps. L’originalité radicale de mon rapport au temps ne peut être partagée. Et si j’accepte de reconnaître l’autre après une absence, c’est parce que j’admets d’une part qu’il possède une temporalité propre, indépendante, identique à la mienne, et que d’autre part nous participons l’un et l’autre d’une même temporalité qui nous outrepasse l’un et l’autre. Nous reconnaissons ainsi trois types de rapports à l’espace et au temps :

·   le rapport individuel perceptif, subjectif, le champ individuel, la trajectoire d’exploration du réel, segment spatio-temporel continu,

·   le rapport à l’autre avec qui je suis en relation, qu’on peut appeler l’espace-contrechamp, en ce qu’il me met en scène du point de vue de l’objet ou de la personne que je regarde. L’autre fait fonction de cadre. Il ouvre un espace imaginaire où je découvre ma propre image,

·   le point de vue d’un tiers abstrait, extérieur à l’événement, au hic et nunc du sujet. Le point de vue du tiers délimite un cadre «narratif» à l’intérieur duquel Je suis présent avec l’autre. Le tiers-narrateur n’intervient pas sur la dynamique du discours, même si par son regard il constitue l’échange en objet, réalisant ce faisant la clôture narrative de l’événement.

[8] « Le discours évolue [...] dans deux dimensions différentes : à côté de ce que dit un énoncé (l’état de choses qu’il représente), il y a ce qu’il montre du fait de son énonciation. Dès lors, il peut y avoir, dans certains cas, une contradiction entre ce qui est dit et ce qui est montré. Les contradictions de ce type, appelées contradictions pragmatiques, doivent être soigneusement distinguées des contradictions logiques qui sont des contradictions internes à ce qui est dit » François Récanati (1979, p. 195).

[9] Chacun garde à l’esprit ces saucissonnages d’interviews d’actualités où quelques plans collés bout à bout restituent l’essentiel d’un discours. Le procédé est légitime en ce sens qu’il ne s’intéresse qu’au contenu du pro­pos, et que, dans le meilleur des cas, il en respecte les unités prosodiques, voire la logique de l’enchaînement. Mais les sautes d’images caracté­ristiques de ce genre de montage révèlent l’« ellipse » narrative.