In die Luft gemalte Zeichen. Mitteilen von Bildern in Gestik und Spiel

Johannes Merkel

Erzählen heißt nicht nur reden, alles Erzählen wird von illustrierenden Gesten und Spieleinlagen untermalt. An jedem Kneipentresen, in jeder Familienrunde oder wo sonst immer erzählt werden mag, wird das dumme Gesicht des Nachbarn vorgemacht, als ein halbwüchsiger Bengel in sein mit laufendem Motor abgestelltes Fahrzeug stieg und vor seiner Nase auf Spritztour ging. Oder wir deuten mit beiden Händen an, wie eng das Kellerfenster war, und führen mit den Schultern vor, wie wir uns hindurchquetschen mussten, als die Kellertür ins Schloss fiel und wir sie von innen nicht mehr öffnen konnten. Zwar wird jeder Erzähler den Tonfall suchen, der ihm am besten von der Zunge geht, und den stimmlichen und körperlichen Ausdruck benutzen, der dem Naturell seiner Lebendigkeit entspricht, und das kann von zurücknehmender Verhaltenheit bis zu expressivem Ausagieren reichen. Aber auch der verhaltene Erzähler teilt sich nicht nur sprachlich mit, wenigstens in der Modulation seiner Stimme oder den Nuancen seines Gesichtsausdrucks bilden sich die Gefühle seiner Helden oder die eigene Sicht auf die Ereignisse ab, von denen er berichtet.

Allerdings drängt ein zahlreicheres Publikum auch den zurückhaltenden Erzähler dazu, sich in größeren und eindrucksvolleren Bewegungen mitzuteilen, um seine Erzählung sichtbar und greifbar zwischen die Zuhörenden zu stellen. Wo öffentliches Erzählen als Beruf ausgeübt wurde, gehörte die Schulung im gestischen und spielerischen Ausdruck zum Programm der Ausbildung, die genauso wie andere Handwerke bei einem anerkannten Meister des Fachs absolviert wurde, wie wir das aus China oder dem Vorderen Orient kennen (Merkel 1988). Auch wenn die professionellen Meistererzähler gestischen und spielerischen Ausdruck oft bis zu artistischer Kunstfertigkeit steigerten, so brachten sie damit doch nur zur Perfektion, was auch schon in jeder bescheidenen Alltagserzählung angelegt ist.

Die dörflichen Märchenerzähler Europas durchliefen zwar keine Lehre, aber sie waren, was man heute als „Halbprofis“ bezeichnen würde, brachten ein gutes „Naturtalent“ mit und vervollkommneten sich bei den vielen Gelegenheiten, in denen sie um eine Erzählung gebeten wurden. Allerdings blieben ihre Darstellungsweisen lange unbeachtet. Die Märchensammler des 19.Jahrhunderts hatten in ihrer literarischen Gelehrsamkeit fast keinen Blick für die theatralischen Effekte der Erzähler, sie suchten der Texte habhaft zu werden, um sie für die Veröffentlichung als Lesestoff zu bearbeiten. Selten genug wurden sie überhaupt Augenzeugen lebendiger Erzähler, wenn sich die Dörfler nach Feierabend in einem Haus zu einer „Erzählgemeinschaft“ zusammenfanden, wenn ein herumziehender Handwerker sich für eine Erzählung das Essen verdiente oder wenn sich die Wanderarbeiter auf dem Weg zur Arbeit die Zeit mit Märchen verkürzten. Im allgemeinen hörten die Sammler Märchen von „Gewährsleuten“, die sich an früher gehörte Erzählungen erinnerten und sie nachzuerzählen versuchten, die naturgemäß nicht über das reiche Ausdrucksrepertoire aktiver Erzähler verfügten und sich auf die sprachliche Wiedergabe konzentrieren mussten. Aus dieser literarischen Rezeption erwuchs das kulturelle Leitbild des im Lehnstuhl ruhenden Großmütterchens, die mit feierlicher Stimme den vor ihr sitzenden Enkeln ein Märchen zu Gehör bringt, wie es von Ludwig Richter gezeichnet wurde und bis heute die landläufige Vorstellung prägt.

Erst im 20.Jahrhundert änderte sich der Blickwinkel, wurden die gestischen und spielerischen Qualitäten der Erzähler beachtet und der Versuch gemacht, in Vor- oder Nachworten einen Eindruck vom Reichtum des erzählenden Ausdrucks zu vermitteln, wie es uns der schwedische Volkskundler Tilhagen in seiner Schilderung von Taikons Erzählkunst vorführt: „Für Taikon, wie für die meisten richtigen Märchenerzähler, ist das Wort nur eins von den Ausdrucksmitteln, mit denen er seine Märchen gestaltet. Er erzählt mit Gesten und mit Modulationen im Tonfall, mit dramatischen Pausen und sprudelndem Wortschwall, mit Pantomimen und feierlichem Predigen, mit Lachen und mit Tränen. In seine Stimme kommt Sonne, wenn er die junge Prinzessin schildert. Fröhliche Bilder spiegeln sich in seinem Auge, und seine Hände formen luftige Tanzrhythmen nach. Und was für ein liebenswerter alter Mann ist doch der König! Die Stimme klingt nach einem Schmunzeln, die Hände streichen durch den eingebildeten Bart, das Auge bekommt einen majestätischen, landesväterlichen Blick, die Bewegungen werden ein wenig greisenhaft und doch würdig“ (Tilhagen 1979, S.168).

Der gestische Ausdruck wird im allgemeinen dort von spielerischen und pantomimischen Einlagen unterbrochen, wo sich die Erzählung zu dramatischen, über Wohl und Wehe des Helden entscheidenden Szenen steigert. Und das macht dann der einheimische Märchenerzähler in einem österreichischen Dorf nicht viel anders als der sein Leben lang in Russland und Skandinavien umherziehende Zigeuner Taikon, der die expressive Lebendigkeit seiner Kultur besaß. „Anfangs sitzt er auf seiner einfachen Bank vor dem Haus, aber auf die Dauer genügen ihm die frischen, weitausholenden Handbewegungen nicht. Sobald er berichtet, wie die Kutsche der Königstochter, bei der der Held zugestiegen ist, sich dem vor dem Höllentore wartenden Teufel nähert, erhebt er sich ruckweise immer mehr von seinem Sitze. Nun sehen die Fahrenden bereits den Teufel, der ihnen entgegenblickt. Der Held veranlasst ihn, eine Prise aus der Schnupftabaksdose zu nehmen, da ist der Teufel festgebannt und kommt erst los, als er die Königstochter freigibt. ‚Versprich, die muss frei sein, du darfst keine Jungfrau mehr nehmen‘, sagt der Held zu ihm, und der Erzähler versetzt sich völlig in seine Lage, als er das berichtet. Im nächsten Augenblick springt er jedoch um und stellt den Teufel dar, wie dieser nur zögernd in die Schnupftabaksdose greift, um durch die zweite Prise wieder frei werden zu können“ (Haiding 1954, S.14f.).

Schließlich können auch greifbare Gegenstände spielerisch benutzt werden, ganz wie das Kinder in ihren Rollenspielen tun. „Während ein Erzähler mehr eidetisch suggeriert, schafft ein anderer den umgebenden Raum zur Welt des Abenteuers um, Werkzeug kann zu einem Zauberrequisit werden, das einem Zuhörer gar – als passiven Mitspieler – anvertraut wird. Bei einem unserer Erzähler, einem jungen sardischen Matrosen, wurde ein Weinglas bald zu einem Schiff, bald zu einem Tier, wobei der Tisch als Bühne diente, über die er seine Lebewesen und Gegenstände laufen oder fahren ließ“ (Karlinger 1973, s.266).

Die doppelte Kodierung mündlicher Rede

Wer erzählt, setzt Gesten und Spiel bewusst ein, um seine Erzählung zu illustrieren. Aber auch im alltäglichen Gespräch macht der gesprochene Text nur die halbe Botschaft aus, die ergänzt, paraphrasiert oder konterkariert wird durch die nonverbalen Mitteilungen, von den sprachbegleitenden Zeichen der Stimmführung über den mimischen Ausdruck des Gesichts, das gestische Spiel der Hände bis zu den Signalen, die über den Körperausdruck, die Körperstellung, über Zuwendung und Abwendung ausgetauscht werden. Sobald wir uns von Angesicht zu Angesicht unterhalten, findet sich jede sprachliche Mitteilung verwoben in einen Teppich nonverbaler Zeichen. Aber diese Zeichen werden kaum bewusst gesetzt, vielmehr unterlaufen sie unser sprachlich ausgerichtetes Bewusstsein und kommentieren unsere Sprachäußerungen auf ihre Weise. Tatsächlich erfordert es eine beträchtliche Schulung, diese verräterischen Hinweise unter Kontrolle zu halten.

Anders das Ausdrucksverhalten der Hände, das in größerer Nähe zur Bewusstseinstätigkeit steht und im allgemeinen der absichtsvollen Verwendung zugänglich bleibt. Handgesten verraten deshalb sehr viel weniger von den versteckten Absichten, Gefühlen oder Einstellungen eines Sprechers, werden kontrollierter gesetzt und stehen der sprachlichen Mitteilung auch insofern näher, als das differenzierte Ausdrucksvermögen der menschlichen Hand eindeutigere Aussagen zu machen erlaubt als andere körperlichen Ausdruckszonen: Mit der Hand lassen sich spontan verständliche Bilder in die Luft malen, und es ist diese Fähigkeit, die berechtigt, sie als „Geste“ von anderen Formen körperlichen Ausdrucks abzuheben. Gestik in diesem Sinne ist allerdings nicht ausschließlich auf Handbewegungen beschränkt, auch Gesicht, Füße, Kopf oder Schultern können Zeichen schreiben, wo ihre Bewegungen die darstellende Form annehmen, die eine unwillkürliche Ausdrucksbewegung, eine „Gebärde“, in eine bewusste Geste verwandelt.

Ich spreche von den Gesten, die als „bildhaft“, „expressiv“ oder „ikonisch“ bezeichnet werden. Neben ihnen gibt es aber auch sozusagen neutrale sprachbegleitende Handbewegungen, die McNeill als beats klassifiziert. Sie dienen dazu, den Sprachfluss zu unterstreichen, erfolgen also in den rhythmischen Intervallen des gesprochenen „Textes“ oder markieren, wie ich auch sagen könnte, Punkte, Absätze und zentrale Aussagen. Schließlich sind bei Erklärungen, Vorträgen und ähnlich unanschaulichen Reden sogenannte „metaphorische“ Gesten beliebt, um die abstrakte Rede zu beleben. Ich sage dann zum Beispiel: „Lasst uns nun die Ergebnisse der Diskussion zusammentragen“, und dazu führe ich meine beiden hohl geformten Hände in der Mitte vor meinem Körper zusammen, als würde ich die gedachten Resultate in zwei Körben sammeln und zusammenbringen. Die gleiche Handbewegung würde zu einer „ikonischen“ Geste, sobald ich damit vorzuführen versuche, wie mir die Dame des Hauses zwei Obstschalen zur Auswahl des Nachtischs reichte, die Geste also eine konkrete Handlung nachstellen würde. „Nach unserer Definition ist eine ikonische Geste eine geformte Handbewegung, die in ihrer Form oder der Art ihrer Ausführung Aspekte des Ereignisses oder der Situation abbildet, die sprachlich beschrieben werden“ (McNeill/ Levy 1982, S.275). Zu ergänzen wären diese Unterscheidungen noch durch die „konventionellen“ Gesten, die nicht individuell und spontan im Redefluss gebildet werden, sondern eine sozial verbindliche Bedeutung haben: Nicht zufällig setzen wir sie besonders gerne dort ein, wo uns die Sprache wegbleibt, beim Zeigen des Vogels etwa oder wenn mit einer Handbewegung angedeutet werden soll, was auszusprechen zu peinlich wäre.

Sprachbegleitende Gestik ist mehr als ein beliebiges Beiwerk der gesprochenen Sprache. In verschiedenen Versuchen konnte nachgewiesen werden, dass von Gesten begleitetes Reden die Merkbarkeit und Gedächtnisspeicherung sprachlicher Äußerungen verbessert. „Berger und Popelka fanden, dass die Genauigkeit beim Niederschreiben gesprochener Sätze sich erhöhte, wenn sie mit begleitender Gestik geäußert wurden“ (Kendon 1983, S.29). Ähnliche Ergebnisse zeitigte ein Versuch, in dem komplexe geometrische Figuren nach mündlicher sprachlicher Beschreibung gezeichnet werden sollten: Sprachbegleitende Gestik ergab genauere Zeichnungen. Schließlich konnten sich Versuchspersonen sowohl Wortlisten als auch Geschichten besser merken, wenn sie von „physiographischen“ Gesten begleitet wurden (Kendon 1983, S.29). In einem weiteren Versuch berichteten viele Versuchspersonen, „dass durch die Gesten visuelle Bilder hervorgerufen wurden“ (Riseborough 1981, S.182). Es steht zu vermuten, dass sich die Gedächtnisleistung verbesserte, weil die bildliche Vorstellungsfähigkeit der Angesprochenen angeregt wurde.

Diese Vermutung lässt sich von anderer Seite erhärten, denn die Gedächtnisleistung steigt in vergleichbarer Weise, wenn man sprachliche Aussagen zusammen mit ihren gegenständlichen Abbildungen präsentiert. Allan Pavio konnte mit einer ganzen Reihe von Experimenten nachweisen, dass sich die Wiedergabe bei allen Testaufgaben, die die innere Vorstellung aktivierten, entweder durch Betrachtung begleitender Bilder oder der Aufforderung, sich den Gegenstand innerlich vorzustellen, wesentlich gegenüber jenen verbesserte, die nur den Klang des Wortes präsentierten und ihn innerlich zu wiederholen vorschrieben. Er zieht daraus den Schluss, Verständnis, Speicherung und Wiedergabe sprachlicher Äußerungen liefen gleichzeitig über ein linguistisches und ein imaginatives System, die in ständiger Wechselwirkung stünden. „Die wichtigste theoretische Annahme ist, dass Sprache eng mit zwei grundlegenden Kodierungssystemen oder kognitiven Verfahren verknüpft ist. Das eine Verfahren ist unmittelbar mit dem eigentlichen Sprechen verbunden; das heißt, wir können in verbalen Konzepten und ihren Beziehungen denken, und diese impliziten verbalen Prozesse können unser Sprachverhalten vermitteln. Der andere Kode ist nonverbal und vermutlich eng an die persönliche Wahrnehmung gebunden, die wir Vorstellung (imagery) nennen. Wenn ich also zu Ihnen sage: ‚Der rothaarige Junge schält eine grüne Orange‘, scheint es wahrscheinlich, dass Ihr Satzverständnis irgendeine Art mentalen Bildes des Jungen und der Orange einschließt, zusammen mit den dazugehörigen Aktivitäten des Orangeschälens, und eben nicht nur die stille Wiederholung allein der Worte. Der sprachliche sprang in einen nonverbalen Kode über, und wenn ich Sie jetzt bitte, sich an den Satz zu erinnern, werden Sie sich an die Gegenstände und Handlungen erinnern, die im Bild enthalten sind, und den Satz nach ihnen konstruieren. Da Input und Output des Satzes verbal erfolgen, muss, wenn diese Annahme zutrifft, eine rasche Verwandlung in den nonverbalen Kode und danach zurück in den verbalen erfolgen“ (Paivio 1991, S.107).

Während sprachliche Sätze „sequentiell“ aufgebaut sind, sich also in zeitlicher Aufeinanderfolge von Lautzeichen realisieren, können die Bestandteile bildlicher Vorstellungen relativ gleichzeitig erfasst werden, die Wahrnehmung von Bildvorstellungen erfolgte in Paivios Versuchen messbar schneller als die Entschlüsselung sprachlicher Zeichen. Allerdings mit der aufschlussreichen Einschränkung, dass bei sprachlichen Äußerungen, die sich auf sehr konkrete Sachverhalte bezogen, „Bildwahrnehmung und Sprachverständnis in vergleichbarer Geschwindigkeit erfolgen können“ (Paivio 1991, S.119). Hier konnte offensichtlich die Rückverwandlung vom Bild zum Wort sehr rasch geleistet werden.

In einem ganz ähnlichen Verhältnis scheinen sprachliche Mitteilungen und gestische Darstellung zu stehen. David McNeill hat das Auftreten sprachillustrierender Gesten mit den entsprechenden sprachlichen Äußerungen verglichen und festgestellt, dass die Geste immer schon vorführt, wozu die Sprache erst ansetzt. Er schließt daraus, dass beide gleichzeitig im Prozess der inneren Generierung entstehen, die aus einer Bildvorstellung hervorgehende Geste aber rascher erzeugt werden kann als die begleitende Sprachäußerung. „Beim Sprechen sind die inhaltlichen Konzepte bezeichnenderweise in Worte und Sätze unterteilt, und sie werden grammatischen Regeln folgend über die Zeitspanne des gesprochenen Satzes verteilt. Bei einer ikonischen Geste jedoch kann alles, was dargestellt wird, auf einmal dargestellt werden. Die Geste mag Zeit zu ihrer Ausführung benötigen, ihr ganzer Ausdruck erfolgt aber gleichzeitig – ohne Segmentierung der Bedeutung und Verteilung der Segmente in Zeiteinheiten“ (McNeill 1986, S.109).

Anhand von kindlichen Erzählungen konnte er feststellen, dass die von Gesten begleiteten Sprachäußerungen die neuartigen sprachlichen Elemente enthielten. Dazu ein bezeichnendes Beispiel, das von Anansi handelt, der in westafrikanischen Erzählungen beheimateten, merkwürdig menschlichen und wenig heldenhaften Spinne, die voll Rücksicht und Liebe agieren und doch im nächsten Moment sich schon wieder rücksichtslos und verfressen gegen die eigenen Artverwandten vergehen kann. In dieser Geschichte hat Anansi sich versteckt und wird von den zahllosen Söhnen gesucht. Der Erzähler hat die Geschichte in einer gefilmten Version gesehen und erzählt sie nach. „Und sie wünschten hinzukommen, wo Anansi war“, lautet die kurze Textpassage. Dazu hält der Erzähler beide Hände vor sich hin, so dass sie sich gegenüberstehen. „Zwei Hände erscheinen in der Geste, und zwei Teilnehmer werden im Satz genannt“ (McNeill 1985, S.369). Die rechte, die suchenden Söhne verkörpernde Hand werde zum inhaltlichen Bezugspunkt des Satzes, befinde sich deshalb in ständiger Bewegung und illustriere damit den ersten Halbsatz. Die linke verhalte sich ruhig und repräsentiere den im zweiten Halbsatz genannten Anansi in seinem Versteck. Die Geste, die im Prinzip bereits die ganze Botschaft enthält, erscheint aber mit dem Einsetzen der Sprachäußerung.

Das Zusammenwirken von bildlicher Vorstellung und sprachlicher Formulierung erinnert an die Arbeitsteilung unserer Gehirnhälften, nach der bei der großen Mehrzahl der Menschen die rechte Gehirnhälfte schwerpunktmäßig bildhafte und räumliche Vorgänge verarbeitet, sich in der linken dagegen die Sprachzentren und das sprachlich strukturierte logische Denken lokalisieren. Die Arbeitsteilung ist aber weder so festgelegt, wie es die verbreitete Berufung auf die „Hemissphärendichotomie“ glauben machen möchte, noch operieren sie voneinander unabhängig: Über das breite Band des „Corpus Callosum“ wechseln unzählige Information zwischen beiden Hemisphären hin und her, und das gilt auch für die Vorgänge, die bei der Bildung sprachlicher Äußerungen ablaufen. Man darf deshalb mit Paivio davon ausgehen, dass beide Kodierungssysteme prinzipiell bei jeder Sprachäußerung im Spiel sind, das Ausmaß vorstellungsmäßiger Speicherung aber je nach der thematischen Ausrichtung der Äußerungen unterschiedlich ausfallen wird, und bei abstrakten Feststellungen sogar ganz unterbleibt. „Im Falle konkreter Aussagen wie etwa ‚Der Junge schlug das Mädchen‘ herrscht die Bildvorstellung vor. Bei abstraktem Material wie ‚Die Theorie besitzt prädikativen Wert‘ dürfte die Aussage wahrscheinlich nur in ihrer sprachlichen Form gespeichert werden“ (Paivio 1991, S.122). Bemerkenswert bleibt aber, dass auch abstrakt-logisches Diskutieren noch vom Rhythmus tanzender Hände in Gang gehalten werden will, und gerade auch der Vortragsredner versucht, seine abstrakten Darlegungen mit metaphorischen Gesten anzureichern, also sozusagen mit gestischen Bildvergleichen zu beleben und damit dem Zuhörer das Mitdenken zu erleichtern. Wie auch immer die Verteilung dieser beiden Komponenten bei den verschiedenen Sprechweisen ausfallen mag, insgesamt kann „als Argument herausgestellt werden, dass Gesten eine Stufe tief innen im Prozess des Sprechens enthüllen. Auf dieser Stufe werden zwei Formen des Denkens koordiniert: eine bildhafte Denkweise (die global und synthetisch ist) und eine syntaktische (die linear und segmentiert ist)“ (McNeill 1985, S.370).

Zum Verhältnis von Gestik und Spiel

Erzählendes Reden berichtet von menschlichen Handlungen, ihren Verwicklungen und ihrem Ergebnis, von Vorgängen also, die von anschaulicher Gegenständlichkeit sind und deshalb den Erzähler anhalten, „ein visuelles Bild des Schauplatzes der Geschichte zusammen mit ihren hervorstechenden Bestandteilen zu bilden, und ausgehend von der organisierten, thematischen Vorstellung den sprachlichen Inhalt zu rekonstruieren“ (Paivio 1991, S.123). Erzählendes Sprechen wird deshalb nach vermehrter gestischer Darstellung verlangen.

Das Verfahren, mit dem McNeill das sprachbegleitende gestische Verhalten zu erforschen suchte, bestand darin, kurze Comicfilme zu zeigen, sie danach von Versuchspersonen vor Zuhörern, die die Filme nicht kannten, nacherzählen zu lassen und diese Nacherzählungen auf Video aufzunehmen. Für die Auswertung wurden die Äußerungen in Anlehnung an Labov und Waletzki in „narrative“ und „extranarrative“ Teilsätze aufgetrennt, also solche, die Handlungen wiedergaben, und solche, die eher kommentierende Bemerkungen beinhalteten. Es erwies sich, „dass narrative Äußerungen tendenziell von ikonischen Gesten, während nicht erzählende Äußerungen von formloseren Gesten oder beats begleitet werden“ (McNeill/Levy 1982, S.280). Dabei handelte es sich allerdings nur um kurze Nacherzählungen, für die sich die Zuhörer nicht allzu lang aus ihrer gelebten Gegenwart entfernen mussten. Längere erzählende Passagen, die die Vorstellungsfähigkeit der Zuhörer stärker beanspruchen, würden noch stärker von abbildenden Gesten durchsetzt.

Denn nicht nur die Anschaulichkeit der geschilderten Vorgänge drängt den Erzähler, seine Rede zu illustrieren, dazu zwingt ihn vor allem auch die zeitliche und örtliche Ferne des Erzählten: Gespräche, Unterhaltungen, Vorträge, alle jene „operationalen“ Sprachäußerungen, mit denen wir uns mit den Mitmenschen verständigen und auf sie einzuwirken suchen, spielen sich im gegenwärtigen, sichtbaren, hörbaren und greifbaren Umfeld ab, der „Kontext“ der Rede bleibt also allen Teilnehmern vertraut und zugänglich. Wer zu erzählen beginnt, entführt sein Publikum aus dem Hier und Jetzt der Rede an jenen Ort und in jene Zeit, in der sich seine Geschichte abspielt. Er muss sicherstellen, dass sie ihm mit ihrer Vorstellung dorthin folgen, dass für den Zeitraum seiner Erzählung die Allgegenwart der laufenden Sinneswahrnehmung verblasst und die innere Vorstellung jener Erzählräume die Oberhand gewinnt. Er muss also daran interessiert sein, die Vorstellungskraft seiner Zuhörer zu stützen und anzuregen, insbesondere an den Angelpunkten der Erzählung und in jenen Passagen, wo die Glaubwürdigkeit des Erzählten in Frage steht, die Phantasie der Zuhörer deshalb besonders gefordert ist: den unwahrscheinlichen und phantastischen Ereignissen. Sie markieren zugleich die Passagen, in denen die gestische Illustrierung zunimmt.

Alle abbildende Gestik aber erweist sich bei genauerer Betrachtung als zeichenhaft verkürztes Spiel. Die Aktivität der dargestellten Person, die der Schauspieler mit dem ganzen Körper vorführt, verkürzt sich auf die Körperbereiche, die stellvertretend für die gesamte Person in Aktion treten. Wenn beispielsweise der Held mit dem Fuß zutritt, kann ich als Erzähler dies auch mit der Hand vorführen, benutze also eine isolierte und reduzierte Bewegung, um damit stellvertretend die Handlung des ganzen Menschen darzustellen, und ich tue das im allgemeinen auf der reduzierten Kleinbühne etwa eines Halbkreises vor dem Körper. Im Gegensatz dazu hat der Schauspieler den ganzen Menschen zu repräsentieren, und dafür steht ihm ein ausgedehnter Bühnenraum zur Verfügung. Die Zeichenhaftigkeit zeigt sich auch daran, dass die Geste sich aus dem fortlaufenden Fluss darstellenden Spielens ausgrenzt. Ist die eine Geste abgeschlossen, wandern die Hände in die Ausgangsstellung zurück, um dann wieder in eine neue Geste zu starten, wie das Videobeobachtungen zeigen. Es werden also klar abgesetzte Zeichen gesetzt. Die Zeichenhaftigkeit erlaubt, ständig die Darstellungsebenen zu wechseln: Die Hand, die eben noch den zutretenden Fuß bezeichnete, beschreibt im nächsten Augenblick schon die Wucht der gegen die Felsen klatschenden Brandung usw., während auf der Schauspielbühne der symbolisch gesetzte Spielraum über eine Szene hinweg erhalten bleibt.

Die Herkunft der abbildenden Geste erlaubt es dem Erzähler, die zeichenhaft verkürzten Gesten bruchlos wieder zum ausgeführten Spiel zu erweitern, wo es die Dramatik der Ereignisse gebietet oder wo die Vorstellung des Publikums eine verlässlichere Stütze benötigt. Darum springt auch der österreichische Märchenerzähler von seinem Hocker auf, sobald der Teufel auftritt, und versucht uns nun spielend zu vergewissern, dass es so und nicht anders gewesen sein kann. Aber auch die Spielweise des Erzählers hat wenig mit dem Bühnenspiel gemein und erinnert nicht zufällig an die sprunghafte und andeutende Darstellung kindlicher Rollenspieler. Während der Schauspieler, solange der Fiktionsraum der Aufführung erhalten bleibt, eine einheitliche Rolle verkörpert, spielt der Erzähler seine laufend wechselnden Rollen nur an, und tut das auch nur dort, wo es im Geflecht der Erzählung geboten erscheint. Und auch wo er „Requisiten“ verwendet, indem er Gegenstände in sein Spiel einbezieht, benutzt er nicht Nachbildungen der gemeinten Gegenstände, sondern gebraucht die Gegenstände seiner Umgebung in symbolischer Stellvertretung , ganz im Stil rollenspielender Kinder.

Der Wechsel von der gestischen zur spielerischen Wiedergabe liegt nahe, erfüllen sie doch im Geflecht der Erzählung beide den gleichen Zweck, die Vorstellungsfähigkeit des Zuhörers zu unterstützen. An jedem Punkt seiner Vorführung wählt der Erzähler den passenden Grad der szenischen Ausführung aus: vom ruhigen Sprechen ohne spielerische Versinnlichung über den mimischen Ausdruck oder wieder eine Stufe weiter die gestische Verlebendigung von Handlungen und Geschehnissen, die mit stellvertretenden Spielgegenständen oder den leeren Händen ausgeführt werden, bis hin zur szenischen Darstellung, die mit den Mitteln des Einmanntheaters bestritten wird. In dieser Palette nehmen die illustrierenden Gesten eine mittlere Position ein und verkörpern wegen ihrer einfachen Einfügung in den Erzählfluss das häufigste und wichtigste Darstellungsmittel des Erzählers: Sie befinden sich sozusagen auf halben Wege zwischen der willkürlichen sprachlichen Bezeichnung und der sinnlichen Verlebendigung darstellenden Spiels.

Zur Entwicklung kindlicher Gestik

Dass illustrierende Gesten auf verkürzte Spielhandlungen zurückgehen, zeigen auch die frühesten Formen kindlicher Gestik, die nach dem Auftauchen der ersten Spiele und in einem Alter zu beobachten sind, in dem sich die Kinder sprachlich noch kaum ausdrücken können. Sie versuchen sich in dieser Phase über gestische Darstellungen mitzuteilen und können dabei auf die Erfahrungen zurückgreifen, die sie bereits mit den festgelegten konventionellen Gesten, etwa des Zeigens oder Greifens, gemacht haben. Diese abgeschliffenen gestischen Zeichen werden jetzt ergänzt durch eigene spielerische Gesten, die bildliche Vorstellungen in stellvertretende körperliche Bewegungen „übersetzen“. „Zum Beispiel blies Guillaumes drei Jahre alte Tochter beim Erwähnen einer großen Orange ihre Backen auf, um die volle und runde Form der Frucht darzustellen“ (Werner/Kaplan 1984, S.89). Es sind Spielgesten, die aus dem Spiel gelöst zur Mitteilung eingesetzt werden.

Interessanterweise findet die Übertragung spielerischer Darstellungen auf die Verständigung kaum Vorbilder im Verhalten der Bezugspersonen: „Außer in den Spielsequenzen konnten diese mimetischen Gesten, wie wir fanden, auch verwendet werden, um Fragen zu stellen (z.B. beim Wunsch, ein Gefäß zu öffnen) oder beim Ansehen von Bilderbüchern das Gesehene zu kennzeichnen. Während unserer Beobachtungen sahen wir niemals eine Mutter darstellende Gesten in dieser instrumentellen Absicht benutzen“ (Zinober/Martlew 1985, s.201). Am Anfang der Beobachtungszeit im Alter von 10 Monaten tauchten solche Gesten noch selten auf, traten dann aber bis zum Alter von 18 Monaten immer häufiger in Erscheinung und gingen danach wieder rasch zurück, was sich wohl ohne weiteres mit der wachsenden Sprachbeherrschung erklärt, die den Einsatz von Spielgesten zur alltäglichen Verständigung überflüssig macht.

Aber nicht die gestische Mitteilung verschwindet, sondern ihr instrumenteller Gebrauch. Bereits bei den genannten Beobachtungen verwendeten die Kinder Gesten stärker beim Betrachten von Bilderbüchern oder beim Erinnern an Ereignisse des vergangenen Tages, in Äußerungen also, die sich auf Vorstellungen bezogen. Wenn mit der Ausbildung erzählenden Sprechens dann auch Erinnerungen und Phantasien mitgeteilt werden können, werden Gesten vor allem benutzt, um die inneren Bilder weiterzugeben.

Die Weise, wie Kinder beim Erzählen illustrierende Gesten benutzen, unterscheidet sich aber zunächst vom gestischen Stil der Erwachsenen. Indem McNeill kindliche Gestik nach der gleichen Versuchsanordnung untersuchte, konnte er gestisches Verhalten von Kindern und Erwachsenen miteinander vergleichen, und kam zu Feststellungen, die einiges Licht sowohl auf die Herkunft bildhafter Gesten wie auf deren Handhabung in kindlichen Erzählungen werfen. „Die ikonischen Gesten von Erwachsenen beinhalten normalerweise drei unterschiedliche Phasen – die Vorbereitung, in der die Hand in die Ausgangsposition geht, um die ikonische Bewegung auszuführen; die ikonische Bewegung selbst (also den Teil, der allein die Bedeutung trägt); und die Zurücknahme, bei der die Hand sich aus der Geste zurückzieht. Aufeinanderfolgende Gesten überschneiden sich nicht, will heißen, dass keine Phase der nächsten Geste einsetzt, ehe wenigstens die eigentliche ikonische Phase der vorherigen Geste abgeschlossen ist“ (McNeill 1986, S.113). Demgegenüber verschwammen die kindlichen Gesten, gingen oft ineinander über und waren weniger klar an feste Abschnitte der gesprochenen Äußerungen gebunden. Oft illustrierten nicht nur eine, sondern mehrere Gesten dieselbe Aussage: Noch waren sie nicht zu abgegrenzten bildhaften Zeichen geronnen. Die Überschneidungen und die etwas diffuse Ausführung dürften darauf zurückgehen, dass Kinder noch stärker dem Spielen verhaftet sind, die kurze sprachbegleitende Bewegung dafür aber nicht genügend Raum lässt.

Die Nähe zu rollenspielartiger Darstellung zeigte sich auch im kindlichen Gebrauch des gestischen Raums. Normalerweise verkürzt die gestische Darstellung Handlungen auf stellvertretende zeichenhafte Bewegungen, wo die spielerische Ausgestaltung in den Raum ausgreifen würde: Wenn die erzählende Gestik die ängstliche Gehweise des Helden im Sitzen vormacht, indem sie zögernd eine ausgestreckte Hand vor die andere setzt, würde der Spieler aufstehen und die zögerlichen Schritte einige Meter lang vorführen. Kinder dagegen bleiben dem Spiel verpflichtet und „ziehen es vor, Gesten des Laufens nicht mit den Händen, sondern mit ihren Füssen auszuführen, und ikonische Gesten, die auch den Kopf und die Füße einbeziehen, sind bei kleinen Kindern weit verbreiteter als bei Erwachsenen“ (McNeill 1985, S.364).

Der Bewegungsraum erwachsener Gestik umfasst einen Halbkreis vor dem Körper, etwa von der Hüfte aufwärts mit einem Zentrum in der Mitte der Reichweite der Hände. Es ist, als ob auf eine Fläche vor dem Oberkörper gezeichnet würde. „Selten oder niemals wird diese Fläche überschritten“ (McNeill 1986, S.118). Demgegenüber griffen die kindlichen Gesten in den gesamten Raum aus, der ihren Händen zugänglich blieb: Die Arme bewegten sich auch über die Schulter hinter den Körper und tendierten dazu, den ganzen Körper in die Ausführung einer Geste einzubeziehen. Die Kinder agierten, als bewegten sie sich selbst in den beschriebenen Situationen. Im allgemeinen fünf bis sieben Jahren alt, handelte es sich sicher um erfahrene Rollenspieler, und sie neigten darum auch in ihrem gestischen Ausdruck mehr zum spielerischen Ausgestalten. „Der ganze Körper und alle seine wichtigen Teile führen die Bewegungen der Spielfigur vor, deren Handlungen beschrieben werden sollen. Die Körperteile der Spielfigur werden tendenziell von den entsprechenden des Kindes ausgeführt (…..), die Gesten sind groß wie bei den wirklichen Handlungen und der gestische Raum hat seinen Mittelpunkt im Kind, als ob es real handelte“ (McNeill 1985, S.364). Abzulesen ist diese noch dem Spiel verhaftete Darstellung bezeichnenderweise auch an der Führung der Hände. Kinder stellen damit vorwiegend Handlungen dar, die Hände tatsächlich ausführen können, zum Beispiel ein Glas halten oder die Augen beschatten und dergleichen. Die Hände werden von jüngeren Kindern noch nicht in übertragener Bedeutung benutzt, um etwa die überraschende Form eines nach oben sich verengenden Glases nachzuzeichen, oder eine Landschaft mit ihren langgezogenen Hügeln zu beschreiben.

Wann sich die rollenspielartigen Darstellungen zu gestischen Zeichen abschleifen, ist aus den Arbeiten McNeills nicht zu erschließen. Es ist aber zu vermuten, dass sich ihre gestische Sprache mit der in den ersten Grundschuljahren rasch wachsenden Erzählfähigkeit an die der Erwachsenen angleicht, und diese Entwicklung dürfte bis zum Zeitpunkt, bis zu dem die narrativen Strukturen vollständig übernommen sind, grob gesehen um das zwölfte Lebensjahr herum abgeschlossen sein.

Eine weitere aufschlussreiche Feststellung ist noch nachzutragen: Das späte Auftreten regelmäßiger rhythmischer Handbewegungen, der sogenannten beats. „Obwohl beats sehr wenig Kontrolle über die Weise ihrer Bewegung verlangen, fehlen sie im gestischen Auftreten von sehr jungen Kindern“ (McNeill 1985, S.365). McNeill sieht das darin begründet, dass sich hier die Hand am weitesten von ihrer ursprünglichen Funktion des Einwirkens auf Gegenstände entfernt, sozusagen nur noch in gegenstandsloser „abstrakter“ Weise bewegt wird, um den Fluss des Gesprochenen in größere und kleinere Einheiten zu gliedern. Aber auch diese abgelösten Handbewegungen dienen noch dazu, den sprachlichen Redefluss zu versinnlichen, indem sie dem Gesagten Nachdruck verleihen und es hervorheben.

Zur Rolle der Bildvorstellung beim Erzeugen des Erzähltextes

Die gestischen Ausdrucksweisen von Kindern weisen darauf zurück, was Gesten ihrem Ursprung nach sind und wie sie entstehen: Zeichenhaft verkürzte Spielhandlungen. Das ausagierende Rollenspiel jüngerer Kinder beginnt sich im „Erzählalter“ der Grundschulzeit zu zeichenhaften Gesten abzuschleifen. Alles Spielen aber, so zufällig und flüchtig es in seinen ersten Anfängen auch sein mag, setzt eine innere Vorstellung voraus, die in symbolischer Übertragung darstellbar und dadurch mitteilbar wird. Mit wachsender Spielfähigkeit verdichten sich die Vorstellungen, die vereinzelten Spielakte verlieren ihre Statik, verbinden sich zu Handlungsfolgen, die ihre sozialen Vorlagen bald hinter sich lassen und sich phantastischen Einfällen öffnen. Beim Spielen stehen die fortlaufenden inneren Bildvorstellungen in ständiger Wechselwirkung mit der Spieltätigkeit, Vorstellungen erzeugen neue Spielweisen und gegenständliche Spielweisen erzeugen neue Vorstellungen. Es entsteht die offene „kreative“ Spielatmosphäre, deren Ergebnis nicht vorauszusagen ist. Die Notwendigkeit der gegenseitigen Abstimmung im Rollenspiel zwingt jedoch dazu, verbindlichere Muster zu beachten, das Spiel organisiert sich zunehmend in narrativen Strukturen: Die Vorstellungsbilder werden zusammenhängender und bestimmen immer ausschließlicher die Spielhandlungen. Im eigentlichen „Erzählalter“ der ersten Schuljahre gehen die ausagierten Phantasiespiele zurück, Erzählen nimmt immer mehr ihren Platz ein als aktives sprachliches Ausphantasieren von Geschichten oder Erlebnissen. Beim Erzählen verkürzen sich die Spielhandlungen zu stellvertretenden Zeichen, erfüllen aber den gleichen Zweck wie im ausgeführten Rollenspiel: Sie zeichnen innere Bildwahrnehmungen nach und erzeugen im Betrachter den Erzähltext begleitende Bilder. Zeichenhafte Gesten ermöglichen also, Bildvorstellungen in eine mitteilbare Formsprache zu setzen und damit die sprachliche Information um eine bildliche und imaginative zu ergänzen, die dem Erzähler erlaubt, die Vorstellungsfähigkeit seines Publikums zu aktivieren, um es desto wirksamer in die ferne Welt seiner Erzählung zu verwickeln.

Folgt man allerdings den linguistischen Modellen mündlichen Erzählens, dann sucht man vergebens nach der Ebene gestischer Mitteilung. Nach diesen Konzepten speichert und reproduziert der Erzähler seine Geschichte, indem er einmal ein Strukturschema benutzt, von dem im folgenden Kapitel die Rede sein wird, und indem er andererseits in der durch das Schema vorgegebenen Ordnung die Handlungsweisen seiner Figuren in sprachlichen Konzepten festhält, ich könnte vereinfachend sagen in Stichworten. In dem Modell, das sie für das Erzählen in Gesprächen aufstellte, spricht Uta Quasthoff von einer „kognitiven Geschichte“ (Quasthoff 1980). Sie ist in den Begriffen der Transformationsgrammatik als sprachliche „Tiefenstruktur“ gedacht, die im Moment des Erzählens in die „Oberflächenstruktur“ des tatsächlich geäußerten Wortlauts zu überführen ist. Bei dieser Transformation habe der Erzähler zahlreiche Faktoren zu berücksichtigen, die Signale seiner Zuhörer etwa, die Verknüpfung mit dem Gespräch, in das die Erzählung eingebettet ist, die von ihm verfolgten Kommunikationsziele und dergleichen mehr. Für die Form der sprachlichen Gestaltung stünden ihm jeweils unterschiedliche Grade der szenischen Ausführung zur Auswahl, vom kurzen berichtenden Satz bis zur dramatisierten dialogischen Rede, aus denen sich der Erzähler den geeigneten Grad sprachlicher Realisierung auswähle. Die Beschreibung sieht also für die „Generierung“ konversationeller Erzählungen nur verbale Prozesse vor. Die offensichtliche Tatsache, dass Erzähler ihre Geschichten gestisch und spielerisch ausgestalten, geht in das theoretische Modell nicht ein, noch geraten bei der Herstellung, Speicherung oder Wiedergabe von Erzählungen bildhafte Vorstellungen in den Blick.

Ich möchte demgegenüber ein verändertes Modell vorschlagen, wie Erzählungen aufgenommen, gespeichert und wiedergegeben werden. Ich gehe davon aus, dass sie sich als Folge bildhafter Vorstellungen einprägen und dass es vor allem dieser „innere Film“ ist, an dem entlang der Erzähler den Erzähltext bildet, den er sozusagen abtastet, dabei die anschaulich gespeicherten Handlungen versprachlicht und sie mit bildbeschreibenden Gesten illustriert. Das imaginierende Abrufen der Geschichte durch den Erzähler stößt aber rasch an eine Grenze, und auch darin trägt der Vergleich mit dem Film: Filmhandlungen sind, zumindest dort, wo Filme erzählen, nicht allein von einer immanenten Bildlogik gesteuert. Die Bilder tragen nur so weit, wie die einzelne Handlungssituation reicht, oder in der Sprache des Films bis zum Ende der Sequenz, an der der Filmer eine Zäsur macht und zu einer neuen Sequenz ansetzt. Diese Verknüpfung ist über die Bildwahrnehmung nicht mehr zu leisten, beim Film sieht das Drehbuch den Wechsel der Sequenz vor, der Erzähler benutzt die Handlungsabschnitte verknüpfende „Stichworte“, deren Anordnung dem abstrakten, bildlich nicht erfassbaren Strukturschema folgt, das uns im nächsten Kapitel beschäftigen wird. Innerhalb einer Szene oder Sequenz kann ich mich darauf beschränken, Bildvorstellungen nachzuerzählen, die Verknüpfung mit der nächsten Szene leisten verbale Konzepte, sprachlich operierende Merkzeichen, die die Schauplätze und Handlungen der Erzählung miteinander verbinden und die Bildfolge der folgenden Sequenz aufschließen, die ich nun wiederum bis zum nächsten Knotenpunkt versprachlichen und gestisch verbildlichen kann. Die Bildelemente werden im Akt des Erzählens in gestischen Zeichen kodiert, die erlauben, sie in den Fluss der sprachlichen Zeichen einzugliedern, und die den „Zuhörer“ anregen, sich eigene Bilder auszumalen.

Auf die weitergehende Frage, wie sich diese Prozesse im menschlichen Gehirn abspielen, werden wir allerdings nur andeutende Antworten erhalten. Trotz aller Fortschritte der neurologischen Gehirnforschung bleiben die Wege des menschlichen Denkens noch immer recht geheimnisvoll, und es ist uns auch kaum möglich, das Zusammenwirken von bildhafter Vorstellung und sprachlicher Bezeichnung in seiner Komplexität und Verflechtung nachzuvollziehen. Wir können sie uns nur in modellhaften Annäherungen zu vergegenwärtigen suchen. In einer sicher zu groben Vereinfachung kann man sich die sprachlichen Konzepte wie Etiketten vorstellen, an die sich Reihen bildhafter Vorstellungen knüpfen und die verfügbar werden, sobald das Etikett aufgerufen ist. In dieser vereinfachenden Annäherung würden dann über eine festgelegte Folge sprachlicher Konzepte jeweils die ihnen zugeordneten Bildelemente aufgeschlossen, die in der Vorstellung des Erzählers auftauchenden Bildfolgen würden im Prozess des Erzählens in sprachliche und gestische Zeichen kodiert und vom Adressaten seinerseits in eigene Bildvorstellungen und sie strukturierende linguistische Konzepte „zurückübersetzt“. So behelfsmäßig diese Beschreibung auch ausfallen mag, hat sie doch den Vorteil, dass sie die zentrale Bedeutung der bildlichen Imagination im Prozess der Verarbeitung mündlicher Erzählungen berücksichtigt. Solange man sich ausschließlich auf textlinguistische Prozesse bezieht, scheint mir die Wiedergabe einer Erzählung weder auf der „Textoberfläche“ noch in der kognitiven „Tiefenstruktur“ angemessen verstehbar.

Gestisches Erzählen und Filmsprache

Mit dem Wechselspiel von sprachlichem Text und gestischer Veranschaulichung steht die mündliche Erzählung den Bild und Sprache kombinierenden audiovisuellen Medien näher als dem schriftlichen, nur auf einen sprachlichen Text beschränkten Erzählen. Mündliches Erzählen verfährt seiner Form nach audiovisuell, seit Menschen sich Mythen und persönliche Erlebnisse mitzuteilen verstehen. Die Entwicklung der kinematographischen Wiedergabe lässt sich begreifen als die technische Realisierung der aus Bild und Sprache zusammengesetzte Kommunikationsweise, die wir Erzählen nennen, oder wie ich auch sagen könnte: Die innere bildliche Vorstellung des Erzählers, die sich in seiner Gestensprache realisiert und vom Publikum wieder in imaginierende Vorstellung zurückgeführt wird, veräußerlicht sich in der filmischen Darstellung zu einer Folge visueller Bilder, die nun mit den Augen und nicht mehr nur in der inneren Vorstellung wahrnehmbar werden. Erzählen lieferte in dieser Perspektive die Anregung und das Vorbild für die technischen Verfahren audiovisueller Darstellung. Auch wenn die Filmsprache sich mit der Etablierung des Kinos als eigenständigem Massenmedium um eigene Darstellungsformen und Erzählweisen bereichert, die den Film als Gattung vom Erzählen wie vom darstellenden Spielen abgrenzen, finden vor allem die in der Frühgeschichte des Films entwickelte Bildgestaltung ihre Entsprechung im gestischen Repertoire der Erzähler. Verfahren wie die Detailaufnahme, die Auswahl des Blickwinkels, die Montage, den Filmschnitt oder die Bewegtheit seiner Aufnahmen betrachten wir als genuine Gestaltungsweisen des Mediums Film. Ich möchte aber behaupten, dass sie sich in gestischen Ausdrucksweisen vorgebildet finden, die ganz ähnliche Wirkungen auf den Betrachter erzeugen, und ich möchte darauf in aller Kürze eingehen, um damit zugleich den Reichtum an Ausdrucksformen anzudeuten, die die gestische Vorführung dem Erzähler zur Verfügung stellt.

Die Entsprechung lässt sich bereits für das zentrale Kennzeichen des Films, eben die Bewegtheit seiner Bilder, in Anspruch nehmen. Der Eindruck sinnlich miterlebter Gegenwärtigkeit, den der Film erzeugt, beruht auf einer leicht erkennbaren Täuschung: Die Bilder sind, jedenfalls dort, wo das Kino Geschichten erzählt, offensichtlich gestellt, und in der Aneinanderreihung von Sequenzen wird die „Wirklichkeit“ auf wenige ausgewählte Ausschnitte reduziert. Dieses Wissen, das man auch dem naivsten Kinobesucher unterstellen darf, behindert jedoch kaum das Gefühl, die Filmhandlung unmittelbar mitzuerleben. Auf den ersten Blick mag es scheinen, dass diese Wirkung durch die perfekte Wiedergabe erreicht wird, die das fotographische Verfahren ermöglicht. Tatsächlich halten wir aber zum einzelnen Foto problemlos Distanz: Wir betrachten es als die Abbildung eines örtlich und zeitlich entfernten Zustands. Das ändert sich, sobald diese Bilder zu laufen beginnen: Es ist das bewegte Bild, das dem Kinobesucher den unabweislichen Eindruck suggeriert, Augenzeuge der vorgeführten Handlungen zu sein, mit den handelnden Figuren in den abgebildeten Räumen und Landschaften zu leben, das dem Film den auffallenden Grad an „Realität“ verleiht, den wir ihm unwillkürlich im Augenblick des Betrachtens zubilligen, wie kritisch wir sie im nachhinein auch immer beurteilen mögen. Es ist dieser Effekt, der die entscheidende Wirkung filmischer Wiedergabe auf den Zuschauer ausmacht und den der französische Filmkritiker Christian Metz in die Worte fasst: „Die Gegenstände und die Personen, die uns der Film zeigt, erscheinen dort als Abbild, doch die Bewegung, durch die sie belebt werden, ist kein Abbild der Bewegung, sie erscheint wirklich“ (Metz 1972, S.28). Er sieht diese spezifische Filmwirkung darin, dass die Bewegung selbst im Augenblick ihrer Wahrnehmung erzeugt wird.

Sofern man nicht die andere technische Realisierung, sondern die Wirkung auf den Zuschauer im Blick hat, lässt sich dieser Gedanke auf ein für das Erzählen entscheidendes Verfahren zeichenhafter Darstellung übertragen, auf jene abbildenden Gesten, die die Bewegung von Objekten oder Menschen durch stellvertretende Körperbewegungen wiedergeben. Wo immer eine gestische Bewegung eine Vorstellung mitteilen soll, wird diese Bewegung zwar in stellvertretender „symbolischer“ Verkürzung, aber doch als „wirkliche“ Bewegung ausgeführt werden. Ich möchte deshalb für die starke Faszination bewegter Gestik und die davon angeregte imaginierende Bewegung der Bildvorstellungen den gleichen Zusammenhang verantwortlich machen, der für Metz den Realitätseindruck filmischer Wahrnehmung begründet, wenn er feststellt, man könne eigentlich keine Bewegung „reproduzieren“, sondern man könne sie nur „re-produzieren durch eine zweite Bewegung, die für den, der ihr zuschaut, den gleichen Realitätsgrad hat wie die erste“ (Metz 1972, S.28).

Auch die Effekte, die der Film mit der Detailaufnahme erzielt, lassen sich im Prinzip mit Gesten erreichen. Gegenüber der Theateraufführung, mit der der Film oft verglichen wurde, die auf einen festen Bühnenausschnitt und dem darauf aufgebauten Bühnenbild beschränkt bleibt, das nur von Szene zu Szene wechseln kann, erlaubt die filmische Darstellung, Bildausschnitte und Einstellungsgrößen nach Belieben zu wählen, also statt des „ganzen“ Bildes nur Ausschnitte zu zeigen, ein Verfahren, das eben gerade durch die Auslassung die Phantasie antreibt. Wenn ich beispielsweise im Film die Nahaufnahme einer greifenden Hand sehe, ergänze ich mir in der Vorstellung unwillkürlich den ganzen Menschen, der zugreift. In vergleichbarer Weise sind es Teilaspekte umfassenderer Handlungen, die die Vorlagen stellvertretender Gesten liefern, und darum hat die Geste des Erzählers, der die Hand benutzt, um vorzuführen, mit welcher Wucht der Held seiner Geschichte die Tür eingetreten hat, eine vergleichbare Wirkung: Jeder „Hörer“ sieht einen wütenden Menschen, der seine ganze Wut in den zutretenden Fuß lenkt.

Allerdings ist die Geste nicht in der Weise kontextunabhängig wie das fotografische Bild. Ein stehendes Bild ist auch in sich relativ aussagekräftig. Die stumme Geste bleibt vieldeutig, erst im sprachlichen Kontext ergibt sich eine eindeutige Mitteilung. Nun ist zwar das Filmbild als Einzelaufnahme vergleichsweise eindeutiger, aber seine Einbettung in die rasch laufenden Bilder hat einen ähnlichen Effekt: „Die Bedeutung des einen Bildes hängt zu einem guten Teil von den umgebenden Bildern ab“ (Saez 1974, S.75). Die umgebenden Bilder mögen einfach nur andere Ansichten derselben Szene bieten oder uns auch plötzlich an einen ganz anderen Schauplatz versetzen, miteinander verbunden sind sie über den Schnitt, der gerade durch die Auslassung die Vorstellungskraft anregt. Was der Wechsel der Einstellungen verschweigt, versucht sich der Zuschauer zu vervollständigen. Schon ein einfacher Versuch zeitigt diese Reaktion: Reiht man beliebig aus Zeitschriften ausgeschnittene Bilder, wie es der Zufall will, nebeneinander, beginnt unsere Vorstellung unwillkürlich zu arbeiten und Verbindungen zwischen den Abbildungen herzustellen. Diese assoziativen Verbindungen fügen sich dann zu diffusen Erzählungen zusammen. Den Effekt nebeneinandergesetzter „geschnittener“ Bilder erzeugt das gestische Erzählen, indem jede Geste einen klaren Abschluss findet und die Hände in die Ausgangslage zurückkehren, ehe sie zur nächsten Geste ansetzen. Sie überlassen es damit dem Zuschauer, eine Verbindung zu schaffen, ganz ähnlich, wie das schon die Klassiker der sowjetischen Filmkunst für den Schnitt definierten: „Für Eisenstein ist der Schnitt genaugenommen der ‚Ausdruck eines dramatischen Prinzips‘ verbunden mit dem dialektischen Denken: Das Aufeinanderstoßen einer Aufnahme mit der folgenden präsentiert dem Zuschauer einen Konflikt und überlässt ihm dessen Lösung“ (Saez 1974, S.79).

In der Formsprache des Films wie in der Gestensprache des Erzählers dienen diese Erzählweisen demselben Ziel: Innere Bildvorstellungen mitteilbar zu machen und die Vorstellung des Zuschauers zu aktivieren. Es steht allerdings außer Frage, dass die filmische Bildsprache diese Techniken in einer Weise verfeinern und perfektionieren konnte, die auch für die oft geradezu akrobatischen Kunstfertigkeiten traditioneller Berufserzähler unerreichbar blieben, und dass sie schließlich genuine Aufnahmeweisen entwickelte, die keine Entsprechungen in den gestischen Darstellungen von Erzählern haben. Ein Beispiel dafür wären Verfahren der „inneren Kamera“, Kamerafahrten, Zoom und dergleichen, bei denen der psychologische Eindruck der Beteiligung des Zuschauers dadurch einsteht, „dass der Regisseur durch den Wechsel der Kameraposition von sich aus statischen Gegenständen Bewegung verleihen kann“ (Saez 1974, S.63).

Ich will versuchen, soweit das eine kurze schriftliche Beschreibung erlaubt, die Verwandtschaft der filmischen Bildsprache mit der Gestensprache des Erzählers an einem bescheidenen Beispiel anschaulich zu machen, einer Szene aus dem Grimmschen Märchen vom „Meisterdieb“. Wenn der Meisterdieb bei der zweiten Aufgabe nachts mit der Leiter unterm Arm und einer Leiche auf den Schultern den Schlosshof betritt, kann ich die Leiter mit beiden Armen gegen die Mauer stellen, kann Hand für Hand die Leiter hochsteigen. Schnitt. Ich wechsle die Perspektive: Oben im Schlafzimmer wacht der Graf und bemerkt, wie sich der Schatten eines Kopfes und dann die Schulter im Fensterausschnitt hochschiebt: Ich zeichne die schattenhaften Umrisse des Fremden in das Fenster. Als Graf hebe ich nun die Hand mit dem ausgestreckten Zeigefinger als Pistolenlauf und drücke den Knall der abgefeuerten Kugel durch die gepressten Lippen (einen Effekt, den der Comic zu einem „Päng“ verschriftlicht).

Den Körper lasse ich mit einem dumpfen Laut im Schlosshof aufschlagen und den Grafen befriedigt feststellen, dass dieser Dieb wohl niemanden mehr aussacken wird. Aber der Herr Graf möchte auch das Aufsehen, das eine Leiche im Schlosshof verursacht, vermeiden, und alles in allem, besser er verscharrt den Gauner gleich höchstpersönlich im Schlossgarten. Er klettert also aus dem Fenster und steigt die Leiter hinunter, wie sie der Meisterdieb hinaufgeklettert war. Mit einem kurzen Satz lasse ich ihn im Schlossgarten verschwinden, damit nun wieder der im Busch versteckte Meisterdieb auftreten, über die Leiter ins Schlafgemach der Frau Gräfin einsteigen und sie mit der Stimme des Grafen um das Leintuch aus ihrem Bett bitten kann, schließlich sei er nicht irgendwer, sondern ein Meisterdieb und sogar sein Patensohn gewesen. Hier muss ich Spiel und Erzählung kurz unterbrechen, um zu erklären, dass man in alten Zeiten Tote in Leintüchern begrub. Der Blick der Kamera ruht nun auf der Gräfin, die schlaftrunken sich das Bettuch unter dem Hinterteil wegzieht und es dem Meisterdieb überreicht, der es sich, sozusagen im Gegenschnitt, zusammengefaltet unter den Arm klemmt und verschwindet. Schon an diesem einfachen Beispiel ist abzulesen, wie die Erzählung einer Szene im Grunde in Filmsequenzen unterteilbar ist, sich in einer Folge von Gegenschnitten, gestischen Nahaufnahmen und auf die Bildtotale weisenden Handbewegungen aufbaut.

Dass gestisches Erzählen mit audiovisuellen Medien verwandt ist, erfahre ich auch immer wieder beim Auftritt vor Schulkindern, die erstaunt feststellen: „Das ist ja wie Fernsehen“. Es liegt mir fern, mit dem Fernsehen zu konkurrieren oder es abzuwerten. Es gibt sicher eine Menge schlechter Sendungen ebenso wie es, gerade in der Kinderliteratur, eine Menge gequälter Erzählungen gibt. Entscheidend für mich ist: Die Kinder drücken mit diesem Satz aus, dass ihnen mit der Erzählung Bilder geliefert wurden, dass alles lebendige gestische Erzählen letzten Endes eine audiovisuelle Sprache spricht. Da sie in einer Umwelt aufwachsen, die ihnen an jeder Straßenecke Bildeindrücke liefert, ihre Vorstellungsfähigkeit anspricht und sie mit Phantasiebildern füttert, reagieren sie mit großer Sensibilität auf visuelle Reize.

Ich behaupte also, dass mündliches Erzählen und Film ihrer Struktur nach verwandt sind, dass sich filmische Darstellungstechniken im Prinzip bereits in den Erzählweisen vorgebildet finden, wie sie über die Jahrtausende in vielen Kulturen von Laien und professionellen Erzählern gepflegt und weitergegeben wurden. Die Gesten und die Spieleinlagen des Erzählers haben bei allen Unterschieden der technisch-industriellen Herstellung des Films im Vergleich zum überlieferten Handwerk des Erzählens doch eine dem Filmbild vergleichbare Aufgabe: Sie wollen Bilder mitteilen und in Bildern erzählen. Sie sind aber mehr als Illustrationen der erzählten Handlungen, sie sind ein integrierender Bestandteil der Erzählung selbst. Die Bilder, nach denen sie modelliert sind, und die Bildvorstellungen, die sie im Betrachter erzeugen, ließen sich nicht beliebig und ebenso gut durch sprachliche Sätze ersetzen. Bilder sprechen unmittelbarer als jede Sprache Emotionen an und rufen in uns schlummernde Bilder hervor, die Gefühle und Strebungen viel genauer zum Ausdruck bringen als jede Beschreibung. Deshalb können Bilder unsere Emotionen tiefer, unmittelbarer und nachdrücklicher berühren als sprachliche Botschaften, und sie werden uns desto mehr berühren, je mehr „Hintergrund“ sie haben, je mehr sich unsere Erinnerungen und Phantasien in unbewusste und archetypische Muster einfügen.

Aus dem gleichen Grund widersetzt sich umgekehrt unsere innere Bildwelt, wie wir sie in nächtlichen Träumen oder den flüchtigen tagträumenden Abschweifungen erfahren, gerade bei den aufrührenden Vorstellungen der sprachlichen Wiedergabe. Wir bemerken ihre isolierende Privatheit etwa beim Aufschreiben von Träumen. In Selbsterfahrungen und psychotherapeutischen Sitzungen, die mit Tiefenregression arbeiten, wird nach der Sitzung statt des sprachlichen Berichts zunächst das malende und zeichnerische Festhalten empfohlen, das die flüchtigen Bildeindrücke unmittelbarer auszudrücken vermag. Aber damit sind nur „Standfotos“ festzuhalten, während wir in Träumen, halbbewussten Wachphantasien oder veränderten Bewusstseinszuständen laufende Bilder erleben.

Ich vertrete die Ansicht, dass es letzten Endes dieses dem wachen Bewusstsein entrückte Material ist, das Erzählungen hervorbringt, auch wo sie sich scheinbar nur auf die „Tatsachen“ unserer Erinnerungen beziehen, und das in und durch Erzählungen zur mitteilbaren Gestaltung drängt. Aber gleichgültig, ob wir Erinnerungen oder Phantasien mitteilen: Die gestische und spielerische Darstellung stellt uns ein Medium zur Verfügung, Bildinhalte kommunizierbar zu machen, ohne sie vollständig verssprachlichen zu müssen. Gestische und spielerische Zeichen sprechen in ihrer körperlichen Bewegtheit die bildliche Vorstellung unvermittelter an als die sprachliche Darstellung, sie machen Bilder kommunizierbar. Durch ihre Einbettung in zeitlich angeordnete sprachliche Zeichen ordnen sie sich zu einer zeitlichen Abfolge: Die Bilder lernen laufen.

Literatur:

Haiding, Karl: Von der Gebärdensprache der Märchenerzähler, Folklore Fellows Communications Nr. 155, Helsinki 1955
Karlinger, Karl (Hg.): Italienische Volksmärchen, Düsseldorf 1973
Kendon, Adam: Gesture and Speech, in: Wiemann, John M./ Harrison, Randall P. (eds.) : Nonverbal Interaction, Beverly Hills 1983
McNeill, David/ Levy, Elena: Conceptual Representations in Language Activity and Gesture, in: Jarvella, R.J./ Klein, W. (eds.): Speech, Place and Action, Chichester 1982
McNeill, David: So You Think Gestures Are Nonverbal?, Psychological Review 92 (1985), S.350-371
McNeill, David: Iconic Gestures of Children and Adults, Semiotica 62 -1/2 (1986), S.107-128
Merkel, Johannes: Von der Kunst, Skelette zu beleben, Nachwort zu: Merkel, Johannes (Hg.): Die Liebe der Füchsin, Geistergeschichten aus dem alten China, München 1988
Metz, Christian: Semiologie des Films, München 1972
Paivio, Allan: Images in Mind, New York 1991
Riseborough, M. G. : Physiographic Gestures as Decoding Facilitators: Three Experiments Exploring a Neglected Facet of Communication, Journal of Nonverbal Behavior 5 (1981), S.172-183
Saez, José Luis: Teoria del cine, Santo Domingo 1974
Tillhagen, Carl-Hermann: Taikon erzählt Zigeunermärchen, München 1979
Werner, Heinz/ Kaplan, Bernhard: Symbol Formation, New Jersey 1984

(Aus: Johannes Merkel: Spielen, Erzählen, Phantasieren. Die Sprache der inneren Welt, München 2000, S. 158- 183)