Als je een stuk gesproken tekst transcribeert, dan schrijf je zo precies mogelijk op wat de gespreksdeelnemers gezegd hebben. Als ze zich bijvoorbeeld verspreken, een woord herhalen of stotteren, dan komt dat allemaal in het transcript te staan. Voor het transcriberen van kindertaal gebruik je zogenaamde CHAT (Codes for the Human Analysis of Transcripts) codes. Je kunt ze opslaan in de CHILDES-database. Daarin worden heel veel transcripten van kindertaal bewaard.
Elke CHAT file begin met een aantal @-headers, met onder andere gegevens over het kind, andere participanten en de datum van het gesprek. De regels na de @-headers beginnen elk met een zogenaamde ‘tier’. Er zijn twee soorten tiers: *-tiers en de %-tiers. De *-tiers worden gevolgd door drie hoofdletters die de naam van de spreker aangeven, bijv. *MOE: (gevolgd door een uiting van de moeder). De %-tiers zijn ‘dependent tiers’. Ze slaan altijd op de voorafgaande uiting (een zin of een deel ervan) van degene die net iets gezegd heeft. %-tiers worden gevolgd door drie kleine letters die een code aangeven, zoals %com: (= comment; commentaar op de handeling in de voorafgaande uiting).
In een transcript kun je met behulp van bepaalde notaties aangeven wat er tijdens een gesprek gebeurt, bijvoorbeeld of één spreker door een andere spreker heen praat of even aarzelt. Enkele veelgebruikte notaties zijn:
Zoals bijvoorbeeld in het transcript hieronder:
@Begin @Languages:dutch @Participants:KIN Kind Child, MOE Moeder Mother @Birth of KIN:20-DEC-2001 @Age of KIN:02;11.10 @ID:301104s1
@Comment:Blokconstructie bouwen.
*MOE:dan gaan we nu deze maken. *MOE:gaan we nu de clown maken. *KIN:eerst de hoofd xxx. *MOE:nee dan gaan we eerst # het hoedje. *KIN:hoedje. *KIN:< hoedje van > [/] < hoedje van >. *KIN:een twee drie vier < hoedje van > [/] < hoedje van > [/] hoedje van papier. %com:moeder lacht. *MOE:hij heeft een geel hoedje.
@End