Ik heb van http://www.liedjesland.com/Liedjes/Sinterklaas/ een stuk of 14 liedjes genomen, in ieder geval de nummers die ik kende.
Die heb ik opgeslagen, en na wat filtering, sorteren, tellen en allerlei andere niet zo heel boeiende zaken kom je dan op de rauwe data zoals deze hier te zien is.
Een snapshot van hoe dat dan eruit ziet:
{
"1":{
"daar":4,
"wordt":3,
"aan":5,
"de":3,
"deur":3,
"geklopt":5,
"hard":1,
"zacht":1,
"wie":1,
"zou":1,
"dat":1,
"zijn?":1,
"wees":3,
"maar":2,
"gerust":1,
"mijn":3,
"kind":1,
etc.....
}}
Dit zijn dus de woorden en het aantal keer dat ze voorkomen per liedje.
Geen opmerkingen:
Een reactie posten