Da bi istražili kako se menjaju jezici, naučnici su pribegli podacima servisa Gugl Ngram, koji analizira knjige iz baze podataka Gugl-knjige. Matematičari navode da knjige mogu da se istražuju na dva načina: prebrojavanjem reči koje se nalaze u jednom delu, ali ih nema u drugom, ili prebrojavanjem učestalosti korišćenja određenih reči.
Naučnici su iskoristili drugu metodu i analizirali dela na engleskom jeziku objavljena 1850-tih, 1900-tih i 1950-tih godina.
Oni su primenili modifikovanu matematičku funkciju, Jensen-Šenonovu divergenciju, koja se koristi za analizu sličnosti i razlika skupova simbola, u svojstvu kojih mogu da budu i reči.
Naučnici su objasnili da se tekstovi najviše razlikuju retko korišćenim rečima, a ne često korišćenim. To nisu mogle da objasne ranije korišćene metode.
Matematičari smatraju da su rezultati primenljivi ne samo na engleski, već i na druge jezike kao što su ruski i španski.