Institutet för språk och folkminnen (Isof) har påbörjat ett samarbete med AI Sweden och KB-labb för att träna nya språkmodeller med hjälp av äldre talinspelningar. Inspelningarna, som sträcker sig över hundra år, innehåller dialektala varianter från hela Sverige och bidrar nu till att förfina språkmodellernas förståelse för det talade svenska språket.
– Vi har totalt 25 000 timmar inspelat material från hela Sverige, lagrat på allt från rullband och grammofonskivor till vaxrullar. Det är fascinerande att detta historiska material nu används för att förbättra framtidens teknik, säger Annette Torensjö, chef för Avdelningen för arkiv och forskning på Isof i Uppsala.
För att underlätta arbetet har Språkbanken Sam, en avdelning inom Isof med ansvar för att främja språkteknologi i Sverige, anställt en digitaliseringsassistent. Assistenten ska arbeta med digitaliseringen och transkriberingen av det ljudande materialet som ofta kan vara utmanande att tyda, särskilt när det rör sig om äldre inspelningar. Dessutom kommer all information att presenteras i sin rätta kontext för att tydliggöra vad personen talar om: mattraditioner, sedvänjor eller högtider. Vissa inspelningar kan också behöva anonymiseras på grund av känsliga uppgifter.
Isof planerar även att tillgängliggöra inspelningarna via arkivtjänsten Folke.
– Vårt arkivmaterial är en skatt som vi vill sprida. För forskare är det en ovärderlig resurs för att studera språkets utveckling, och för allmänheten erbjuder det en unik möjlighet att återupptäcka sitt kulturarv och höra hur äldre generationer talade, säger Annette Torensjö.
Källa: Institutet för språk och folkminnen (Isof)
Foto: Alexandre Louis