Különleges adatbázist hoztak létre magyar költők műveiből az ELTE kutatói
2021. április 12., hétfő 13:08
A versek rímeit, ritmusait és más rejtett tulajdonságait feltáró, szabad hozzáférésű adatbázis forrása a Magyar Elektronikus Könyvtár számos, szerzői jogi védelem alatt már nem álló gyűjteménye.
A korpusznyelvészet összegyűjti az adott nyelvterületről a szövegeket, különféle szempontok alapján annotálja, vagyis felcímkézi azokat, majd a nyelvi jellemzők közötti keresések révén tár fel összefüggéseket
A szavak grammatikai tulajdonságainak azonosítására a kutatók a Nyelvtudományi Intézetben fejlesztett e-magyar programot használták fel, amellyel automatikusan meghatározható az adott kifejezés szótári alakja, szófaja, továbbá morfológiai jellemzői – számolt be Palkó Gábor, az ELTE Digitális Bölcsészet Tanszék egyetemi docense.
A mintázatok feltárása szempontjából még érdekesebb, hogy létrehozhatók úgynevezett gyakorisági listák is. Így néhány kattintással egy csokorba gyűjthető, hogy költőink milyen főneveket használtak a leggyakrabban, hogy az idők során hogyan változott a jelen és múlt idejű igék aránya, a megszólítás vagy épp a második személyű igealakok használati gyakorisága.
A versek rímképlet, a szavak hangrend vagy szótagszám szerint is listázhatók, a verseknél pedig a felhasználók láthatják a sorok szótagszámát és időmértékes ritmusképletét is. A Verskorpuszt elsősorban kutatóknak és egyetemi hallgatóknak ajánlják a készítők, de, mint írják, jó szolgálatot tehet a pedagógusoknak a középiskolai irodalomórákat, verselemzéseket támogató adatbázisként is.
A szabad hozzáférésű adatbázist folyamatosan bővítik, legközelebb várhatóan Juhász Gyula és Radnóti Miklós költeményei kerülnek sorra.