In the article, the project of quantitative parametrization of all texts by Ivan Franko is manifested. It can be made only by using modern computer techniques after the frequency dictionaries for all Franko's works are compiled. The paper describes the application spheres, methodology, stages, principles and peculiarities in the compilation of the frequency dictionary of the second half of the 19th century - the beginning of the 20th century. The relation between the Ivan Franko frequency dictionary, explanatory dictionary of writer's language and text corpus is discussed.
Deep Dive into Quantitative parametrization of texts written by Ivan Franko: An attempt of the project.
In the article, the project of quantitative parametrization of all texts by Ivan Franko is manifested. It can be made only by using modern computer techniques after the frequency dictionaries for all Franko’s works are compiled. The paper describes the application spheres, methodology, stages, principles and peculiarities in the compilation of the frequency dictionary of the second half of the 19th century - the beginning of the 20th century. The relation between the Ivan Franko frequency dictionary, explanatory dictionary of writer’s language and text corpus is discussed.
У сучасній лексикографії словники, об'єктом опису яких є текст письменника, відповідно до мети і можливостей укладачів представлені різними типами: словник мови письменника, словопокажчик, конкорданс, частотний словник та порівняно новий тип -лексична будова ідіолекту 19 .
Найповніший опис лексико-фразеологічного складу творів пропонує словник мови письменника 20
, а також один раз -у контексті: “Та ось поперек його дороги простягається чорна стрічка, закривлена по обох краях обрію, мов велике, плазом покладене S”. Серед них також трапляються омоніми: in (лат.) й in (нім.), a (лат.) й a (польськ.), німецькі означені артиклі die (жіночого роду і множини), латинське maxima функціонує один раз як прикметник (жін. роду від maximus), а другий раз -як іменник (множина від maximum). Цікавим є також міжмовний омонім на -прийменник в українській мові та частина єврейського словосполучення на хайрем (слово честі).
ЧС кожного твору І. Франка укладаємо напіватоматичним способом у декілька етапів:
In the article, the project of quantitative parametrization of all texts by Ivan Franko is manifested. It can be made only by using modern computer techniques after the frequency dictionaries for all Franko’s works are compiled. The paper describes the application spheres, methodology, stages, principles and peculiarities in the compilation of the frequency dictionary of the second half of the 19th century -the beginning of the 20th century.
The relation between the Ivan Franko frequency dictionary, explanatory dictionary of writer’s language and text corpus is discussed.
відмічає, де в “Кобзарі”, і в яких текстуальних обставинах появляється кожна вжита Шевченком словоформа, як українська, так і російська" 31 . У ньому зафіксовано 18 401 лексичну одиницю і подано 83 731 випадки їхнього вживання. Опрацювання матеріалу здійснено з використанням комп’ютерних програм, на відміну від описаних вище праць. Частотний словник (далі -ЧС) -тип словника, де наведено кількість вживань, тобто частоту певної одиниці мови в обстежених текстах. Звичайно він складається з декількох списків: списків слів, зведених до початкової форми, розташованих за спадом частот і за алфавітом, а також з таких самих списків для словоформ. Мовознавці зазначають, що “… ЧС є важливим інструментом дослідження закономірностей функціонування лексичної системи 24 Ващенко В. С., Петрова П. О. Шевченкова лексика. Словопокажчик до поезій Т. Г. Шевченка.-К.: Видавництво Київського державного університету ім. Т. Шевченка, 1961.-106 с. 25 Ващенко В. С., Медведєв Ф. П., Петрова П. О. Лексика «Енеїди» І. Котляревського. 29 Лук’янюк К. М. (гол. ред.) Юрій Федькович: Словопокажчик мови творів письменника.-Чернівці: Місто, 2004.-188 с. 30 Оліфіренко Л. В. (уклад.) Словник поетичної мови Василя Стуса (Рідковживані слова та індивідуальноавторські новотвори).-К.: Абрис, 2003.-90 с. 31 Конкорданція поетичних творів Тараса Шевченка / Ред. і упоряд.: Олег Ільницький, Юрій Гавриш. У 4-х тт.-Торонто, 2001.-Т. 1.-С. ХІХ. мови 35 Альтман Ґ. Мода та істина в лінгвістиці // Проблеми квантитативної лінгвістики.-Чернівці: Рута, 2005.-С. 3-11.-С. 6. 36 Перебийніс В. С. Статистичні методи для лінгвістів: Навчальний посібник.-Вінниця: “Нова книга”, 2002.-С. 7.
письменників і т. ін. можна з високою ймовірністю визначити лексичну основу мови, тобто об’єктивно найбільш уживані слова, які слід насамперед засвоїти іноземцеві, що вивчає цю мову. Статистичний підхід до виокремлення словників-мінімумів має довгу традицію в Європі 42 . На жаль, у сучасній лексикографії і дидактичній літературі, послуговуючись назвою “найуживаніша лексика”, автори часто не вказують принципів відбору слів до словника, добираючи лексикон інтуїтивно (див., наприклад, праці Сахнів 43 ).42 Бук С. Н. Лексична основа української мови: виділення та системно-структурна організація.-Рукопис. Дис… канд. філол. наук: 10.02.01 / Львівський національний університет імені Івана Франка.-Львів, 2004.-С. 14-25. 43 Сахно І. П., Сахно М. М. Словник сполучуваності слів української мови (найуживаніша лексика).-Дніпропетровськ: Видавництво Дніпропетровського ун-ту, 1999.-544 с. Методика укладання частотного словника текстів Франка Обсяг спадщини І. Франка за попередніми обчисленнями становить орієнтовно 8 млн. слововживань, то ж у зв’язку зі стрімким розвитком технічних засобів опрацювання мови стає зрозуміло, що вирішити вказане завдання без використання комп’ютера неможливо. Також це зумовлює визначення основних етапів здійснення задуму: опрацювання художньої прози, літературно-критичних праць, наукових розвідок, епістолярію, поезії. У подальшій перспективі можливе й електронне опрацювання рукописів, що, очевидно, є особливо складним для реалізації. ЧС укладається для кожного окремого твору у межах кожного з цих родів літератури. 44 Франко І. Зібрання творів. У 50-ти томах.-К.: Наукова думка, 1979. 45 Франко І.Я. Мозаїка: Із творів, що не ввійшли до Зібрання творів у 50-ти томах / Упоряд. З.Т.Франко, М.Г.Василенко. -Львів: Каменя
…(Full text truncated)…
This content is AI-processed based on ArXiv data.