1. Заказ дипломных, курсовых, контрольных работ и отчетов по практике у специалистов WUZ.by
    Наш телефон: +375 (29)156-31-63
    Е-mail: 1563163@mail.ru
    Мы Вконтакте
    Скрыть объявление

Частотнасьць літараў (беларуская і расейская мовы)

Тема в разделе "Белорусский язык", создана пользователем cvetkoff, 8 дек 2013.

  1. cvetkoff
    Offline

    cvetkoff Главный Администрация

    Сообщения:
    860
    Симпатии:
    43
    Classical Belarusian Soviet Belarusian Russian
    letter% perc.occur.  letter% perc.occur.  letter% perc.occur. 
    а 16,08 77246     а 16,18 251473     о 10,76 40874
    н 6,07 29154     н 5,94 92319     е 8,33 31662
    і 4,75 22832     і 5,25 81675     а 8,21 31177
    ы 4,41 21211     с 4,16 64695     и 7,02 26669
    р 4,19 20127     ы 4,13 64204     н 6,51 24737
    я 4,06 19502     р 4,01 62274     т 6,29 23881
    к 3,97 19084     к 4,00 62126     с 5,51 20945
    л 3,90 18751     е 3,98 61850     л 5,21 19787
    с 3,86 18559     л 3,98 61809     в 4,33 16436
    е 3,65 17551     я 3,87 60130     р 4,26 16176
    т 3,51 16859     о 3,80 59067     д 3,40 12927
    о 3,48 16700     т 3,64 56504     к 3,17 12031
    д 3,23 15498     д 3,37 52356     м 2,88 10940
    у 3,15 15117     у 3,25 50510     у 2,85 10829
    м 3,14 15099     м 3,08 47900     п 2,82 10716
    в 2,93 14097     з 2,99 46504     ь 2,18 8288
    п 2,85 13685     в 2,94 45773     г 1,99 7545
    з 2,75 13214     п 2,82 43867     я 1,92 7304
    ц 2,55 12276     ц 2,51 39013     ы 1,91 7248
    ь 2,51 12083     ў 2,38 37069     б 1,69 6434
    ў 2,26 10846     г 1,93 29933     з 1,65 6268
    г 2,05 9860     б 1,86 28935     ч 1,42 5405
    б 1,80 8671     ч 1,59 24699     ж 1,10 4187
    ш 1,46 7004     ь 1,50 23372     й 1,03 3906
    ч 1,39 6683     ш 1,49 23126     х 1,01 3839
    й 1,32 6356     х 1,17 18219     ш 0,86 3275
    э 1,19 5708     й 1,00 15480     ю 0,51 1931
    х 1,04 5009     э 0,87 13580     ц 0,42 1584
    ж 0,89 4254     ж 0,79 12309     щ 0,35 1314
    ю 0,72 3436     ю 0,63 9772     э 0,31 1177
    ф 0,12 600     ф 0,10 1520     ф 0,08 314
    и 0,02 94     и 0,01 190     ъ 0,02 68
    щ 0,00 6     ъ 0,00 25          
              щ 0,00 15          



    • Here are some brief notes regarding the table below;
    • I used 11 books for calculation of letter frequencies. Four well-known books written in "Narkamauka" (Soviet version of Belarusian), five in classical orthography (sometimes called "tarashkevica"), and two books in Russian (actually two Belarusian books translated into Russian). You can see the actual book list below.
    • Probably the most distinguising feature of Belarusian letter frequency is the abundance of letter "a" -- more than 16%!
    • Also you can note that overall letter frequency distribution is very different from Russian, especially the vowels "а", "о", "ы", "я". Some consonants such as "ц" and "з" are much more often encountered in Belarusian. I'll leave furrther analysis to the reader...
    • It's worth noting that there are very few differences between classical and Soviet versions of our orthography. Most notably, classical has higher percentage of "ь" (soft sign), "э" and "я".
    • You can download the complete Excel sheet file from the downloads section (there is a zip file with a Windows executable file that allows to calculate the frequency and an Excel file that contains two worksheets).
    • Хацеў бы зрабіць некалькі заўвагаў, што да табліцы частотнасьці;
    • Для падліку частотнасьці я скарыстаў агулам 11 кніг: чатыры шырока вядомых кнігі, напісаных "наркамаўкай"; пяць кніг, напісаных клясычным правапісам (гэтак званай "тарашкевіцай"); дзьве кнігі па-расейску (пераклады двух беларускіх раманаў). Вы можаце праглядзець сьпіс тутака.
    • Напэўна, самая заўважная характарыстыка беларускай мовы -- вялікая колькасьць літары "а" -- больш, як 16 адсоткаў!
    • Таксама можна заўважыць, што агульная дыстрыбуцыя літараў досыць моцна адрозьніваецца ад расейскай мовы. Гэта асабліва датычыць галосных "а", "о", "ы", "я", а таксама некаторых зычных, напрыклад, "ц" і "з". Далейшы аналіз я пакідаю зацікаўленаму чытачу.
    • Варта заўважыць, што насуперак пасапалітаму меркаваньню, адрозьненьні паміж савецкай наркамаўкай і клясычным правапісам досыць нязначныя і тычацца пераважна трох літараў: "ь" (мяккі знак), "э" і "я". У клясычным правапісе іхная доля трохі большая.
    • Вы можаце загрузіць сабе поўныя дадзеныя ў фармаце Microsoft Excel з разьдзелу downloads. Заархіваваны ZIP файл утрымлівае Windows праграму для падліку частотнасьці літараў і файл Excel з двума аркушамі.

    Books used for calculations - Скарыстаныя для падліку кнігі

    Soviet Belarusian (Наркамаўка):
    1. Jakub Kolas "Novaja ziamla" -- Якуб Колас "Новая зямля"
    2. Ivan Samiakin "Serca na daloni" -- Іван Шамякін "Сэрца на далоні"
    3. Uladzimir Karatkievic "Corny zamak Alsanski" -- Уладзімір Караткевіч "Чорны замак Альшанскі"
    4. Uladzimir Dubouka "Pialostki" -- Уладзімір Дубоўка - "Пялёсткі"

    Classical orthography (Клясычны правапіс):
    1. Kastus Akula "Za volu" -- Кастусь Акула "За волю"
    2. Piotra Syc "Smierc i salauji" (Mt.Casino) -- Пётра Сыч "Сьмерць і Салаўі" (Mt.Casino)
    3. Anton Adamovic "Kachany horad" -- Антон Адамовіч "Каханы горад"
    4. Jazep Losik "Zauvahi da..." -- Язэп Лёсік "Заўвагі да..."
    5. Vasil Bykau "Sciana" -- Васіль Быкаў "Сьцяна"

    Russian (расейская мова):
    1. Janka Maur, "Amok" (Russian translation) -- Янка Маур "Амок"
    2. Vladimir Korotkevich "Dikaya ohota korolya Stakha" (Russian translation) -- Владимир Короткевич "Дикая охота короля Стаха"

    by rydel n23
     

Поделиться этой страницей