Характерною ознакою математики як мови є її лаконічність, тобто висока інформаційна ємність математичних записів. Найфундаментальніші закони природи вдається записати за допомогою невеликої кількості математичних символів. Для запису головного закону, що описує механічний рух макроскопічних сил (другий закон Ньютона), достатньо трьох літер латинської абетки і символа рівності.
Так було не завжди. Тисячі років тому, коли в Давньому Шумері зародилась математика, математичні вирази записувалися словами. Ясно, що виконувати перетворення у таких виразах, записувати і розв'язувати навіть найпростіші рівняння було надзвичайно складно. Інформаційна ємність таких математичних записів була вкрай низькою. Це гальмувало розвиток не лише математики, а й інтелектуальний прогрес людства.
Так тривало тисячі років. Лише у 16 і 17 сторіччях два видатні французи здійснили справжню революцію в математиці. Були це Франсуа Вієт (1540 – 1603) і Рене Декарт (1596 – 1650). Саме вони ввели сучасну алгебраїчну символіку для позначення коефіцієнтів алгебраїчних рівнянь, змінних у них та сам знак рівності.
Це на порядки підвищило інформаційну ємність математичних записів і на порядки підвищило швидкодію людського розуму в осягненні математичних законів і алгоритмів. Від цих видатних французів і почався стрімкий прогрес математики як науки і математики як бази для формулювання основних законів природи.
У ті століття саме Франція була інтелектуальним і культурним лідером Європи і світу. Вищий світ всіх європейських країн розмовляв французькою мовою, одягався подібно французам, дивися на світ французькими очима.
Кінець цій культурній світовій монополії французів поклала так звана Велика французька революція. Почалося полювання на освічених людей і їх знищення. Вперше в новітній історії Європи чернь, керована дітьми диявола, правила бал такого масштабу. З культурним лідерством Франції було покінчено.
Перед тим дітьми диявола було знищено беззаперечного лідера цивілізованого світу – Іспанську імперію. Але після Франції, хоча вона ще залишалась і надалі інтелектуально розвиненою країною, надто великим був її початковий інтелектуальний капітал, лідерство у сфері науки і техніки перейшло до Німеччини і Великої Британії.
Революції з їх лідерством не впорались. Потрібні були дві світові війни, щоб їх здолати. Найбільшою трагедією було те, що в цих війнах вони поборювали одна одну. Зараз лідерство перейшло до Сполучених штатів, але там тепер відбуваються доволі тривожні процеси. Виникає запитання, чи не вони наступна жертва дітей диявола?
Але повернемось до мов, якими спілкуються різні народи між собою. Чи відіграє важливу роль інформаційна ємність мови, якою люди спілкуються у побуті? На мою думку, так. Лаконічність мови пришвидшує процес думання, оскільки людина думає словами, пришвидшує процес спілкування між людьми, пришвидшує процес написання тексту людиною, тобто пришвидшує інтелектуальну діяльність мозку людини.
Можна сказати, що мова задає темп думання людини, тому цікаво було б порівняти різні мови світу за їх інформаційною ємністю. Яка мова краща для точних наук? Як пояснити, що більшість українців, які в силу життєвих обставин змушені були швидко перейти на російську мову, з великим труднощами і довгий час повертаються до рідної мови, а інколи взагалі фізично не можуть це зробити? Чи сумісні мелодійність мови і її інформаційна ємність?
На багато подібних запитань можна відповісти, якщо знайти алгоритм порівняння мов за їх інформаційною ємністю.
Характерною ознакою математики як мови є її лаконічність, тобто висока інформаційна ємність математичних записів. Найфундаментальніші закони природи вдається записати за допомогою невеликої кількості математичних символів. Для запису головного закону, що описує механічний рух макроскопічних сил (другий закон Ньютона), достатньо трьох літер латинської абетки та символа рівності.
Кількісних характеристик інформаційної ємності мов можна придумати багато. Я пропоную найпростішу: перекласти український текст мовами народів світу і порівняти довжину отриманих текстів з довжиною вихідного. В якості останнього я взяв текст свого збірника публіцистики: «Україна – це ми» і переклав його відомими мовами світу, які використовують латиницю, кирилицю або грецьку абетку. Для перекладу я використовував комп'ютерну програму Google translate. Ясно, що з такого розгляду випадають східні мови, які використовують ієрогліфічне письмо або арабську абетку і подібні їй. Причина у просторово інших параметрах відповідних текстів, а також у відсутності в арабських текстах літер, що позначають голосні звуки.
Результати такого порівняння наведені у таблиці. Числа у правому стовпчику означають на скільки рядків у середньому переклад сторінки вихідного українського тексту (42 рядки) довший або коротший за оригінал.
Інформаційна ємність мов
1 |
Чеська, есперанто, азербайджанська, курдська, туркменська, |
-5 |
2 |
Латиська, литовська, турецька |
-4.5 |
3 |
Латинська, словацька, словенська, хорватська |
-4 |
4 |
Боснійська |
-3.5 |
5 |
Венеційська, естонська, сицилійська |
-3 |
6 |
Ломбардійська, мальтійська |
-2.5 |
7 |
Ідіш, румунська, фінська, шведська, шотландська |
-2 |
8 |
Англійська, корсиканська, норвезька |
-1.5 |
9 |
Данська |
-1 |
10 |
Албанська, баскська, валійська, ірландська, угорська, узбецька |
-0.5 |
11 |
Українська, польська, італійська, бретонська, каталанська |
0 |
12 |
Білоруська, іспанська, португальська |
+1 |
13 |
Сербська, татарська |
+1.5 |
14 |
Казахська, чуваська |
+2 |
15 |
Монгольська |
+2.5 |
16 |
Башкирська, чеченська, удмурдська |
+3 |
17 |
Малайська, нідерландська, таджицька, французька |
+3.5 |
18 |
Болгарська, бурятська |
+4 |
19 |
Російська, комі, македонська |
+4.5 |
20 |
Люксембурзька |
+5 |
21 |
Німецька, якутська |
+5.5 |
22 |
Киргизька |
+7 |
23 |
Грецька, осетинська |
+7.5 |
24 |
Тувинська |
+8 |
25 |
Філіппінська |
+8.5 |
Серед слов`янських мов чеська виявилась мовою з найбільшою інформаційною ємністю. Вона ж є лідером і серед всіх європейських мов. Разом з нею світовим лідером є штучна мова есперанто, створена у кінці 19 сторіччя у Польщі.
Такими ж лідерами виявились дві тюркські мови – азербайджанська і туркменська. Лідером є і курдська мова. Дивно, що такий талановитий народ і досі не має власної держави.
Мови споріднених нам за формулою крові народів – латишів, литовців і турок – займають другу сходинку цього списку. Мова науки та культури середньовічної Європи, яка сторіччями об`єднувала всі європейські народи у культурному просторі в одне ціле – латина – займає третю сходинку. Дарма сучасні світова наука і культура відійшли від цієї традиції.
Проте й англійська мова, займаючи восьме місце з 25 наведених, успішно справляється з тою роллю, яку відігравала раніше латинська мова.
Українська і польська займають у рейтингу одну позицію, що свідчить, крім спорідненості за формулою крові, вже і про ментальну спорідненість цих народів. Поряд з ними знаходиться італійська мова. Можливо не випадково на мовному конкурсі у Парижі у 1934 році італійська та українська отримали перше і друге місце за мелодійністю мов відповідно.
Як видно з таблиці, більшість слов'янських мов мають високу інформаційну ємність. Виключення становить болгарська і близькі до неї російська та македонська мови.
Нагадаємо, що російська мова сформувалась на основі македонського діалекту староболгарської мови вже у середні віки. За інформаційною ємністю близькими до російської мови виявились і мови багатьох народів нинішньої Російської федерації: чуваші, башкіри, удмурди, буряти, якути.
Неочікуваною виявилась низька інформаційна ємність німецької мови. Це при тому, що все дев`ятнадцяте сторіччя і першу половину двадцятого Німеччина була світовим лідером у сфері науки й техніки.
Сказане вище стосується і французької мови, хоча і меншою мірою. Низька інформаційна ємність грецької мови зумовлена, на мою думку, тим, що ця мова була дуже рано в історичному аспекті зафіксована писемними джерелами та не мала можливості далеко від них відійти. Можливо, таке пояснення стосується і французької та німецької мов, але не стосується російської. Остання виникла значно пізніше решти європейських мов.
Підводячи підсумок, можна сказати, що українська мова має високу інформаційну ємність і цілком придатна для її ефективного використання у точних науках. За рахунок деякої втрати інформаційної ємності вона набуває рис, важливих для використання у гуманітарній сфері. Її задокументована мелодійність робить її ідеальною мовою поезії та пісні. Вона оптимальна для використання, якщо взяти весь спектр потреб народу і у науці, і у культурі, і у побуті. Перехід на російську мову нагадує звалювання фізичної системи у потенційну яму, з якої без зовнішнього втручання система не здатна вийти самостійно.
При перекладі різних текстів, зокрема, тих, що стосуються різних наукових сфер, таблиця матиме дещо інший вигляд. Але ці зміни будуть не радикальними. Похибку моїх розрахунків, пов`язану з неуніверсальністю взятого за основу тексту, а такого просто не існує, я оцінюю від 0.5 до 1 рядка.
При комп'ютерному перекладі може частково викривлюватись сенс вихідного тексту, але ручне корегування перекладу неминуче вносить суб'єктивний елемент у сам переклад, який буде пропорційним досконалому володінню тою чи іншою мовою. Таке володіння при великій кількості мов перекладу неможливе в однаковій мірі для різних мов.
Для підвищення надійності висновків статті потрібне використання максимально можливої кількості різноманітних комп'ютерних програм і максимально можливої кількості різноманітних текстів. Фактично, слід дотриматись умов справедливості закону великих чисел. Це задача для великої кількості дослідницьких груп і не під силу автору. Цю статтю слід розглядати як першу спробу такого роду, як формулювання самої ідеї саме такого алгоритму оцінювання інформаційної ємності мов. Автор закликає всіх бажаючих долучитись до такої роботи.
Цікаве дослідження науковця, варте нашої уваги і міркувань.
Дякую тобі, пане Валерію! Тема цікава. Закономірність є. Різниця між найтоншими та найтовщими перекладами становить 32%. Це значний показник. В мене також було систематично, що переклад з Англійської на Українську був менший на 20%, ніж з Англійської на російську.
Висновок я роблю не про ємність мови, а про ступінь неспівпадіння понять, або сенсових множин, що вимагає більшої кількості слів для передачі сенсу.
Тому інформаційна ємність мови в контексті статтідля мене є досить
непевним показником. Якість перекладу google translate недостатня для серйозного дослідження. Кращі варіанти - DeepL, але знову ж-таки це не про ємність, а про наявність відповідних сенсів у різних мовах. Прямого перекладу не буває. Кожна мова, яка притаманна місцевості чи культурі, відображає явища, властиві місцевості та культурі.
Коментарі
Дякую тобі, пане Валерію! Тема цікава. Закономірність є. Різниця між найтоншими та найтовщими перекладами становить 32%. Це значний показник. В мене також було систематично, що переклад з Англійської на Українську був менший на 20%, ніж з Англійської на російську.
Висновок я роблю не про ємність мови, а про ступінь неспівпадіння понять, або сенсових множин, що вимагає більшої кількості слів для передачі сенсу.
Тому інформаційна ємність мови в контексті статтідля мене є досить
непевним показником. Якість перекладу google translate недостатня для серйозного дослідження. Кращі варіанти - DeepL, але знову ж-таки це не про ємність, а про наявність відповідних сенсів у різних мовах. Прямого перекладу не буває. Кожна мова, яка притаманна місцевості чи культурі, відображає явища, властиві місцевості та культурі.