2024-09-11 22:23:30 JPM redakcja1 K

Nowe spojrzenie na nasze językowe korzenie

Kontrowersyjna technika analityczna oferuje nowe odpowiedzi dla języków indoeuropejskich.

Źródło: Roman Rybalko via Getty 

Prawie połowa ludzi na świecie posługuje się dziś językiem indoeuropejskim, którego początki sięgają tysięcy lat wstecz do jednego języka ojczystego. Języki tak różne, jak angielski, rosyjski, hindustani, łacina i sanskryt wywodzą się właśnie z tego języka. 

W ciągu ostatnich kilkuset lat lingwiści dowiedzieli się wiele o tym pierwszym języku indoeuropejskim, w tym o wielu używanych w nim słowach i niektórych zasadach gramatycznych, które nim rządziły. Po drodze wymyślili teorie na temat tego, kim byli jego pierwotni użytkownicy, gdzie i jak żyli oraz w jaki sposób ich język rozprzestrzenił się tak szeroko. 

Większość lingwistów uważa, że byli to koczowniczy pasterze, którzy żyli na stepach Ukrainy i zachodniej Rosji około 6000 lat temu. Mniejszość uważa jednak, że pochodzenie tego języka datuje się na 2000 do 3000 lat wcześniej i że była to społeczność rolników w Anatolii, na obszarze dzisiejszej Turcji. Teraz nowa analiza, wykorzystująca techniki zapożyczone z biologii ewolucyjnej, wypadła na korzyść tej drugiej, choć z ważną późniejszą rolą stepów. 

Technika obliczeniowa zastosowana w nowej analizie jest przedmiotem gorących dyskusji wśród językoznawców. Jednak jej zwolennicy twierdzą, że obiecuje ona wprowadzić więcej ścisłości w tej dziedzinie i może przesunąć kluczowe daty jeszcze dalej w przeszłość, podobnie jak datowanie radiowęglowe w dziedzinie archeologii. 

„Myślę, że językoznawstwo może być swego rodzaju odpowiednikiem rewolucji radiowęglowej”, mówi Paul Heggarty, językoznawca historyczny z Pontificia Universidad Católica del Perú w Limie i współautor nowego badania; opisał metodę obliczeniową w 2021 Annual Review of Linguistics. 

Odkrywanie martwych języków 

Aby zrozumieć, co się dzieje, warto przyjrzeć się rozwojowi badań nad językami indoeuropejskimi. 

W XVI wieku, gdy podróże i handel sprawiły, że Europejczycy mieli kontakt z większą liczbą języków obcych, naukowcy zaczęli coraz bardziej interesować się tym, w jaki sposób języki są ze sobą powiązane i gdzie mogły powstać. 

Pod koniec XVIII wieku Sir William Jones, brytyjski sędzia w Indiach, zauważył podobieństwa w słownictwie i gramatyce sanskrytu, łaciny i greki, które nie mogły być przypadkowe. 

Na przykład angielskie słowo „father” to „pitar” w sanskrycie i „pater” w łacinie i grece. „Brother” to „bhratar” w sanskrycie, „frater” w łacinie. Chociaż Jones nie był tak naprawdę pierwszym, który zauważył te podobieństwa, jego stwierdzenie, że musi istnieć wspólne pochodzenie, pomogło pobudzić ruch porównywania języków i śledzenia ich związków. 

Znaczący postęp nastąpił w 1882 roku, kiedy Jacob Grimm sformułował to, co później nazwano Prawem Grimma. Grimm jest dziś najbardziej znany jako połowa braci Grimm, którzy zebrali i opublikowali Baśnie Grimmów. Jednak oprócz bycia miłośnikiem folkloru, Jacob Grimm był także ważnym lingwistą. 
 
Grimm wykazał, że w miarę rozwoju języków dźwięki zmieniały się w regularny sposób, co mogło pomóc w zrozumieniu, w jaki sposób języki były ze sobą powiązane. Na przykład indoeuropejskie słowo oznaczające „two” brzmiało „dwo”. Jednak „dwo” było jednym z wielu słów, których początkowe „d” zmieniło się w „t”, gdy przeszło do wspólnego przodka angielskiego i niemieckiego. Później dźwięk „t” stał się „ts” w przodku współczesnego niemieckiego. Tak więc indoeuropejskie słowo „dwo” stało się „two” w języku angielskim i „zwei” (wymawiane jako „tsvai”) we współczesnym języku niemieckim. Inne słowa zaczynające się od dźwięku „d” zachowywały się podobnie. Naukowcy odkryli wiele takich wzorców zmian dźwięków, z których każdy podlegał innym zasadom, gdy jeden język rodził drugi. 
 
Wraz z tymi zmianami dźwięków, lingwiści badają również sposób tworzenia słów, na przykład sposób, w jaki angielski dodaje „s”, aby słowo było w liczbie mnogiej. Przyglądają się także temu, jak słowa są ułożone, na przykład, w jaki sposób angielski umieszcza podmioty przed czasownikami i czasowniki przed dopełnieniami. I oczywiście przyglądają się wspólnemu słownictwu. Porównując wszystkie te cechy różnych języków, lingwiści są w stanie określić, w jaki sposób języki wywodzą się od siebie nawzajem i umieścić je w drzewach genealogicznych, które pokazują ich relacje. 

Obecnie lingwiści są zgodni co do podstaw indoeuropejskich grup językowych i ich wzajemnych powiązań. Zgadzają się, że pierwotny język, który nazywają praindoeuropejskim, podzielił się na 10 lub 11 głównych gałęzi, z których dwie obecnie wymarły. 
 
Ogólnie są również zgodni co do tego, gdzie umieścić języki w ramach głównych gałęzi. Na przykład wiadomo, że gałąź italska dała nam łacinę, która z kolei rozwinęła się w języki romańskie, takie jak francuski, hiszpański i włoski. Gałąź germańska rozwinęła się w języki takie jak niemiecki, holenderski i angielski. Gałąź indoirańska zaowocowała językami takimi jak hindi, bengalski, perski i kurdyjski. 

Styl życia przodków

Śledząc wstecz zmiany w języku w kierunku ich źródeł, lingwiści wydedukowali wiele podstawowych cech oryginalnego języka praindoeuropejskiego, w tym niektóre słownictwo, sposób tworzenia słów i pewne wyobrażenie o tym, jak były wymawiane. Wielu lingwistów uważa, że znaleźli nawet wskazówki dotyczące tego, jak mogli żyć pierwsi Praindoeuropejczycy. 
 
Na przykład, język praindoeuropejski miał słowo na oś, dwa słowa na koło, słowo na uprząż i czasownik oznaczający „przewozić za pomocą pojazdu”. Archeolodzy wiedzą, że technologia kół i osi została wynaleziona około 6000 lat temu, co sugeruje, że język pratoindoeuropejski nie może być starszy. Gdyby był starszy – innymi słowy, gdyby zaczął dzielić się na inne języki, zanim pojawiły się w nim słowa na osie i słupy – wówczas jego języki potomne musiałyby wymyślić własne słowa na te rzeczy. Fakt, że używają tych samych słów, sugeruje, że podział rozpoczął się po opracowaniu tych technologii. 

Inne słowa w tym języku sugerują, że pierwsi Indoeuropejczycy byli prawdopodobnie zaznajomieni z końmi, hodowlą bydła i owiec, nabiałem, wełną, miodem i miodem pitnym. Wydaje się, że mieli wodzów (słowo „reg” dało nam angielskie słowo „regal”) i mogli być patriarchalni (mieli słowa oznaczające „teściów”, które odnosiły się tylko do strony rodziny panny młodej, co sugeruje, że rodzina męża była uważana za nadrzędną). 

Wielu lingwistów uważa, że słownictwo to przedstawia obraz pasterzy, koczowniczych hodowców, którzy używali koni i wozów. W połączeniu z dowodami genetycznymi, że ludzie szybko rozproszyli się ze stepów do Europy Środkowej około 5000 lat temu, wyciągnięto wniosek, że języki indoeuropejskie przeniosły się ze stepów i rozprzestrzeniły się wraz z pasterzami. 

Jednak w 1987 r. archeolog z Cambridge Colin Renfrew odrzucił pasterskie pochodzenie języka indoeuropejskiego. Renfrew argumentował, że radykalne rozprzestrzenienie się języków indoeuropejskich musiało wymagać większego impulsu niż ten, który mógł być zapewniony przez kontakt z grupami koczowniczych pasterzy. Renfrew twierdzi, że do poważnej zmiany, w której jeden język zdominował region rozciągający się od Irlandii po Indie, potrzebna była potężniejsza siła. 

Znalazł ją w rozprzestrzenianiu się rolnictwa. Mówiąc prościej, gdy ludzie zaczęli uprawiać ziemię, ich populacja rosła szybciej niż populacja ich sąsiadów zajmujących się łowiectwem i zbieractwem. Wraz z rozwojem rolnictwa rozwijały się języki. Dowody archeologiczne pokazują, że rolnictwo zaczęło się wyprowadzać z Anatolii około 3000 lat wcześniej niż rozprzestrzenianie się pasterzy ze stepów. Zatem Renfrew doszedł do wniosku, że to rolnicy byli faktyczną siłą stojącą za rozprzestrzenianiem się języka indoeuropejskiego. Zanim pasterze zaczęli migrować, napotkani przez nich rolnicy mówili już językiem indoeuropejskim. 

Renfrew w dużej mierze odrzucił lingwistyczne argumenty, na których opierała się hipoteza stepowa. Powiedział, że podobieństwo słów oznaczających koło, wagon i tym podobne można wyjaśnić równoległymi zmianami, w których różne języki czerpią z tego samego podstawowego znaczenia podczas tworzenia nowego słowa. 

Na przykład, pierwotne znaczenie praindoeuropejskiego słowa oznaczającego koło wydaje się oznaczać coś w rodzaju koła lub obrotu. Różne języki mogły odziedziczyć to podstawowe znaczenie i czerpać z niego niezależnie, tworząc własne słowa dla koła. 

Podobnie, jeśli słowo „thill” oznaczające dyszel miało bardziej ogólne znaczenie kija lub tyczki, mogło zostać zaadoptowane jako oznaczające dyszel przez więcej niż jeden język. 

Poszukując dokładności 

Argumenty takie, jak te skłoniły kilku lingwistów do wypróbowania bardziej ilościowego podejścia do rekonstrukcji historii języka indoeuropejskiego. W tym celu zapożyczyli technikę często stosowaną w biologii do budowania drzew ewolucyjnych na podstawie mierzalnych cech. Ich podejście, zwane filogenetyką obliczeniową, traktuje języki jako ewoluujące systemy, podobne do organizmów biologicznych. Jednak, zamiast śledzić zmiany w DNA, jak robi to filogenetyka obliczeniowa w biologii, technika w językoznawstwie śledzi słowa. W szczególności większość analiz dotyczyła wzorców słów, które oznaczają to samo w różnych językach i które można prześledzić wstecz do tego samego korzenia praindoeuropejskiego. Im bardziej podobne są te wzorce, tym bliżej spokrewnione są języki. 

Choć może to brzmieć jak drzewa językowe od dawna używane przez lingwistów, drzewa tworzone przez filogenetykę obliczeniową są znacznie mniej subiektywne: metoda ta opiera się na ścisłych algorytmach i wyraźnie określonych zasadach. 

Zasadniczo program komputerowy polega na narysowaniu drzewka językowego i oszacowaniu prawdopodobieństwa, że jest ono poprawne, biorąc pod uwagę wszystkie dane i założenia. Następnie program dokonuje pojedynczej zmiany w tym drzewie i porównuje wyniki prawdopodobieństwa, zachowując to, które drzewo jest bardziej prawdopodobne. Proces ten jest powtarzany, czasami miliony razy, w wyniku czego powstaje zestaw najbardziej prawdopodobnych drzew. 

Drzewa te pokazują, jak blisko spokrewnione są ze sobą języki. Aby oszacować ramy czasowe – kiedy języki powstały i różniły się od siebie – naukowcy dostarczają również programowi komputerowemu daty, kiedy ich zdaniem istniały różne języki, na podstawie najlepszych oszacowań ekspertów. Na przykład łacina istniała około 2 050 lat temu, język staroislandzki około 800 lat temu, a greka mykeńska około 3 350 lat temu. Program komputerowy wykorzystuje te podstawowe daty do tworzenia szacunków czasowych, w tym do określenia ostatecznej daty powstania języka indoeuropejskiego. 

Wyniki można połączyć z historycznym zapisem miejsc, w których mówiono językami, aby pomóc w ustaleniu prawdopodobnej mapy ich geograficznego rozprzestrzeniania się. Daty można połączyć z zapisem archeologicznym i badaniami starożytnego ludzkiego DNA, aby sprawdzić, czy język indoeuropejski jest zgodny z wczesnym pochodzeniem rolniczym, czy późniejszym pochodzeniem stepowym. 

Sprzeczne wyniki 

Jedna z takich analiz, opublikowana w 2012 roku, wskazywała na pochodzenie indoeuropejskiego około 9000 lat temu w Anatolii, wspierając teorię, że indoeuropejski pochodzi od rolników. Jednak zaledwie trzy lata później inny zespół wykorzystał te same dane, aby stwierdzić, że pochodzenie miało miejsce zaledwie 6000 lat temu na stepach, wspierając przeciwny pogląd, że pasterze byli pierwszymi użytkownikami języka indoeuropejskiego. Jak te dwa zespoły mogły dojść do tak różnych wniosków z tak podobnej listy słów? 

Heggarty zagłębił się w problem i odkrył, że problem tkwił w zbiorze danych wykorzystanym do obu wcześniejszych analiz, który w dużej mierze opierał się na zbiorze danych pierwotnie opracowanym w latach 60. przez Isidore'a Dyena, językoznawcę z Uniwersytetu Yale. Zestaw danych Dyena nie stanowił problemu dla badań, które prowadził Dyen, ale gdy został użyty w nowej technice obliczeniowej, zakłócał wyniki. Filogeneza obliczeniowa działa najlepiej, gdy istnieje jedno słowo dla każdego znaczenia korzenia, które badacze chcą prześledzić. Jednak na przykład znaczenie „dirty” może mieć wiele synonimów w języku angielskim, w tym „filthy” i „unclean”. Zbiór danych Dyen zawierał takie synonimy dla niektórych słów w niektórych językach, ale nie dla innych. 

Heggarty zdał sobie sprawę, że uwzględnienie jakichkolwiek synonimów utrudniło wykorzystanie zbioru danych przez nową technikę obliczeniową. Natomiast niespójna liczba synonimów – większa dla niektórych języków, mniejsza dla innych – poważnie zakłócała obliczenia. „Powiedziałem: „Słuchaj, musimy zrobić tę bazę danych całkowicie od nowa, od zera. Musimy zrobić to znacznie lepiej””, mówi Heggarty. 

Tak więc on i jego koledzy wybrali 170 podstawowych znaczeń, które chcieli prześledzić – podstawowe słowa, których zachowania można oczekiwać od języków, takie jak słowa do obliczania liczb, części ciała, kolory i rzeczy takie jak dom, góra, śmiech i noc. Następnie zebrali zespół ponad 80 lingwistów i poprosili ich o określenie, dla każdego ze 161 języków indoeuropejskich, podstawowego słowa dla każdego pojęcia. Tylko to słowo, bez synonimów, zostało uwzględnione w analizie. 

„Stworzyliśmy z tego bardzo spójną bazę danych, w sposób, w jaki nikt nigdy wcześniej tego nie zrobił”, mówi Heggarty. „Przeprowadziliśmy też wiele analiz, aby upewnić się, że wybraliśmy najbardziej odpowiednie znaczenia. Jeśli nie zrobisz tego z należytą starannością, wyniki nie będą miarodajne”. 

Kiedy zespół Heggarty'ego powtórzył analizę z tą nową bazą danych, ich ustalenia zasadniczo zgadzały się z wcześniejszą teorią dotyczącą rolniczego pochodzenia, lokalizując początki w Anatolii około 8000 lat temu. Stamtąd niektóre gałęzie języka przeniosły się na wschód i dały początek językom takim jak perski i hindustani. Inne gałęzie przeniosły się na zachód, by ostatecznie przekształcić się w język grecki i albański. 

Jednak analiza uznaje również stepy za odgrywające ważną rolę jako drugorzędna ojczyzna dla większości języków europejskich: Po tym, jak jedna gałąź powędrowała na północ z Anatolii na stepy, promieniowała stamtąd do północnej Europy, dając początek językom germańskim, italskim, gaelickim i innym europejskim rodzinom językowym. 

Bez przekonania

Językoznawcy historyczni głównego nurtu pozostają jednak sceptyczni — ogólnie wobec filogenetyki obliczeniowej, a w szczególności wobec nowego wyniku. Głównym zarzutem jest to, że podejście to opiera się głównie na słownictwie i ignoruje dźwięki i struktury słów, takie jak rdzeń, przedrostki i przyrostki, które składają się na słowo. Krytycy twierdzą, że same znaczenia słów nie dają wystarczających informacji do wyciągnięcia konkretnych wniosków, bez względu na to, jak zaawansowane są obliczenia. 
 
Thomas Olander, lingwista historyczny z Uniwersytetu w Kopenhadze, twierdzi, że problem z poleganiem na pokrewnych słowach polega na tym, że języki cały czas zapożyczają słowa od siebie nawzajem. Sam fakt, że istnieją słowa wspólne dla dwóch języków, nie oznacza, że języki te pochodzą od tego samego rodzica. Na przykład fakt, że użytkownicy języka angielskiego używają obecnie słowa „sushi”, nie oznacza, że angielski i japoński są językami pokrewnymi. 
 
Zamiast tego większość lingwistów ma tendencję do ufania przesunięciom dźwięków – takim jak przesunięcie „dwo” – „two” – „zwei” – wraz z podobieństwami w strukturze słów, które mogą wskazywać, z którego języka pochodzą. Znaczenia słów mogą być również częścią tej mieszanki, ale nie mogą tego zrobić same, mówi Olander. 
 
Drzewo Heggarty'ego ma również inne problemy. Na przykład, pokazuje języki celtyckie jako blisko spokrewnione z językami germańskimi. Olander twierdzi jednak, że większość lingwistów historycznych uważa, że języki celtyckie są znacznie bliżej spokrewnione z językami italskimi. 
 
„To coś, co po raz kolejny jest zaskakujące”, mówi Olander. „Myślę, że »zaskakujące« można przetłumaczyć na: »To prawdopodobnie oznacza, że ich metoda jest błędna«”. 
 
Olander uważa, że znacznie bardziej prawdopodobne jest to, że celtyckie i germańskie gałęzie blisko współistniały przez długi czas i pożyczały sobie nawzajem słowa. Analiza oparta wyłącznie na wspólnych znaczeniach słów pokazuje je jako bliżej spokrewnione, niż są w rzeczywistości, mówi. 
 
James Clackson, lingwista z Uniwersytetu Cambridge, również uważa wczesną datę powstania praindoeuropejskiego i inne szczegóły drzewa za nieprzekonujące. Uważa jednak, że filogenetyka obliczeniowa jest warta kontynuacji. Jego zdaniem najnowsze badania stworzyły bardzo wysokiej jakości nowy zbiór danych, który będzie ważny dla językoznawców historycznych, którzy starają się wyjaśnić wiele nierozwiązanych kwestii w swojej dziedzinie. 
 
W międzyczasie zwolennicy filogenetyki obliczeniowej będą prawdopodobnie nadal promować swoje metody i szukać legitymizacji w szerszej dyscyplinie. Heggarty uważa, że gdy językoznawcy głównego nurtu poczują się bardziej komfortowo z metodą i wysokiej jakości danymi, których używa, mogą dać jej więcej posłuchu. 
 
Clackson, na przykład, mówi, że jest gotów dać się przekonać. „To rozwijająca się dziedzina i warto mieć ją na oku”, mówi. 

Dział: Świat

Autor:
Kurt Kleiner, Knowable Magazine | Tłumaczenie: Walery Jasnorzewski – praktykant fundacji: https://fundacjaglosmlodych.org/praktyki/

Źródło:
https://arstechnica.com/science/2024/02/a-new-look-at-our-linguistic-roots/

Udostępnij
Nie ma jeszcze żadnych komentarzy.
Wymagane zalogowanie

Musisz być zalogowany, aby wstawić komentarz

Zaloguj się

INNE WIADOMOŚCI


NAJCZĘŚCIEJ CZYTANE