Rozważmy konlang przeznaczony do międzygwiazdowej transmisji do odbiorcy, który będzie musiał się zastanowić to na zewnątrz.

Myślę, że zostanie wymyślony w celu, formalnym i rygorystycznym. Pozornie przejdzie od notacji matematycznej lub algorytmów komputerowych do przedstawiania faktów dotyczących rzeczy w świecie rzeczywistym.

A więc poza oczywistymi rzeczownikami i czasownikami, ile naprawdę jest różnych „rodzajów” słów?

Czy ktoś wie coś o językach ontologicznych lub o Lożbanie ? Zastanawiam się, czy istnieją bardziej uniwersalne kategorie niż części mowy używane w języku angielskim.

Powód Pytam, ponieważ liczba kategorii pojawia się bezpośrednio w moim scenariuszu. Nie ma ortografii w konwencjonalnym sensie, ponieważ transmisja to po prostu zbiór liczb. Słowa są po prostu numerowane, więc coś takiego jak Rzeczownik # 42 byłoby literalną pisownią. Będą albo różne kody wprowadzające różne kategorie, albo kategoria będzie implikowana przez jej numer: Słowo # 42 jest rzeczownikiem ponieważ typ wynika z pozostałej części liczby modulo 7 (lub jakkolwiek wiele typów potrzebujemy).

Nie ma też rozróżnienia między słowami a interpunkcją. Grupowanie i separatory również wymagają własnych kodów i są kodowane w ten sam sposób.

Komentarze

  • Części mowy są rozróżniane na podstawie ich wzorców fleksji (lub ich braku) oraz dozwolonych kombinacji. Na przykład w języku łacińskim istnieją trzy bardzo różne wzory fleksji (koniugacja werbalna, deklinacja nominalna i zaimkowa); przysłówki, przyimki i spójniki nie mają odmiany, ale ich dozwolone kombinacje są różne (przysłówki z przymiotnikami lub czasownikami, przyimki z rzeczownikami lub grupami imiennymi, spójniki z grupami nominalnymi lub zdaniami). Gramatycy tworzą tabele ze wzorami fleksji i dozwolonymi kombinacjami; komórki są częściami mowy.
  • @AlexP zauważ, że podobnie jak we współczesnych językach komputerowych i notacji matematycznej, w konlangu nie będzie fleksji. Podoba mi się, do czego zmierzasz, pozwalając gramatyce sterować tym, co jest uważane za części mowy, jeśli chciałbyś przekształcić to w pełną odpowiedź.
  • O jaki język pytasz? Język angielski? Łacina?? Twój w dużej mierze niezdefiniowany conlang ??? Pytasz, czy są uniwersalia ???? Niejasne i zbyt szerokie IMHO
  • Fascynujące pytanie, na które nie ma odpowiedzi, dotyczy tego, czy istnieje głęboka gramatyka lub instynkt językowy ponad ' chęcią uczenia się, wbudowaną w nas na stałe . Jeśli tak, to czy jest to wyjątkowo ludzkie czy uniwersalne ssaki?
  • Warto przeczytać o niektórych językach, które nie należą do rodziny indoeuropejskiej. Xhosa, Navaho, Thai, … Każda próba skodyfikowania uniwersaliów nie powiodła się, jednak każde ludzkie dziecko nauczy się wszystkich ludzkich języków, które stanowią znaczną część jego wczesnego życia.

Odpowiedź

Części mowy to morfologiczne lub morfosyntaktyczne klasy słów. Nie wszystkie języki mają części mowy, ale w tych, które je posiadają, takich jak łacina, francuski lub angielski, części mowy są rozróżniane na podstawie ich wzorców fleksyjnych (lub ich braku) oraz dozwolonych kombinacji.

(Dla tych z nas, którzy mają doświadczenie z kompilatorami, części mowy są porównywalne z klasami tokenów rozpoznawanymi przez leksera, takimi jak identyfikatory, liczby, operatory i separatory.)

Na przykład w języku łacińskim istnieją trzy bardzo różne wzorce fleksji (koniugacja werbalna, deklinacja nominalna i deklinacja zaimkowa); przysłówki, przyimki i spójniki nie mają odmiany, ale ich dozwolone kombinacje są różne (przysłówki z przymiotnikami lub czasownikami, przyimki z rzeczownikami lub grupami imiennymi, spójniki z grupami nominalnymi lub zdaniami). Gramatycy tworzą tabele ze wzorami fleksji i dozwolonymi kombinacjami; komórki tabeli to części mowy.

Na przykład w języku angielskim możemy utworzyć następujące drzewo klasyfikacyjne:

  1. Czy słowo ma -ing forma, czas przeszły, czy może utworzyć czas przyszły z will ? Jeśli tak, to jest to zwykły czasownik . (Przykłady: być, pić, umieścić, zobaczyć, wziąć.)

  2. W przeciwnym razie, czy jeśli występuje w tej samej pozycji składniowej co zwykły czasownik? Jeśli tak, to jest to czasownik modalny . (Przykłady: może, może, powinien.)

  3. W przeciwnym razie:

    • Czy może określić czasownik? Jeśli tak, to jest to przysłówek . (Przykłady: szybko, szybko, naprawdę, dobrze.)

    • Czy może funkcjonować jako podmiot czasownika? Jeśli tak, to albo rzeczownik albo zaimek :

      • Czy słowo identyfikuje jeden konkretny obiekt?Jeśli tak, to jest to rzeczownik własny .

      • W przeciwnym razie czy można go określić przymiotnikiem? Jeśli tak, to jest to rzeczownik pospolity .

      • W przeciwnym razie jest to zaimek . (Zaimki angielskie można również rozpoznać po ich specyficznej fleksji).

    • Czy może określić rzeczownik? Jeśli tak, to jest to albo artykuł , albo przymiotnik albo liczebnik :

      • Czy słowo to może tworzyć stopnie porównania? (Mówiąc czysto morfologicznie – „bardziej unikalny” jest morfologicznie poprawny, chociaż logicznie głupi). Jeśli tak, jest to zwykły przymiotnik .

      • W przeciwnym razie, czy słowo należy do klasy przymiotników, które muszą występować z rzeczownikami używanymi jako podmiot lub dopełnienie bezpośrednie? Jeśli tak, to jest to artykuł lub demonstracyjny.

      • W przeciwnym razie, czy wyraża określoną liczbę? Jeśli tak, to jest to liczba .

    • Wiele słów należy do więcej niż jednej z tych klas. W szczególności ogromna większość rzeczowników może również funkcjonować jako przymiotniki i odwrotnie.

  4. W przeciwnym razie słowo musi być użyte bezpośrednio przed rzeczownik lub grupa nominalna czy bezpośrednio po czasowniku? Jeśli tak, to jest to przedpozycja.

  5. W przeciwnym razie czy można użyć tego słowa do łączenia rzeczowników, grup nominalnych, czasowników lub zdań ? Jeśli tak, to jest to łącznik.

  6. W przeciwnym razie znalazłeś słowo, którego nie można sklasyfikować w tym drzewie decyzyjnym. (Wskazówka: rozważ wykrzykniki , takie jak ah i oh.)

W języku angielskim , czasowniki mają inny wzór fleksji niż rzeczowniki i oba mają inny wzór fleksji niż zaimki; w przeciwieństwie do łaciny, angielski ma niewielką lub żadną różnicę między rzeczownikami i przymiotnikami (nie są one tak naprawdę różnymi częściami mowy w języku angielskim), ale w języku angielskim są przedimki. (Przedimki działają syntaktycznie dokładnie tak samo jak przymiotniki poglądowe, z tą różnicą, że o języku mówi się, że ma przedimki, jeśli istnieją konstrukcje składniowe, w których artykuł lub wskazówka jest absolutnie wymagana, a etykieta „artykuły” jest stosowana do tych przymiotników, które mają najsłabsze znaczenie .)

W językach o bogatej morfologii rozróżnienie między częściami mowy jest wyraźne, a struktura zdań jest przenoszona przez samą morfologię lub z niewielką pomocą ze strony kolejności słów.

Z drugiej strony ręka, język izolujący, taki jak mandaryński, nie ma żadnej odmiany (lub prawie żadnej); w takich językach pojęcie „części mowy” jest bardzo rozmyte i staje się porównywalne z różnicą między słowami kluczowymi a zwykłymi identyfikatorami w językach programowania. Angielski jest na dobrej drodze do tego; wiele angielskich słów może funkcjonować jako rzeczowniki, przymiotniki i czasowniki albo całkowicie niezmienione („one go ” – czasownik, „my mieliśmy go ” – rzeczownik, „wszystkie systemy są go „- przymiotnik; lub” idź do miejsca „- rzeczownik”, „do miejsca coś” – czasownik; lub ” napić się drinka „- rzeczownik,” pić coś „- czasownik) lub z niewielką zmianą (” czerwony „- przymiotnik lub rzeczownik;” na czerwono „) . W takich językach bez morfologii lub bardzo małej morfologii rozróżnienie między częściami mowy jest silnie osłabione, a struktura składniowa zdań jest reprezentowana przez kolejność słów, podobnie jak w językach programowania.

Na przykład po łacinie „puer puellam vidit”, „puellam puer vidit”, „vidit puellam puer” itd. wszystkie oznaczają „[the] boy saw [the] girl”, podczas gdy w języku angielskim żadna inna kolejność słów nie jest możliwa bez zmiany znaczenia lub wypowiedzenia niezrozumiałe.

Odpowiedź

Części mowy to tak naprawdę sztuczny podział wybrany przez ludzi do wyjaśnienia struktury naszego języka. Nie zawsze są idealnie dopasowane. Weźmy jako przykład japoński. Japoński ma „cząsteczki”, czyli słowa, które nie pasują do żadnej konkretnej kategorii, którą my anglojęzyczni rozpoznajemy. Istnieją również języki polisyntetyczne, w których pojedyncze słowo oddaje to, co my, anglojęzyczni, nazwalibyśmy zdaniem. Oczywiście w języku angielskim mamy kilka interesujących słów, takich jak konkretne przekleństwo zaczynające się na literę F, które wymyka się kategoryzacji (jak pokazano w tym zdecydowanie NSFW klipie z Boondock Saints ).

Interesującą opcją, która jest zgodna z numerowanymi słowami, jest przyjrzenie się językom używanym do opisu sieci semantycznych, takich jak RDF i OWL. Na przykład RDF jest niezwykle prosty. Istnieją trzy części „mowy”: podmioty, predykaty i obiekty. Podmioty i predykaty są zawsze „IRI”, które są z natury podobne do numerowanych słów. Obiekty są albo „wartościami typu danych” IRI, albo „wartościami typu danych”, które są konkretnymi wartościami, takimi jak liczby. To wszystko, a mimo to może opisywać świat z smakiem każdego bardziej zaawansowanego języka.

przykład RDF

Oczywiście, że nie. t wyślij go jako taki obraz. Wyrenderują zawartość w innym formacie, takim jak Turtle, który jest oparty na tekście i bardziej zwięzły z łatwiejszymi odpowiednikami do formatu komunikacji międzygwiezdnej:

<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ; 

OWL ma podobny charakter, ale jest raczej fascynujący, ponieważ może dość elegancko opisać swoją własną semantykę. Na przykład możesz mieć regułę „Wszystkie słowa, które są przedmiotem zdania, są również rzeczownikami”. Relacje te można określić z wystarczającą regularnością, aby użytkownicy OWL mogli używać „rozumowania” do wypełniania relacji, które nie zostały wyraźnie zapisane w dokumencie.

Fantastyczna siła tych języków semantycznej sieci polega na tym, że jeśli ktoś nie określił semantyki tego, co słowo # 42 powinno oznaczać w określonej konstrukcji, lub jeśli nie ma słowa, które spełniałoby twoje potrzeby, możesz nadać mu semantykę. Następnie możesz zapisać tę semantykę (zazwyczaj w ontologii OWL). Inni mogą czytać tę semantykę i działać zgodnie z nią algorytmicznie. Mogę więc zdefiniować nowe Słowo # 3.14, którego nigdy wcześniej nie widziałeś, i mogę to zrobić w taki sposób, abyś miał szansę zrozumieć, co mam na myśli!

Ta semantyczna zdolność byłaby niezwykle ważna, gdyby opóźnienia były duże. Języki ewoluują w czasie i jeśli między komunikacją jest wystarczająco dużo czasu, rozsądnie jest sądzić, że znaczenie rzeczownika 42 może się zmienić w jednej kulturze, a nie w drugiej. Możliwość przynajmniej próby uchwycenia semantyki tego, co mówisz, byłaby bardzo ważna w zwalczaniu tych efektów.

Komentarze

  • To ' jest bardzo podobny do tego, o czym myślałem. Głównym przykładem (i tym, co chcę zrozumieć na tyle dobrze, aby wyrenderować) jest strona, na której mówią nam rzeczy, które już wiemy: właściwości naszego Układu Słonecznego, w tym takie elementy, jak masa, promień i parametry orbitalne planet. To głównie atrybuty imion
  • Z wyjątkiem tego, że tematy, predykaty i obiekty są częściami zdania a nie częściami mowy , to znaczy należą do składnia , a nie morfologia . To jest błąd kategorii. Zarówno słowo ” he „, jak i słowo ” czytelnik ” może funkcjonować jako podmioty lub obiekty (części składniowe lub zdanie), ale ” on ” jest zaimkiem, a ” czytelnicy ” to rzeczownik (morfologiczne części mowy). (Słowo ” czytelnik ” może być określone przez przedimek lub przymiotnik i oznacza liczbę mnogą w -s ; następnie słowo ” he ” nie może być określone przez przedimek lub przymiotnik i ma osobliwą odmianę).
  • @AlexP W takim przypadku przypuszczam, że ” części mowy ” byłyby IRI i typem danych w tych językach. ' Będę musiał pomyśleć, jak najlepiej to wyrazić. Czułem, że już stracę czytelnika, próbując zagłębić się w języki na tyle, by związać go z pytaniem.
  • Świetna uwaga dotycząca opóźnienia w komunikacji i konotacji zmieniających się słów. ' wyobrażam sobie kosmitów z Gliese 581 c, którzy nauczyli się angielskiego od Flintstonów i witają nas, życząc nam ” gejów z dawnych czasów „. Chciałbym również dać Ci dodatkowe punkty za odniesienie do Boondock Saints.

Odpowiedź

Język można podzielić na kilka warstw.

  • Fonologia to badanie najmniejszych niepodzielnych fragmentów, z których zbudowany jest język. Odnosi się to do dźwięków, takich jak / g / lub / k / w mówionym języku ludzkim. Jeśli twoi lingwiści studiowali transmisję radiową, może to być bit komputerowy lub inny podobny konstrukt.
  • Morfologia to nauka o najmniejszych fragmentach języka, które niosą ze sobą znaczenie. Morfemy są oczywiście zbudowane z różnej liczby fonemów. Przykładem morfemu może być -ist w morfologu, który niesie znaczenie, mimo że nie może sam z siebie stać. Części mowy mieszczą się w tej dziedzinie.
  • Składnia to nauka o tym, jak użytkownicy łączą morfemy, aby tworzyć zdania poprawne gramatycznie. Na przykład: „Kot przeszedł przez górę łapami”. jest niegramatyczny, mimo że jest zrozumiały.
  • Semantyka to nauka o tym, co znaczą zdania. „Kot przeleciał przez góry za wąsy”. jest gramatyczna i ma znaczenie semantyczne. Co okazuje się być nonsensem.
  • Pragmatyka to nauka o tym, jak język odnosi się do świata zewnętrznego. Na przykład: „Czy mógłbyś zamknąć drzwi?”to semantycznie pytanie, ale pragmatycznie jest to prośba (w języku angielskim). Innym przykładem są kontrakty. Mówiąc tak, nie tylko mówisz, że akceptujesz umowę, ale samo stwierdzenie jest tym, co sprawia, że umowa jest ważna .

Semantyka i pragmatyka są bardzo dziedzinami zrozumiałymi.

Aby przeanalizować transmisję od obcego gatunku, należałoby określić, czym jest fonologia, a następnie przejść przez każdą warstwę, próbując dowiedzieć się, jak można łączyć poszczególne elementy w prawidłowy i nieprawidłowy sposób.

Odnosząc się konkretnie do części mowy, obawiam się, że system klasyfikacji różni się w zależności od języka, ponieważ nie klasyfikujemy według jakiegoś uniwersalnego systemu, rozróżniamy słowa na te same części mowy, których używa gramatyka tego języka .

Lożban (ponieważ ty zapytany) nie ma odrębnych czasowników, rzeczowników, przysłówków i przymiotników. Ma predykaty, takie jak „prenu” (jest osobą) lub „xamgu” (jest dobre). Można powiedzieć „l e xamgu ku ”(rzecz, która jest dobra) lub„ le prenu ku ”(rzecz, która jest osobą lub po prostu„ osobą ”) i w niektórych przypadkach wiele z tych cząstek można pominąć, np. „.i prenu cu xamgu” (osoba jest dobra) zamiast „.i le prenu ku cu xamgu”. To zjawisko (argumenty predykatu) jest trochę podobne do wyrażeń rzeczownikowych w języku angielskim, ale język nie czyni absolutnie żadnego rozróżnienia między tym, co można by uznać za czasowniki i przymiotniki, ani też nie należy próbować klasyfikować ich w ten sposób.

Komentarze

  • ” ” Kot przeleciał przez górę, trzymając wąsy. ” /…/ to nonsens. ” Jesteśmy na Worldbuilding . Nie ' nie byłbym tego taki pewien.
  • Przez « nie ma absolutnie żadnego rozróżnienia między czasownikami a przymiotnikami. » Przypuszczam, że masz na myśli kwestię składni; na przykład „Jest czerwony” i „działa” to predykaty obsługiwane w ten sam sposób. Ale strona w relacji i atrybut wewnętrzny to semantycznie różne rodzaje rzeczy.

Odpowiedź

A „część mowa ”to tylko schemat klasyfikacji, narzucony językowi przez badaczy, w celu opisania klas słów. Te grupy opierają się na funkcji gramatycznej tych słów i to „tam, gdzie otrzymujemy„ rzeczownik ”,„ czasownik ”i„ przyimek ”; opisują one klasy słów w języku angielskim. Ale masz też rzeczowniki, które zachowują się jak czasowniki („ Wygoogluj to. ”) I wiele innych dziwnych konstrukcji, które powodują, że każda„ część mowy ”jest podzielona na jej własną część mowy, aż do jej zakończenia.

Nie ma więc liczby dla sumy całkowitej „wszystkich rodzajów części mowy”. Angielski ma jeden rodzaj przysłówka, a japoński trzy. Czy są to oddzielne części mowy, czy nie?

Teraz Jeśli chcesz sklasyfikować symbole w swoim języku, to jest całkiem niezły przewodnik. Kontakt Carla Sagana rozwiązuje dokładnie opisywany problem; musisz zacząć od pierwszych zasad i wbudować je w złożony język. SETI próbował wymyślić właśnie taką wiadomość i jest to naprawdę trudne.

Jeśli możesz wysyłać zdjęcia, potrzebujesz tylko jednej „części wypowiedzi”, RZECZY. RZECZ, możesz określić rzeczowniki; gdy masz rzeczownik (ATOM), możesz utworzyć „rzecz równości” (ATOM = ATOM), a następnie przejść dalej, określając RZECZY, które są liczbami, licząc rzeczy itp.

Możesz użyć składni do wyjaśnienia pojęć, takich jak zmiana w czasie (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), ale wszystko jest tylko RZECZY > Jeśli brzmi to zbyt zawzięcie (, ponieważ jest to ), możesz zajrzeć do teorii kodowania; czego naprawdę chcesz to algorytm kompresji / algorytm parzystości, który wyjaśnia matematykę za pomocą symboli ogólnych.

Komentarze

  • ” Rzecz ” nie ma żadnego znaczenia, ponieważ nie ma różnic. Ale Twój przykład zawiera proton (rzeczownik, rodzajowy), = (określ relację), + (wykonaj operację), , i ( ) (struktura). Tak, wszystkie są słowami, które można zakodować; stwierdzenie, że nic nie dodaje.
  • « rzeczowniki, które działają jak czasowniki » Twój przykład to czasownik, który pochodzi od rzeczownika i jest używany jako czasownik (czynności). Może chciałeś przyjrzeć się gerundom (lub co jest przeciwieństwem tego)?
  • ” Rzecz ” nie była najlepsze słowo, ponieważ naprawdę mam na myśli więcej ” symbolu opisującego obiekt.” ” Google ” to nazwa właściwa dla wyszukiwarki, ale może to być używany jako czasownik do opisania operacji wyszukiwania w sieci teraz. Chciałem powiedzieć, że (1) naprawdę chcesz przyjrzeć się metodzie kodowania rzeczowników jako symboli, a nie ” słów ” lub ” części mowy, ” i (2) z przemyślanym kontekstem i organizacją, możesz używać tylko rzeczowników (i rzeczowników-as -verbs) do przekazywania złożonych pomysłów, a (3) ” części mowy ” nie mają znaczenia dla twojego przypadku użycia, czego naprawdę potrzebujesz to metoda kodowania symboli obiektów.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *