Zvažte conlang navržený pro mezihvězdný přenos příjemci, který bude muset zjistit do toho.
Myslím, že to bude vynalezeno za účelem, formálním a pečlivým. Zdá se, že to povede k přechodu od matematické notace nebo počítačových algoritmů ke konstatování faktů o skutečných věcech.
Takže kromě zjevných podstatných jmen a sloves, kolik různých „druhů“ slov existuje, ve skutečnosti?
Ví někdo něco o ontologických jazycích nebo Lojban ? Zajímalo by mě, jestli existuje více univerzálních kategorií než slovní druhy používané v angličtině.
Důvod Ptám se proto, že počet kategorií se zobrazuje přímo v mém scénáři. Neexistuje žádný pravopis v konvenčním smyslu, protože přenos je jen spousta čísel. Slova jsou jednoduše očíslovaná, takže něco jako podstatné jméno # 42 by bylo doslovný pravopis. Budou existovat různé kódy zavádějící různé kategorie, nebo bude kategorie implikována jejím počtem: Word # 42 je podstatné jméno, protože typ je implikován zbytkem čísla modulo 7 (nebo jakkoli mnoho typů potřebujeme).
Rovněž neexistuje rozdíl mezi tím, co považujeme za slova a interpunkci. Seskupování a oddělovače také potřebují své vlastní kódy a jsou kódovány stejným způsobem.
Komentáře
- Řeči se rozlišují podle jejich vzorů inflexe (nebo jejich nedostatku) a jejich povolených kombinací. Například v latině existují tři velmi odlišné vzorce skloňování (slovní konjugace, nominální a pronominální deklinace); příslovce, předložky a spojky nemají skloňování, ale jejich povolené kombinace jsou odlišné (příslovce s přídavnými jmény nebo slovesy, předložky s podstatnými jmény nebo jmennými skupinami, spojky s nominálními skupinami nebo větami). Gramatici vytvářejí tabulky s inflexními vzory a povolenými kombinacemi; buňky jsou části řeči.
- @AlexP, všimněte si, že stejně jako moderní počítačové jazyky a matematická notace, v conlangu nebudou žádné skloňování. Líbí se mi, kam se chystáte, pokud chcete nechat gramatiku řídit to, co se považuje za slovní druhy, pokud byste se chtěli z toho vyvinout do úplné odpovědi.
- Na jaký jazyk se ptáte? Angličtina? Latinský?? Váš převážně nedefinovaný vztah ??? Ptáte se, zda existují univerzálie ???? Nejasné a příliš široké IMHO
- Fascinující a nezodpovězenou otázkou je, zda nad dětskou ‚ touhou učit se, pevně spojenou s námi, existuje nějaká hluboká gramatická nebo jazyková pudovost . Pokud ano, je to jednoznačně člověk nebo savec univerzální?
- Stojí za to si přečíst o některých jazycích, které nejsou v indoevropské rodině. Xhosa, Navaho, Thai, … Každý pokus o kodifikaci univerzálií selhal, přesto se každé lidské dítě naučí všechny lidské jazyky, které tvoří významnou součást jeho raného života.
Odpověď
Řeči jsou morfologické nebo morfosyntaktické třídy slov. Ne všechny jazyky mají části řeči, ale v těch, které je mají, jako je latina, francouzština nebo angličtina, se jednotlivé části řeči rozlišují podle jejich vzorů flexe (nebo jejich nedostatku) a jejich povolených kombinací.
(Pro ty z nás, kteří mají zkušenosti s překladači, jsou části řeči srovnatelné s třídami tokenů rozpoznávaných lexerem, jako jsou identifikátory, čísla, operátory a oddělovače.)
Například v latině existují tři velmi odlišné vzorce skloňování (verbální konjugace, nominální deklinace a pronominální deklinace); příslovce, předložky a spojky nemají skloňování, ale jejich povolené kombinace jsou odlišné (příslovce s přídavnými jmény nebo slovesy, předložky s podstatnými jmény nebo jmennými skupinami, spojky s nominálními skupinami nebo větami). Gramatici vytvářejí tabulky s inflexními vzory a povolenými kombinacemi; buňky tabulky jsou částí řeči.
Například v angličtině můžeme vytvořit následující klasifikační strom:
-
Má slovo an -ing forma, minulý čas, může to vytvořit budoucí čas s vůlí ? Pokud ano, pak se jedná o běžné sloveso . (Příklady: be, drink, put, see, take.)
-
Jinak se může, pokud se jeví ve stejné syntaktické pozici jako běžné sloveso? Pokud ano, pak se jedná o modální sloveso . (Příklady: může, může, může.)
-
Jinak:
-
Může určit sloveso? Pokud ano, pak se jedná o příslovce . (Příklady: rychle, rychle, pravdivě, dobře.)
-
Může fungovat jako předmět slovesa? Pokud ano, pak se jedná buď o podstatné jméno , nebo o zájmeno :
-
Identifikuje slovo jedno konkrétní objekt?Pokud ano, jedná se o vlastní podstatné jméno .
-
Jinak jej lze určit přídavným jménem? Pokud ano, pak se jedná o běžné podstatné jméno .
-
Jinak se jedná o zájmeno . (Anglická zájmena lze identifikovat také podle jejich zvláštní skloňování.)
-
-
Může určit podstatné jméno? Pokud ano, pak je to buď článek , nebo adjektivum nebo číslice :
-
Může slovo tvořit stupně srovnání? (Čistě morfologicky řečeno – „jedinečnější“ je morfologicky správné, i když logicky hloupé.) Pokud ano, jedná se o obyčejné adjektivum .
-
Jinak, je slovo jedním z třídy adjektiv, která se musí objevit u podstatných jmen používaných jako předměty nebo přímé předměty? Pokud ano, pak se jedná o článek nebo demonstrativní.
-
Jinak vyjadřuje konkrétní číslo? Pokud ano, pak se jedná o číslo.
-
-
Mnoho slov patří do více než jedné z těchto tříd. Převážná většina podstatných jmen může fungovat zejména jako adjektiva a naopak.
-
-
Jinak musí být slovo použito bezprostředně před podstatné jméno nebo jmenná skupina, nebo bezprostředně za slovesem? Pokud ano, pak se jedná o prepozici.
-
Jinak lze toto slovo použít k propojení podstatných jmen, jmenných skupin nebo sloves nebo vět ? Pokud ano, pak je to spojení.
-
Jinak jste našli slovo, které nelze podle tohoto rozhodovacího stromu klasifikovat. (Tip: zvažte citoslovce jako ah a oh.)
V angličtině , slovesa mají jiný inflexní vzor než podstatná jména, a obě mají odlišný inflexní vzor než zájmena; na rozdíl od latiny, angličtina dělá malý nebo žádný rozdíl mezi podstatnými jmény a adjektivy (nejsou to opravdu odlišné slovní druhy v angličtině), ale angličtina má články. (Články fungují syntakticky přesně jako demonstrativní adjektiva. Rozdíl spočívá v tom, že o jazyce se říká, že má články, pokud existují syntaktické konstrukce, kde je článek nebo demonstrativní slovo naprosto nutné, přičemž označení „články“ je aplikováno na ty demonstrativy, které mají nejslabší význam. .)
V jazycích s bohatou morfologií je rozdíl mezi jednotlivými částmi řeči jasný a větnou strukturu nese morfologie samostatně nebo s velmi malou pomocí slovosledu.
Na druhé straně ruka, izolační jazyk, jako je mandarín, nemá žádné skloňování (nebo téměř žádné); v takových jazycích je pojem „částí řeči“ mnohem nejasný a stává se srovnatelným s rozdílem mezi klíčovými slovy a běžnými identifikátory v programovacích jazycích. Angličtina je na dobré cestě k tomuto; mnoho anglických slov může fungovat jako podstatná jména, přídavná jména a slovesa buď zcela beze změny („they go “ – sloveso, „we were a go “ – noun, „all systems are go „- adjective; or“ go to a place „- noun,“ to place something „- verb; or“ dejte si drink „- podstatné jméno,“ na pití něco „- sloveso) nebo s malou změnou (“ red „- přídavné jméno nebo podstatné jméno;“ redden „) . V takových jazycích bez morfologie nebo s velmi malou morfologií je rozdíl mezi částmi řeči velmi oslaben a syntaktická struktura vět je reprezentována slovosledem, podobně jako v programovacích jazycích.
Například v latině „puer puellam vidit“, „puellam puer vidit“, „vidit puellam puer“ atd., všechny znamenají „[chlapec] viděl dívku“, zatímco v angličtině není možný žádný jiný slovosled, aniž by se změnil význam nebo vyslovila promluva nepochopitelné.
Odpověď
Části řeči jsou skutečně umělé dělení, které si lidé zvolili k vysvětlení struktury našeho jazyka. Vždy se nelíbí perfektně. Jako příklad si vezměte japonštinu. Japonština má „částice“, což jsou slova, která se nehodí do žádné konkrétní kategorie, kterou my, anglicky mluvící, poznáme. Existují také polysyntetické jazyky, kde jediné slovo zachycuje to, co bychom my, anglicky mluvící, nazvali větou. A samozřejmě v angličtině máme několik zajímavých slov, jako například konkrétní zaklínadlo začínající písmenem F, které se vzpírá kategorizaci (jak ukazuje tento rozhodně klip NSFW od Boondock Saints ).
Jednou zajímavou možností, která se podobá vašim očíslovaným slovům, je podívat se na jazyky používané k popisu sémantických webů, jako jsou RDF a OWL. Například RDF je pozoruhodně jednoduchý. Existují tři části „řeči:“ předměty, predikáty a objekty. Subjekty a predikáty jsou vždy „IRI“, které jsou svou povahou podobné číslovaným slovům. Objekty jsou buď IRI, nebo „hodnoty datového typu“, což jsou konkrétní hodnoty, jako jsou čísla. To je vše, co k tomu patří, a přesto dokáže popsat svět s příchutí jakéhokoli pokročilejšího jazyka.
Samozřejmě, že nebudou “ Neposílají to jako takový obrázek. Obsah vykreslí v jiném formátu, například Turtle, který je textový a výstižnější s jednoduššími paralelami k mezihvězdnému komunikačnímu formátu:
<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
OWL má podobnou povahu, ale je docela fascinující, protože dokáže popsat svou vlastní sémantiku poměrně elegantně. Například byste vlastně mohli mít pravidlo „Všechna slova, která jsou předmětem věty, jsou také podstatná jména.“ Tyto vztahy lze specifikovat s dostatečnou pravidelností, aby uživatelé OWL mohli pomocí „argumentů“ vyplnit vztahy, které nebyly v dokumentu výslovně zapsány.
Fantastická síla těchto sémantických webových jazyků je, že pokud někdo nezadal sémantiku toho, co by měl Word # 42 v konkrétní konstrukci znamenat, nebo pokud neexistuje žádné slovo, které by vyhovovalo vašim potřebám, můžete pro něj vytvořit sémantiku. Tuto sémantiku si pak můžete zapsat (obvykle do ontologie OWL). Ostatní mohou tuto sémantiku číst a algoritmicky na ni reagovat. Takže bych mohl definovat nové slovo # 3.14, které jste ještě nikdy neviděli, a mohu to udělat tak, že máte šanci pochopit, co jsem tím myslel!
Tato sémantická schopnost by být extrémně důležité, pokud jsou časové prodlevy velké. Jazyky se vyvíjejí v průběhu času, a pokud je mezi komunikacemi dostatek časového zpoždění, je rozumné domnívat se, že význam podstatného jména # 42 se může změnit pro jednu kulturu a ne pro druhou. Schopnost alespoň pokusit se zachytit sémantiku toho, co říkáte, by byla pro boj s těmito efekty velmi důležitá.
Komentáře
- To ‚ s velmi podobná tomu, na co jsem myslel. Hlavním příkladem (a tím, co chci dostatečně dobře zjistit) je stránka, kde nám říkají věci, které již známe: vlastnosti naší sluneční soustavy včetně věcí jako hmotnost, poloměr a orbitální parametry planet. To jsou většinou atributy jmen
- Kromě toho, že předměty, predikáty a objekty jsou části věty ne části řeči , to znamená, že patří do syntaxe a ne morfologie . Toto je chyba kategorie. Slovo “ he “ i slovo “ čtenář “ může fungovat jako předměty nebo objekty (syntaktické části nebo věta), ale “ on “ je zájmeno a “ čtenáři “ je podstatné jméno (morfologické slovní druhy). (Slovo “ čtenář “ může být ohraničeno článkem nebo ajektivem a činí množné číslo v -s ; potom slovo “ he “ nelze určit podle článku nebo přídavného jména a má zvláštní skloňování.)
- @AlexP V takovém případě předpokládám, že “ části řeči “ budou v těchto jazycích IRI a datový typ. ‚ Budu muset vymyslet, jak to nejlépe formulovat. Cítil jsem, že už ztratím čtenáře, který se pokouší ponořit dostatečně hluboko do jazyků, aby je spojil s otázkou.
- Skvělá věc o časovém zpoždění komunikace a konotacích slov, které se mění. ‚ Zobrazuji mimozemšťany z Gliese 581 c, kteří se naučili anglicky od Flintstonových, a pozdravují nás tím, že nám popřáli “ gay starý čas „. Také bych si přál, abych vám mohl dát body navíc za odkaz Boondock Saints.
Odpověď
Jazyk lze rozdělit na několik vrstev.
- Fonologie je studium nejmenších nedělitelných částí, ze kterých je jazyk konstruován. To se týká zvuků jako / g / nebo / k / v mluvené lidské řeči. Pokud vaši lingvisté studovali rádiový přenos, může to být počítačový bit nebo jiný podobný konstrukt.
- Morfologie je studium nejmenších kousků jazyka, které mají význam. Morfémy jsou samozřejmě konstruovány z různého počtu fonémů. Příkladem morfémy by byl -ist v morfologovi, který nese význam, i když sám nemůže obstát. Do tohoto pole spadají části řeči.
- Syntaxe je studium toho, jak řečníci kombinují morfémy a vytvářejí gramaticky správné věty. Například: „Kočka přešla přes horu a použila tlapky.“ je nespisovný, i když je srozumitelný.
- Sémantika je studium významu vět. „Kočka proletěla horou svými vousy.“ je gramatický a má sémantický význam. Což je náhodou nesmysl.
- Pragmatika je studium vztahu jazyka k vnějšímu světu. Například: „Mohl byste zavřít dveře?„je sémanticky otázka, ale pragmaticky jde o požadavek (v angličtině). Další příklad je se smlouvami. Tím, že řeknete ano dohodě, neříkáte jen to, že smlouvu přijímáte, ale samotné prohlášení je tím, čím je dohoda platná .
Sémantika a pragmatika jsou velmi špatně pochopená pole.
Aby bylo možné analyzovat přenos z mimozemského druhu, bylo by nutné určit, co je to fonologie, pak projít každou vrstvu a pokusit se zjistit, jak lze jednotlivé části kombinovat platným a neplatným způsobem.
S konkrétním odkazem na jednotlivé části řeči se obávám, že klasifikační systém liší se podle jazyka, protože jej neklasifikujeme podle nějakého univerzálního systému, rozlišujeme slova na stejné slovní druhy, které používá gramatika daného jazyka .
Lojban (protože vy ask) nemá odlišná slovesa, podstatná jména, příslovce a adjektiva. Má predikáty jako „prenu“ (je osoba) nebo „xamgu“ (je dobrá). Lze říci „l e xamgu ku „(věc, která je dobrá) nebo“ le prenu ku „(věc, která je osobou, nebo jen„ osobou „) a v určitých případech lze mnoho těchto částic vynechat, např. „.i prenu cu xamgu“ (osoba je dobrá) namísto „.i le prenu ku cu xamgu“. Tento jev (argumenty predikátu) se v angličtině poněkud podobá frázi podstatných jmen, ale jazyk absolutně nerozlišuje mezi tím, co by člověk mohl považovat za slovesa a přídavná jména, ani by se neměl pokoušet je takto klasifikovat.
Komentáře
- “ “ Kočka letěla přes horu svým vousy. “ /…/ je náhodou nesmysl. “ Jsme na Budování světa . Nebyl bych si ‚ tak jistý.
- « absolutně žádný rozdíl mezi tím, co lze považovat za slovesa a přídavná jména » Mohu předpokládat, že máte na mysli syntaxi; např. „Je červená“ a „běží“ jsou oba predikáty zpracovávány stejným způsobem. Ale strana vztahu a vnitřní atribut jsou sémanticky odlišné druhy věcí.
Odpověď
A „součást řeč „je pouze klasifikační schéma, které vědci ukládají do jazyka k popisu tříd slov.“ Tyto skupiny jsou založeny na gramatické funkci těchto slov, a že „kde dostaneme„ podstatné jméno “a„ sloveso “a„ předložku; “popisují třídy slov v angličtině. Máte však také podstatná jména, která fungují jako slovesa („ Google that. „) A mnoho dalších podivných konstrukcí, které způsobují, že se každá„ část řeči “rozloží na svou vlastní část řeči, úplně dolů.
Takže zde není žádné číslo pro celkový součet „všechny druhy částí řeči.“ Angličtina má jeden druh příslovce; japonština má tři. Jsou to jednotlivé části řeči nebo ne?
Nyní , pokud chcete klasifikovat symboly ve vašem jazyce, existuje docela dobrý průvodce. Kontakt Carl Sagan řeší přesný problém, který popisujete; musíte začít s prvními principy a vybudovat to do složitého jazyka. SETI se pokouší přijít právě s takovou zprávou a je to opravdu, opravdu těžké.
Pokud můžete odesílat obrázky, potřebujete pouze jednu „řeč“, VĚC. VĚC, můžete určit podstatná jména; jakmile budete mít podstatné jméno (ATOM), můžete vytvořit „věc rovnosti“ (ATOM = ATOM) a odtamtud pokračovat zadáním VĚCÍ, která jsou čísla, počítání věcí atd.
Pomocí syntaxe můžete vysvětlit koncepty, jako je změna v čase (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), ale vše je jen VĚC.
Pokud to zní příliš ručně ( protože je to ), možná se budeš chtít podívat do teorie kódování; co opravdu chceš je kompresní algoritmus / paritní algoritmus, který vysvětluje matematiku pomocí obecných symbolů.
Komentáře
- “ Věc “ nemá vůbec smysl, protože zde nejsou žádné rozdíly. Ale váš příklad má
proton
(podstatné jméno, obecné),=
(uveďte vztah),+
(provést operaci),,
a( )
(struktura). Ano, jsou to všechna slova, která lze kódovat; říká, že to nic nepřidá. - « podstatná jména, která fungují jako slovesa » váš příklad je sloveso, které pochází z podstatného jména a používá se jako (akční) sloveso. Možná jste se chtěli podívat na gerundy (nebo jaký je jejich opak)?
- “ Věc “ nebyla nejlepší slovo, protože opravdu myslím více “ symbolu popisujícího objekt.“ “ Google “ je vlastní podstatné jméno pro vyhledávač, ale může být používá se jako sloveso k popisu akce, při které se nyní provádí vyhledávání na webu. Mým záměrem bylo říci, že (1) to, na co se opravdu chcete podívat, je metoda kódování podstatných jmen jako symbolů, nikoli “ slov “ nebo “ slovní druhy, “ a (2) s chytrým kontextem a organizací můžete použít pouze podstatná jména (a podstatná jména jako -verbs) pro komunikaci složitých myšlenek a (3) “ části řeči “ nemají pro váš případ použití smysl, co opravdu potřebujete je metoda kódování symbolů pro objekty.