Tänk på en conlang utformad för en interstellär överföring till en mottagare som måste räkna ut det ut.

Jag tror att det kommer att uppfinnas för ändamålet, formellt och strikt. Det kommer att göra en övergång från matematisk notation eller datoralgoritmer till att ange fakta om verkliga saker.

Så förutom de uppenbara substantiv och verb, hur många olika ”slags” ord finns det egentligen?

Vet någon något om ontologispråk eller Lojban ? Jag undrar om det finns fler universella kategorier än de språk som används på engelska.

Anledningen Jag frågar beror på att antalet kategorierna dyker upp direkt i min scenareo. Det finns ingen ortografi i konventionell mening, eftersom överföringen bara är en massa siffror. Ord är helt enkelt numrerade, så något som Substantiv # 42 skulle vara den bokstavliga stavningen. Det kommer antingen att finnas olika koder som introducerar olika kategorier, eller så antyds kategorin av dess nummer: Word # 42 är ett substantiv eftersom typen antyds av återstoden av numret modulo 7 (eller hur många typer som helst vi behöver).

Det finns ingen skillnad mellan vad vi tänker på som ord och skiljetecken. Gruppering och separatorer behöver också sina egna koder och kodas på samma sätt.

Kommentarer

  • Taldelar skiljer sig utifrån deras inflexionsmönster (eller brist på dem) och deras tillåtna kombinationer. Till exempel finns det på latin tre mycket olika böjningsmönster (verbal böjning, nominell och pronominal böjning); Adverb, prepositioner och konjunktioner har ingen böjning men deras tillåtna kombinationer är distinkta (adverb med adjektiv eller verb, prepositioner med substantiv eller nominella grupper, sammankopplingar med nominella grupper eller meningar). Grammatiker gör bord med böjningsmönster och tillåtna kombinationer; cellerna är delarna av talet.
  • @AlexP Observera att precis som moderna datorspråk och matematiknotation kommer det inte att finnas några böjningar i conlang. Jag gillar vart du ska när det gäller att låta grammatiken styra vad som anses vara talets delar, om du skulle vilja utveckla det till ett fullständigt svar.
  • Vilket språk frågar du om? Engelsk? Latin ?? Din i stort sett odefinierade conlang ??? Frågar du om det finns universalar ???? Oklart och IMHO för brett
  • En fascinerande och obesvarad fråga är om det finns någon djup grammatik eller språkinstinkt ovanför en bebis ’ s önskan att lära sig, inbunden i oss . Om det finns det, är det unikt mänskligt eller ett universellt däggdjur?
  • Det är väl värt att läsa om några språk som inte finns i den indoeuropeiska familjen. Xhosa, Navaho, Thai, … Varje försök att kodifiera det universella har misslyckats, ändå kommer alla mänskliga barn att lära sig alla mänskliga språk som utgör en betydande del av hans eller hennes tidiga liv.

Svar

Taldelar är morfologiska eller morfosyntaktiska ordklasser. Inte alla språk har delar av talet, men i de som gör det, till exempel latin eller franska eller engelska, skiljer sig taldelarna utifrån deras inflexionsmönster (eller brist på dem) och deras tillåtna kombinationer.

(För de av oss som har erfarenhet av kompilatorer är de olika delarna av talet jämförbara med de klasser av tokens som känns igen av lexer, till exempel identifierare, siffror, operatorer och separatorer.)

Till exempel på latin det finns tre mycket olika mönster av böjning (verbal böjning, nominell böjning och pronominal böjning); Adverb, prepositioner och konjunktioner har ingen böjning men deras tillåtna kombinationer är distinkta (adverb med adjektiv eller verb, prepositioner med substantiv eller nominella grupper, sammankopplingar med nominella grupper eller meningar). Grammatiker gör bord med böjningsmönster och tillåtna kombinationer; cellerna i tabellen är delarna av talet.

Till exempel, på engelska kan vi göra följande klassificeringsträd:

  1. Har ordet en -ing form, ett förflutet, kan det göra en framtid med kommer ? Om ja, är det ett vanligt verb . (Exempel: vara, drick, sätt, se, ta.)

  2. Annars, kan det visas i samma syntaktiska position som ett vanligt verb? Om ja, är det ett modalt verb . (Exempel: kan, kan, ska.)

  3. Annars:

    • Kan det bestämma ett verb? Om ja, är det ett adverb . (Exempel: snabbt, snabbt, riktigt, bra.)

    • Kan det fungera som ämnet för ett verb? Om ja, är det antingen ett substantiv eller ett pronomen :

      • Identifierar ordet en särskilt objekt?Om ja, är det ett egennamn .

      • Annars kan det bestämmas av ett adjektiv? Om ja, är det ett vanligt substantiv .

      • Annars är det ett pronomen . (Engelska pronomen kan också identifieras med deras speciella böjning.)

    • Kan det bestämma ett substantiv? Om ja, är det antingen en artikel eller ett adjektiv eller ett siffra :

      • Kan ordet bilda jämförelsegrader? (Rent morfologiskt sett – ”mer unikt” är morfologiskt korrekt men logiskt dumt.) Om ja, är det ett vanligt adjektiv .

      • Annars, är ordet ett av en klass av adjektiv som krävs för att visas med substantiv som används som ämnen eller direkta objekt? Om ja, är det en artikel eller demonstrativ.

      • Annars uttrycker den ett visst nummer? Om ja, är det ett nummer.

    • Många ord tillhör mer än en av dessa klasser. I synnerhet kan de allra flesta substantiv också fungera som adjektiv och vice versa.

  4. Annars måste ordet användas omedelbart framför en substantiv eller nominell grupp, eller omedelbart efter ett verb? Om ja, så är det en preposition.

  5. Annars kan ordet användas för att länka substantiv eller nominella grupper eller verb eller meningar ? Om ja, är det ett sammankoppling.

  6. Annars har du hittat ett ord som inte kan klassificeras av detta beslutsträd. (Tips: överväg interjektioner såsom ah och oh.)

På engelska , verb har ett annat inflexionsmönster än substantiv, och båda har ett annat inflexionsmönster än pronomen; till skillnad från latin, gör engelska liten eller ingen skillnad mellan substantiv och adjektiv (de är inte riktigt olika språk på engelska), men engelska har artiklar. (Artiklar fungerar syntaktiskt exakt som demonstrativa adjektiv, skillnaden är att ett språk sägs ha artiklar om det finns syntaktiska konstruktioner där en artikel eller demonstration är absolut nödvändig, med etiketten ”artiklar” tillämpas på de demonstrationer som har den svagaste betydelsen .)

På språk med rik morfologi är skillnaden mellan talord tydlig och meningsstrukturen bärs av morfologin ensam eller med mycket liten hjälp från ordordningen.

Å andra sidan hand, isolerande språk som mandarin har ingen böjning alls (eller nästan ingen); i sådana språk är begreppet ”delar av tal” mycket suddigt och blir jämförbart med skillnaden mellan nyckelord och vanliga identifierare i programmeringsspråk. Engelska är på god väg mot detta; många engelska ord kan fungera som substantiv, adjektiv och verb antingen helt oförändrade (”de ” – verb, ”vi hade en ” – substantiv, ”alla system är ”- adjektiv; eller” gå till en plats ”- substantiv,” till plats något ”- verb eller” ha en drink ”- substantiv,” till drink något ”- verb) eller med liten förändring (” röd ”- adjektiv eller substantiv;” att rodna ”) . På sådana språk utan morfologi eller mycket liten morfologi är skillnaden mellan taldelar starkt försvagad och den syntaktiska strukturen för meningar representeras av ordordning, precis som i programmeringsspråk.

Till exempel på latin ”puer puellam vidit”, ”puellam puer vidit”, ”vidit puellam puer” etc. betyder alla ”pojken såg [flickan], medan det på engelska inte är möjligt att orda andra ord utan att ändra betydelsen eller göra uttalandet obegripligt.

Svar

Taldelar är verkligen en artificiell uppdelning som människor väljer för att förklara strukturen i vårt språk. De stämmer inte alltid perfekt. Ta japanska som ett exempel. Japanska har ”partiklar”, vilket är ord som inte passar in i någon särskild kategori som vi engelsktalande känner igen. Det finns också de polysyntetiska språken där ett enda ord fångar vad vi engelsktalande skulle kalla en mening. Och naturligtvis har vi på engelska några intressanta ord som en speciell expletiv som börjar med bokstaven F som trotsar kategorisering (som visas i detta bestämt NSFW klipp från Boondock Saints ).

Ett intressant alternativ som är i linje med dina numrerade ord är att titta på språk som används för att beskriva semantiska nät som RDF och OWL. RDF är till exempel anmärkningsvärt enkelt. Det finns tre delar av ”tal:” ämnen, predikat och objekt. Ämnen och predikat är alltid ”IRI” som har samma karaktär som dina numrerade ord. Objekten är antingen IRI: er eller ”datatypvärden” som är konkreta värden som siffror. Det är allt som finns till det, och ändå kan det beskriva världen med all smak av ett mer avancerat språk.

RDF-exempel

Naturligtvis skulle de inte ” t skicka det som en sådan bild. De ”återger innehållet i ett annat format, till exempel Turtle, som är textbaserat och mer koncist med enklare paralleller till ett interstellärt kommunikationsformat:

<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ; 

OWL är likartad men är ganska fascinerande eftersom den kan beskriva sin egen semantik ganska elegant. Till exempel kan du faktiskt ha en regel ”Alla ord som är föremål för en mening är också Substantiv.” Dessa förhållanden kan specificeras med tillräcklig regelbundenhet för att OWL-användare kan använda ”resonemang” för att fylla i relationer som inte uttryckligen skrevs ner i dokumentet.

Den fantastiska kraften i dessa semantiska webbspråk är att om någon har inte specificerat semantiken för vad Word # 42 ska betyda i en viss konstruktion, eller om det inte finns något ord som uppfyller dina behov kan du göra upp semantik för det. Du kan sedan skriva ner dessa semantik (vanligtvis i en OWL-ontologi). Andra kan läsa dessa semantik och agera på det algoritmiskt. Så jag kan definiera ett nytt ord # 3.14 som du aldrig har sett förut, och jag kan göra det på ett sådant sätt att du har en chans att förstå vad jag menade med det!

Denna semantiska förmåga skulle vara oerhört viktigt om tidsfördröjningarna var stora. Språken utvecklas över tiden, och om det finns tillräckligt med tidsfördröjning mellan kommunikationer, är det rimligt att tro att innebörden av substantiv # 42 kan förändras för en kultur och inte för den andra. Förmågan att åtminstone försöka fånga semantiken för vad du säger skulle vara mycket viktig för att bekämpa dessa effekter.

Kommentarer

  • Att ’ är väldigt mycket i linje med vad jag tänkte. Ett stort exempel (och vad jag vill räkna ut tillräckligt bra för att återge) är en sida där de berättar för oss saker som vi redan vet: fastigheter i vårt solsystem inklusive saker som planeternas massa, radie och omloppsparametrar. Det är främst attribut för namn
  • Förutom att ämnen, predikat och objekt är delar av meningen inte talord , det vill säga de tillhör syntax och inte till morfologi . Detta är ett kategorifel. Både ordet ” he ” och ordet ” läsare ” kan fungera som ämnen eller objekt (syntaktiska delar eller mening), men ” he ” är ett pronomen och ” läsare ” är ett substantiv (morfologiska talord). (Ordet ” läsare ” kan avlägsnas av en artikel eller ett adjektiv och gör flertalet i -s ; då kan ordet ” he ” inte bestämmas av en artikel eller ett adjektiv och har en märklig böjning.)
  • @AlexP I så fall antar jag att ” talets delar ” skulle vara IRI och datatyp på dessa språk. Jag ’ Jag måste tänka på hur man bäst ordar det. Jag kände att jag redan tappade läsaren som försökte dyka tillräckligt djupt in i språken för att knyta dem till frågan.
  • Stor poäng om tidsfördröjning i kommunikation och konnotationer av ord som förändras. Jag ’ jag föreställer utlänningar från Gliese 581 c som lärde sig engelska från Flintstones och hälsade oss genom att önska oss en ” gay gammal tid ”. Önskar också att jag kan ge dig extra poäng för Boondock Saints referens.

Svar

Språk kan delas in i flera lager.

  • Fonologi är studiet av de minsta odelbara bitarna som språket är uppbyggt av. Detta hänvisar till ljud som / g / eller / k / på talat mänskligt språk. Om dina lingvister studerade en radiosändning kan det vara en datorbit eller någon annan liknande konstruktion.
  • Morfologi är studiet av de minsta språkstyckena som har betydelse. Morfemer är naturligtvis konstruerade av varierande antal fonemer. Ett exempel på en morfem skulle vara morfologens -ist, som har betydelse även om den inte kan stå på egen hand. Delar av tal faller under detta fält.
  • Syntax är studien av hur talare kombinerar morfemer för att göra grammatiskt korrekta meningar. Till exempel ”Katten gick över berget använde sina tassar.” är grammatisk, även om det är förståeligt.
  • Semantik är studiet av vad meningar betyder. ”Katten flög genom morrhåren genom berget.” är grammatisk och har en semantisk betydelse. Som råkar vara nonsens.
  • Pragmatik är studien av hur språket relaterar till den yttre världen. Till exempel ”Kan du stänga dörren?”är semantiskt en fråga, men pragmatiskt är det en begäran (på engelska). Ett annat exempel är med kontrakt. Genom att säga ja till en affär säger du inte bara att du accepterar affären utan själva uttalandet är det som gör affären giltig .

Semantik och pragmatik är mycket dåligt förstådda fält.

För att analysera en överföring från en främmande art måste man bestäm vad fonologin är, gå sedan igenom varje lager och försök att räkna ut hur bitarna kan kombineras på giltiga och ogiltiga sätt.

Med hänvisning till de specifika delarna är jag rädd för att klassificeringssystemet skiljer sig åt efter språk eftersom vi inte klassificerar enligt något universellt system, vi skiljer ord i samma delar av talet som grammatiken på det språket använder .

Lojban (eftersom du frågade) har inte distinkta verb, substantiv, adverb och adjektiv. Det har predikat som ”prenu” (är en person) eller ”xamgu” (är bra). Man kan säga ”l e xamgu ku ”(saken som är bra) eller” le prenu ku ”(saken som är en person, eller bara” person ”) och i vissa fall kan många av dessa partiklar utelämnas, t.ex. ”.i prenu cu xamgu” (personen är bra) istället för ”.i le prenu ku cu xamgu”. Detta fenomen (argumenten för ett predikat) är ungefär som substantivfraser på engelska, men språket gör absolut ingen skillnad mellan vad man kan betrakta verb och adjektiv, och man bör inte heller försöka klassificera dem på det sättet.

Kommentarer

  • ” ” Katten flög genom berget med sina morrhår. ” /…/ råkar vara nonsens. ” Vi är på Worldbuilding . Jag skulle inte ’ inte vara så säker.
  • Av « absolut ingen skillnad mellan vad man kan betrakta verb och adjektiv » Jag kan bara anta att du menar som en fråga om syntax; t.ex. “Är röd” och “körs” är båda predikat hanteras på samma sätt. Men part till ett förhållande och internt attribut är semantiskt olika slags saker.

Svar

A ”del av tal ”är bara ett klassificeringsschema, som påförs språket av forskare, för att beskriva ordklasser. Dessa grupper är baserade på grammatikfunktionen för dessa ord, och det är där vi får ”substantiv” och ”verb” och ”preposition;” de beskriver klasser av ord på engelska. Men du har också substantiv som fungerar som verb (” Google det. ”) Och många andra konstiga konstruktioner som gör att varje” del av tal ”delas upp i sin egen del av tal, hela vägen ner.

Så det finns inget tal för summan av ”alla typer av talord.” Engelska har en typ av adverb; japanska har tre. Är de separata delarna av tal eller inte?

Nu , om du vill klassificera symbolerna på ditt språk, finns det en ganska bra guide. Kontakt av Carl Sagan löser det exakta problemet du beskriver; du måste börja med de första principerna och bygga det till ett komplext språk. SETI har försökt komma med just ett sådant meddelande och det är riktigt, väldigt svårt.

Om du kan skicka bilder behöver du bara en ”del av talet”, SÄND. THING, du kan ange substantiv; när du väl har ett substantiv (ATOM) kan du skapa en ”jämställdhetssak” (ATOM = ATOM) och sedan fortsätta därifrån och ange THINGS som är siffror, räknar saker osv.

Du kan använda syntax för att förklara begrepp som förändring över tiden (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), men allt är bara en sak.

Om det låter för handvågigt ( eftersom det är ) kanske du vill titta på kodningsteorin; vad du verkligen vill ha är en komprimeringsalgoritm / paritetsalgoritm som förklarar matematik med generiska symboler.

Kommentarer

  • ” Thing ” är inte alls meningsfullt eftersom det inte finns några skillnader. Men ditt exempel har proton (substantiv, generisk), = (ange ett förhållande), + (utför en operation), , och ( ) (struktur). Ja, det är alla ord som kan kodas; att säga att det inte lägger till något.
  • « substantiv som fungerar som verb » ditt exempel är ett verb som kom från ett substantiv och används som ett (action) verb. Du menade kanske att titta på gerunds (eller vad är det motsatta av det)?
  • ” Saken ” var inte det bästa ordet för jag menar verkligen mer ” en symbol som beskriver ett objekt.” ” Google ” är ett substantiv för en sökmotor, men det kan vara används som ett verb för att beskriva handlingen att göra en webbsökning nu. Min avsikt var att säga att (1) det du verkligen vill titta på är en metod för att koda substantiv som symboler, inte ” ord ” eller ” delar av talet, ” och (2) med smart sammanhang och organisation kan du bara använda substantiv (och substantiv-som -verb) för att kommunicera komplexa idéer, och (3) ” delar av talet ” är meningslöst för ditt användningsfall, vad du verkligen behöver är en metod för att koda symboler för objekt.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *