Vurder en conlang designet for en interstellær overføring til en mottaker som må finne ut det ut.
Jeg tenker at det vil bli oppfunnet for formålet, formelt og strengt. Det vil tilsynelatende gjøre en overgang fra matematisk notasjon eller datalgoritmer til å angi fakta om virkelige ting.
Så i tillegg til de åpenbare substantivene og verbene, hvor mange forskjellige «slags» ord er det egentlig?
Vet noen noe om ontologispråk eller Lojban ? Jeg lurer på om det er flere universelle kategorier enn de delene av talen som brukes på engelsk.
Årsaken Jeg spør er fordi antall kategorier vises direkte i scenariet mitt. Det er ingen ortografi i konvensjonell forstand, da overføringen bare er en mengde tall. Ord er ganske enkelt nummererte, så noe sånt som Substantiv # 42 ville være den bokstavelige stavemåten. Det vil enten være forskjellige koder som introduserer forskjellige kategorier, eller så vil kategorien være antydet av nummeret: Word # 42 er et substantiv fordi typen er underforstått av resten av tallet modulo 7 (eller hvor mange typer som helst vi trenger).
Det skilles heller ikke mellom hva vi tenker på som ord og tegnsetting. Gruppering og separatorer trenger også egne koder og er kodet på samme måte.
Kommentarer
- Taledeler skiller seg ut fra deres infleksjonsmønster (eller mangel på det) og deres tillatte kombinasjoner. For eksempel er det på latin tre veldig forskjellige bøyningsmønstre (verbal bøyning, nominell og pronominal bøyning); adverb, preposisjoner og sammenhenger har ingen bøyning, men deres tillatte kombinasjoner er forskjellige (adverb med adjektiv eller verb, preposisjoner med substantiv eller nominelle grupper, sammenhenger med nominelle grupper eller setninger). Grammatikere lager bord med bøyningsmønstre og tillatte kombinasjoner; cellene er delene av talen.
- @AlexP Merk at i likhet med moderne dataspråk og matematikknotasjon, vil det ikke være bøyninger i conlang. Jeg liker hvor du skal når det gjelder å la grammatikken styre det som blir sett på som delene av talen, hvis du bryr deg om å utvikle det til et fullstendig svar.
- Hvilket språk spør du om? Engelsk? Latin ?? Din stort sett udefinerte conlang ??? Spør du om det er universelt ???? Uklart og IMHO for bredt
- Et fascinerende og ubesvart spørsmål er om det er noe dyp grammatikk eller språkinstinkt over en baby ‘ s ønske om å lære, hardt innbundet i oss . Hvis det er det, er det unikt menneskelig eller et universelt pattedyr?
- Det er vel verdt å lese om noen språk som ikke er i den indoeuropeiske familien. Xhosa, Navaho, Thai, … Hvert forsøk på å kodifisere det universelle har mislyktes, men all menneskelig baby vil lære alle menneskelige språk som utgjør en betydelig del av hans eller hennes tidlige liv.
Svar
Orddeler er morfologiske eller morfosyntaktiske ordklasser. Ikke alle språk har taledeler, men i de som har det, slik som latin eller fransk eller engelsk, skilles taledelene ut fra deres infleksjonsmønstre (eller mangel på dem) og deres tillatte kombinasjoner.
(For de av oss som har erfaring med kompilatorer, er delene av talen sammenlignbare med klasser av tokens som gjenkjennes av lexeren, for eksempel identifikatorer, tall, operatorer og skilletegn.)
For eksempel på latin det er tre veldig forskjellige bøyningsmønstre (verbal bøyning, nominell bøyning og pronominal bøyning); adverb, preposisjoner og sammenhenger har ingen bøyning, men deres tillatte kombinasjoner er forskjellige (adverb med adjektiv eller verb, preposisjoner med substantiv eller nominelle grupper, sammenhenger med nominelle grupper eller setninger). Grammatikere lager bord med bøyningsmønstre og tillatte kombinasjoner; cellene i tabellen er delene av talen.
For eksempel på engelsk kan vi lage følgende klassifiseringstreet:
-
Har ordet en -ing form, en fortid, kan den lage en fremtidig tid med vil ? Hvis ja, så er det et vanlig verb . (Eksempler: være, drikk, sett, se, ta.)
-
Ellers, kan den vises i samme syntaktiske posisjon som et vanlig verb? Hvis ja, så er det et modalt verb . (Eksempler: kan, kan, skal.)
-
Ellers:
-
Kan den bestemme et verb? Hvis ja, så er det et adverb . (Eksempler: raskt, raskt, virkelig, vel.)
-
Kan det fungere som gjenstand for et verb? Hvis ja, er det enten et substantiv eller et pronomen :
-
Identifiserer ordet en bestemt objekt?Hvis ja, er det et egennavn .
-
Ellers kan det bestemmes av et adjektiv? Hvis ja, så er det et selvstendig substantiv .
-
Ellers er det et pronomen . (Engelske pronomen kan også identifiseres ved deres særegne bøyning.)
-
-
Kan den bestemme et substantiv? Hvis ja, er det enten en artikkel eller et adjektiv eller et tall :
-
Kan ordet danne grader av sammenligning? (Rent morfologisk sett – «mer unikt» er morfologisk korrekt, men logisk tullete.) Hvis ja, er det et vanlig adjektiv .
-
Ellers, er ordet en av en klasse adjektiver som kreves for å vises med substantiver som brukes som subjekter eller direkte objekter? Hvis ja, er det en artikkel eller demonstrativ.
-
Ellers uttrykker den et spesifikt nummer? Hvis ja, er det et nummer.
-
-
Mange ord tilhører mer enn en av disse klassene. Spesielt de aller fleste substantiver kan også fungere som adjektiver og omvendt.
-
-
Ellers må ordet brukes umiddelbart foran en substantiv eller nominell gruppe, eller umiddelbart etter et verb? Hvis ja, så er det en forstilling.
-
Ellers kan ordet brukes til å koble substantiv, eller nominelle grupper, eller verb eller setninger ? Hvis ja, er det et sammenheng.
-
Ellers har du funnet et ord som ikke kan klassifiseres av dette beslutningstreet. (Hint: vurder interjeksjoner som ah og oh.)
På engelsk , verb har et annet bøyemønster enn substantiver, og begge har et annet bøyemønster enn pronomen; i motsetning til latin, skiller engelsk liten eller ingen forskjell mellom substantiver og adjektiver (de er egentlig ikke forskjellige ordklasser på engelsk), men engelsk har artikler. (Artikler fungerer syntaktisk akkurat som demonstrative adjektiver, forskjellen er at et språk sies å ha artikler hvis det er syntaktiske konstruksjoner der en artikkel eller demonstrativt er absolutt nødvendig, med etiketten «artikler» som brukes på de demonstrativene som har den svakeste betydningen .)
På språk med rik morfologi er skillet mellom taledeler tydelig, og setningsstrukturen bæres av morfologien alene eller med svært liten hjelp fra ordrekkefølgen.
På den andre hånd, isolerende språk som mandarin har ingen bøyning overhodet (eller nesten ingen); i slike språk er begrepet «taledeler» mye uskarpt, og blir sammenlignbart med forskjellen mellom nøkkelord og vanlige identifikatorer i programmeringsspråk. Engelsk er godt på vei mot dette; mange engelske ord kan fungere som substantiver, adjektiver og verb enten helt uendret («de går » – verb, «vi hadde en gå » – substantiv, «alle systemer er gå «- adjektiv; eller» gå til et sted «- substantiv,» til sted noe «- verb; eller» ha en drikke «- substantiv,» til drikke noe «- verb) eller med liten forandring (» rød «- adjektiv eller substantiv;» å rødme «) . I slike språk uten morfologi eller veldig liten morfologi er skillet mellom taledeler sterkt dempet, og setningens syntaktiske struktur er representert ved ordrekkefølge, akkurat som i programmeringsspråk.
For eksempel på latin «puer puellam vidit», «puellam puer vidit», «vidit puellam puer» etc. betyr alle «[the] boy saw [the] girl», mens det på engelsk ikke er noen annen ordrekkefølge mulig uten å endre betydningen eller uttale seg uforståelig.
Svar
Taledeler er egentlig en kunstig inndeling valgt av mennesker for å forklare strukturen i språket vårt. De stiller ikke alltid perfekt. Ta japansk som eksempel. Japansk har «partikler», som er ord som ikke passer inn i en bestemt kategori som vi engelsktalende kjenner igjen. Det er også de polysyntetiske språkene der et enkelt ord fanger det vi engelsktalende vil kalle en setning. Og selvfølgelig, på engelsk, har vi noen interessante ord som en spesiell utforskende startende med bokstaven F som trosser kategorisering (som demonstrert i dette desidert NSFW klipp fra Boondock Saints ).
Et interessant alternativ som er i tråd med de nummererte ordene dine, er å se på språk som brukes til å beskrive semantiske nett som RDF og OWL. RDF, for eksempel, er bemerkelsesverdig enkelt. Det er tre deler av «tale:» emner, predikater og objekter. Emner og predikater er alltid «IRIer» som har samme karakter som dine nummererte ord. Objekter er enten IRI-er eller «datatype-verdier» som er konkrete verdier som tall. Det er alt det er, og likevel kan den beskrive verden med all smak av et mer avansert språk.
Selvfølgelig ville de ikke » t sender det som et slikt bilde. De gjengir innholdet i et annet format, for eksempel Turtle, som er tekstbasert og mer kortfattet med lettere paralleller til et interstellært kommunikasjonsformat:
<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
OWL har en lignende karakter, men er ganske fascinerende fordi den kan beskrive sin egen semantikk ganske elegant. For eksempel kan du faktisk ha en regel «Alle ord som er gjenstand for en setning er også substantiver.» Disse forholdene kan spesifiseres med tilstrekkelig regelmessighet til at OWL-brukere kan bruke «resonnerer» til å fylle ut forhold som ikke eksplisitt er skrevet ned i dokumentet.
Den fantastiske kraften til disse semantiske webspråk er at hvis noen har ikke spesifisert semantikken til hva Word # 42 skal bety i en bestemt konstruksjon, eller hvis det ikke er noe ord som tilfredsstiller dine behov, kan du gjøre opp semantikk for det. Du kan deretter skrive ned disse semantikkene (vanligvis i en OWL-ontologi). Andre kan lese disse semantikkene, og handle på den algoritmisk. Så jeg kan definere et nytt ord # 3.14 som du aldri har sett før, og jeg kan gjøre det på en slik måte at du har en sjanse til å forstå hva jeg mente med det!
Denne semantiske evnen ville være ekstremt viktig hvis tidsforsinkelsene var store. Språk utvikler seg over tid, og hvis det er nok tidsforsinkelse mellom kommunikasjon, er det rimelig å tro at betydningen av substantiv nr. 42 kan endres for den ene kulturen og ikke den andre. Evnen til i det minste å forsøke å fange semantikken til det du sier ville være veldig viktig for å bekjempe disse effektene.
Kommentarer
- At ‘ er veldig i tråd med det jeg tenkte. Et stort eksempel (og det jeg vil finne ut godt nok til å gjengi) er en side der de forteller oss ting vi allerede vet: eiendommer av vårt solsystem inkludert ting som masse, radius og omløpsparametere til planetene. Det er for det meste attributter for navn
- Bortsett fra at emner, predikater og objekter er deler av setningen ikke taledeler , det vil si at de tilhører syntaks og ikke til morfologi . Dette er en kategorifeil. Både ordet » he » og ordet » leser » kan fungere som subjekter eller objekter (syntaktiske deler eller setning), men » he » er et pronomen og » lesere » er et substantiv (morfologiske ordklasser). (Ordet » leser » kan spottes av en artikkel eller et adjektiv, og gjør flertall i -s ; da kan ikke ordet » he » bestemmes av en artikkel eller et adjektiv og har en spesiell bøyning.)
- @AlexP I så fall antar jeg at » taledelene » ville være IRI og datatype på disse språkene. Jeg ‘ Jeg må tenke på hvordan det er best å formulere det. Jeg følte at jeg allerede skulle miste leseren som prøvde å dykke dypt nok inn i språkene for å knytte dem til spørsmålet.
- Flott poeng om tidsforsinkelse i kommunikasjon og konnotasjonene av ord som endres. Jeg ‘ Jeg skildrer romvesener fra Gliese 581 c som lærte engelsk fra Flintstones og hilser oss ved å ønske oss en » gay gammel tid «. Ønsker også at jeg kunne gi deg ekstra poeng for Boondock Saints-referansen.
Svar
Språk kan deles i flere lag.
- Fonologi er studiet av de minste udelelige delene som språket er konstruert fra. Dette refererer til lyder som / g / eller / k / i talt menneskespråk. Hvis språkforskerne dine studerte en radiooverføring, kan det være en datamaskinbit eller annen lignende konstruksjon.
- Morfologi er studiet av de minste språkbitene som har betydning. Morfemer er selvfølgelig konstruert av varierende antall fonemer. Et eksempel på et morfem kan være morfologen, som har betydning selv om den ikke kan stå alene. Deler av tale faller inn under dette feltet.
- Syntaks er studien av hvordan høyttalere kombinerer morfemer for å lage grammatisk korrekte setninger. For eksempel, «Katten gikk over fjellet brukte potene.» er ikke-grammatisk, selv om det er forståelig.
- Semantikk er studiet av hva setninger betyr. «Katten fløy gjennom fjellet med kinnskjeggene.» er grammatisk og har en semantisk betydning. Som tilfeldigvis er tull.
- Pragmatikk er studiet av hvordan språk forholder seg til den ytre verden. For eksempel «Kan du lukke døren?»er semantisk et spørsmål, men pragmatisk er det en forespørsel (på engelsk). Et annet eksempel er med kontrakter. Ved å si ja til en avtale sier du ikke bare at du godtar avtalen, men selve uttalelsen er det som gjør avtalen gyldig. .
Semantikk og pragmatikk er veldig dårlig forståte felt.
For å analysere en overføring fra en fremmed art, må man bestem hva fonologien er, og gå deretter gjennom hvert lag for å prøve å finne ut hvordan brikkene kan kombineres på gyldige og ugyldige måter.
Med henvisning til de spesielle delene er jeg redd for at klassifiseringssystemet er forskjellig fra språk siden vi ikke klassifiserer i henhold til noe universelt system, skiller vi ord inn i de samme delene av talen som grammatikken til det språket bruker .
Lojban (siden du spurte) har ikke forskjellige verb, substantiver, adverb og adjektiver. Det har predikater som «prenu» (er en person) eller «xamgu» (er bra). Man kan si «l e xamgu ku «(tingen som er god) eller» le prenu ku «(tingen som er en person, eller bare» person «) og i visse tilfeller kan mange av disse partiklene utelates, f.eks. «.i prenu cu xamgu» (personen er god) i stedet for «.i le prenu ku cu xamgu». Dette fenomenet (argumentene til et predikat) ligner litt på substantivfraser på engelsk, men språket skiller absolutt ikke mellom hva man kan betrakte verb og adjektiver, og du bør heller ikke prøve å klassifisere dem på den måten.
Kommentarer
- » » Katten fløy gjennom fjellet ved sin kinnskjegg. » /…/ tilfeldigvis tull. » Vi er på Verdensbygging . Jeg ville ikke ‘ ikke være så sikker.
- Av « absolutt ingen forskjell mellom hva man kan betrakte verb og adjektiv » Jeg kan bare anta at du mener som en bekymring for syntaksen; f.eks. “Er rødt” og “kjører” er begge predikater håndtert på samme måte. Men fest til et forhold og intern attributt er semantisk forskjellige slags ting.
Svar
A «del av tale «er bare et klassifikasjonsskjema, pålagt språket av forskere, for å beskrive ordklasser. Disse gruppene er basert på grammatikkfunksjonen til disse ordene, og at det er der vi får «substantiv» og «verb» og «preposisjon;» de beskriver klasser av ord på engelsk. Men du har også substantiv som fungerer som verb (» Google det. «) Og mange ytterligere rare konstruksjoner som gjør at hver» del av talen «blir brutt ned i sin egen del av talen, helt ned.
Så det er ikke noe for summen av summen av «alle slags taledeler.» Engelsk har en slags adverb. Japansk har tre. Er disse separate delene av talen eller ikke?
Nå , hvis du ønsker å klassifisere symbolene på språket ditt, er det en god guide. Kontakt av Carl Sagan løser det nøyaktige problemet du beskriver; du må begynne med de første prinsippene og bygge det inn i et komplekst språk. SETI har prøvd å komme med akkurat en slik melding, og det er veldig, veldig vanskelig.
Hvis du kan sende bilder, trenger du bare en «del av talen», TINGET. TING, du kan spesifisere substantiver; når du først har et substantiv (ATOM), kan du opprette en «likhetsting» (ATOM = ATOM), og deretter fortsette derfra og spesifisere TINGER som er tall, teller ting osv.
Du kan bruke syntaksen til å forklare begreper som endring over tid (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), men alt er bare TING.
Hvis dette høres for håndbølget ut ( fordi det er ), kan det være lurt å se nærmere på kodingsteorien; det du virkelig ønsker er en komprimeringsalgoritme / paritetsalgoritme som forklarer matematikk ved hjelp av generiske symboler.
Kommentarer
- » Thing » er slett ikke meningsfull da det ikke er noen forskjell. Men eksemplet ditt har
proton
(substantiv, generisk),=
(oppgi et forhold),+
(utfør en operasjon),,
og( )
(struktur). Ja, det er alle ord som kan kodes; å si at det ikke legger til noe. - « substantiver som fungerer som verb » ditt eksempel er et verb som kom fra et substantiv, og brukes som et (handling) verb. Kanskje du mente å se på gerunds (eller hva er det motsatte av det)?
- » Ting » var ikke det beste ordet fordi jeg egentlig mener mer » et symbol som beskriver et objekt.» » Google » er et substantiv for en søkemotor, men det kan være brukt som verb for å beskrive handlingen med å gjøre et websøk nå. Min hensikt var å si at (1) det du virkelig vil se på er en metode for å kode substantiver som symboler, ikke » ord » eller » taledeler, » og (2) med smart kontekst og organisering, kan du bare bruke substantiver (og substantiv-som -verb) for å kommunisere komplekse ideer, og (3) » taledeler » er meningsløst for din brukstilfelle, det du virkelig trenger er en metode for å kode symboler for objekter.