Overvej en conlang designet til en interstellar transmission til en modtager, der bliver nødt til at regne det ud.
Jeg tænker, at det vil blive opfundet til formålet, formelt og stringent. Det vil tilsyneladende gøre en overgang fra matematisk notation eller computeralgoritmer til at angive fakta om virkelige ting.
Så udover de åbenlyse substantiver og verbum, hvor mange forskellige “slags” ord er der der egentlig?
Ved nogen noget om ontologisprog eller Lojban ? Jeg spekulerer på, om der er mere universelle kategorier end de sprog, der bruges på engelsk.
Årsagen Jeg spørger, fordi antallet kategorierne vises direkte i mit scenareo. Der er ingen ortografi i konventionel forstand, da transmissionen kun er en flok tal. Ord er simpelthen nummererede, så noget som Substantiv # 42 ville være den bogstavelige stavemåde. Der vil enten være forskellige koder, der introducerer forskellige kategorier, eller kategorien vil blive antydet af dets nummer: Word # 42 er et substantiv, fordi typen er underforstået af resten af tallet modulo 7 (eller hvor mange typer der er vi har brug for).
Der er heller ingen forskel på, hvad vi tænker på som ord og tegnsætning. Gruppering og separatorer har også brug for deres egne koder og er kodet på samme måde.
Kommentarer
- Taledele skelnes ud fra deres infleksionsmønstre (eller mangel på dem) og deres tilladte kombinationer. For eksempel er der på latin tre meget forskellige bøjningsmønstre (verbal bøjning, nominel og pronominal bøjning); adverb, præpositioner og sammenhænge har ingen bøjning, men deres tilladte kombinationer er forskellige (adverb med adjektiver eller verb, præpositioner med substantiver eller nominelle grupper, sammenhænge med nominelle grupper eller sætninger). Grammatikere laver tabeller med bøjningsmønstre og tilladte kombinationer; cellerne er delene af talen.
- @AlexP bemærk, at der som moderne computersprog og matematiknotation ikke vil være bøjninger i conlang. Jeg kan godt lide, hvor du skal hen med hensyn til at lade grammatikken styre, hvad der betragtes som delene af talen, hvis du gerne vil udvikle det til et komplet svar.
- Hvilket sprog spørger du om? Engelsk? Latinsk ?? Din stort set udefinerede conlang ??? Spørg du om der er universelle ???? Uklart og IMHO for bredt
- Et fascinerende og ubesvaret spørgsmål er, om der er nogen dyb grammatik eller sproginstinkt over en baby ‘ s ønske om at lære, hårdt forbundet med os . Hvis der er, er det unikt menneskeligt eller et pattedyrsuniversal?
- Det er værd at læse om nogle sprog, der ikke er i den indoeuropæiske familie. Xhosa, Navaho, Thai, … Ethvert forsøg på at kodificere det universelle er mislykket, men alligevel vil enhver menneskelig baby lære alle menneskelige sprog, der udgør en betydelig del af hans eller hendes tidlige liv.
Svar
Taledele er morfologiske eller morfosyntaktiske ordklasser. Ikke alle sprog har dele af tale, men i dem der har det, såsom latin eller fransk eller engelsk, skelnes der mellem taledele baseret på deres infleksionsmønstre (eller mangel på dem) og deres tilladte kombinationer.
(For de af os, der har erfaring med kompilatorer, er delene af talen sammenlignelige med de klasser af tokens, der genkendes af lexeren, såsom identifikatorer, tal, operatorer og separatorer.)
For eksempel på latin der er tre meget forskellige bøjningsmønstre (verbal bøjning, nominel bøjning og pronominal bøjning); adverb, præpositioner og sammenhænge har ingen bøjning, men deres tilladte kombinationer er forskellige (adverb med adjektiver eller verb, præpositioner med substantiver eller nominelle grupper, sammenhænge med nominelle grupper eller sætninger). Grammatikere laver tabeller med bøjningsmønstre og tilladte kombinationer; cellerne i tabellen er delene af talen.
For eksempel på engelsk kan vi lave følgende klassifikationstræ:
-
Har ordet en -ing form, en fortid, kan den lave en fremtid med vil ? Hvis ja, er det et almindeligt verbum . (Eksempler: være, drik, sæt, se, tag.)
-
Ellers kan den vises i samme syntaktiske position som et almindeligt verbum? Hvis ja, er det et modal verbum . (Eksempler: kan, kan, skal.)
-
Ellers:
-
Kan det bestemme et verbum? Hvis ja, er det et adverb . (Eksempler: hurtigt, hurtigt, sandt, godt.)
-
Kan det fungere som genstand for et verbum? Hvis ja, er det enten et substantiv eller et pronomen :
-
Identificerer ordet en bestemt objekt?Hvis ja, er det et egennavn .
-
Ellers kan det bestemmes af et adjektiv? Hvis ja, er det et almindeligt substantiv .
-
Ellers er det et pronomen . (Engelske pronomen kan også identificeres ved deres særlige bøjning.)
-
-
Kan det bestemme et substantiv? Hvis ja, er det enten en artikel eller et adjektiv eller et tal :
-
Kan ordet danne grader af sammenligning? (Rent morfologisk set er “mere unik” morfologisk korrekt, selvom det er logisk fjollet.) Hvis ja, er det et almindeligt adjektiv .
-
Ellers er ordet et af en klasse af adjektiver, der kræves for at vises med substantiver, der bruges som emner eller direkte objekter? Hvis ja, er det en artikel eller demonstrativ.
-
Ellers udtrykker den et specifikt tal? Hvis ja, er det et nummer.
-
-
Mange ord tilhører mere end en af disse klasser. Især det store flertal af substantiver kan også fungere som adjektiver og omvendt.
-
-
Ellers skal ordet bruges straks foran en substantiv eller nominel gruppe eller umiddelbart efter et verbum? Hvis ja, så er det en præposition.
-
Ellers kan ordet bruges til at linke navneord eller nominelle grupper eller verb eller sætninger ? Hvis ja, så er det et sammenhæng.
-
Ellers har du fundet et ord, der ikke kan klassificeres af dette beslutningstræ. (Tip: overvej interjektioner såsom ah og oh.)
På engelsk , verb har et andet bøjningsmønster end substantiver, og begge har et andet bøjningsmønster end pronomen; i modsætning til latin, skaber engelsk ringe eller ingen forskel mellem substantiver og adjektiver (de er ikke rigtig forskellige sprogdele på engelsk), men engelsk har artikler. (Artikler fungerer syntaktisk nøjagtigt som demonstrative adjektiver, idet forskellen er, at et sprog siges at have artikler, hvis der er syntaktiske konstruktioner, hvor en artikel eller demonstrativ er absolut påkrævet, idet etiketten “artikler” anvendes på de demonstranter, der har den svageste betydning .)
På sprog med rig morfologi er forskellen mellem taledele klar, og sætningsstruktur bæres af morfologi alene eller med meget lidt hjælp fra ordrækkefølgen.
På den anden side hånd, isolerende sprog som mandarin har ingen bøjning overhovedet (eller næsten ingen); på sådanne sprog er begrebet “taledele” meget sløret og bliver sammenligneligt med forskellen mellem nøgleord og almindelige identifikatorer i programmeringssprog. Engelsk er godt på vej mod dette; mange engelske ord kan fungere som navneord, adjektiver og verbum enten helt uændrede (“de gå ” – verb, “vi havde en gå ” – substantiv, “alle systemer er gå “- adjektiv; eller” gå til et sted “- substantiv,” til sted noget “- verb, eller” have en drink “- substantiv,” til drink noget “- verb) eller med lille ændring (” rød “- adjektiv eller substantiv;” at rødme “) . I sådanne sprog uden morfologi eller meget lidt morfologi er forskellen mellem taledele stærkt dæmpet, og den syntaktiske struktur af sætninger er repræsenteret ved ordorden, ligesom i programmeringssprog.
For eksempel på latin “puer puellam vidit”, “puellam puer vidit”, “vidit puellam puer” osv. betyder alle “[drengen] så [pigen], mens der på engelsk ingen anden ordrækkefølge er mulig uden at ændre betydningen eller udtale sig uforståelig.
Svar
Dele af tale er virkelig en kunstig division valgt af mennesker til at forklare strukturen i vores sprog. De stiller ikke altid perfekt op. Tag japansk som et eksempel. Japansk har “partikler”, som er ord, der ikke passer ind i en bestemt kategori, som vi engelsktalende genkender. Der er også de polysyntetiske sprog, hvor et enkelt ord fanger det, som vi engelsktalende vil kalde en sætning. Og selvfølgelig har vi på engelsk nogle interessante ord som f.eks. En bestemt udforskende startende med bogstavet F, der trods kategorisering (som demonstreret i dette afgjort NSFW klip fra Boondock Saints ).
En interessant mulighed, der er i tråd med dine nummererede ord, er at se på sprog, der bruges til at beskrive semantiske webs som RDF og OWL. RDF er for eksempel bemærkelsesværdigt simpelt. Der er tre dele af “tale:” emner, predikater og objekter. Emner og predikater er altid “IRIer”, som har samme karakter som dine nummererede ord. Objekter er enten IRIer eller “datatype-værdier”, som er konkrete værdier som tal. Det er alt hvad der er ved det, og alligevel kan det beskrive verden med al smag af et mere avanceret sprog.
Selvfølgelig ville de ikke ” t sender det som et sådant billede. De “gengiver indholdet i et andet format, såsom Turtle, som er tekstbaseret og mere kortfattet med lettere paralleller til et interstellært kommunikationsformat:
<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
OWL har samme karakter, men er ret fascinerende, fordi den kan beskrive sin egen semantik ret elegant. For eksempel kunne du faktisk have en regel “Alle ord, der er genstand for en sætning, er også substantiver.” Disse forhold kan specificeres med tilstrækkelig regelmæssighed til, at OWL-brugere kan bruge “ræsonnerer” til at udfylde forhold, der ikke eksplicit er nedskrevet i dokumentet.
Den fantastiske magt ved disse semantiske websprog er, at hvis nogen har ikke specificeret semantikken for, hvad Word # 42 skal betyde i en bestemt konstruktion, eller hvis der ikke er noget ord, der opfylder dine behov, kan du kompensere for semantik til det. Du kan derefter skrive ned disse semantik (typisk i en OWL-ontologi). Andre kan læse disse semantikker og handle algoritmisk efter det. Så jeg kan definere et nyt ord # 3.14, som du aldrig har set før, og jeg kan gøre det på en sådan måde, at du har en chance for at forstå, hvad jeg mente med det!
Denne semantiske evne ville være yderst vigtig, hvis tidsforsinkelser var store. Sprog udvikler sig over tid, og hvis der er tilstrækkelig tidsforskydning mellem kommunikation, er det rimeligt at tro, at betydningen af substantiv # 42 kan ændre sig for den ene kultur og ikke for den anden. Evnen til i det mindste at forsøge at fange semantikken i det, du siger, ville være meget vigtig for at bekæmpe disse effekter.
Kommentarer
- At ‘ er meget i retning af hvad jeg tænkte. Et stort eksempel (og hvad jeg ønsker at finde ud af godt nok til at gengive) er en side, hvor de fortæller os ting, vi allerede ved: fastholdelse af vores solsystem inklusive ting som planeternes masse, radius og orbitale parametre. Det er for det meste attributter for navne
- Bortset fra at emner, prædikater og objekter er sætningsdele ikke taledele , det vil sige de hører til syntaks og ikke til morfologi . Dette er en kategorifejl. Både ordet ” he ” og ordet ” læser ” kan fungere som emner eller objekter (syntaktiske dele eller sætning), men ” he ” er et pronomen og ” læsere ” er et substantiv (morfologiske talesæt). (Ordet ” læser ” kan spærres af en artikel eller et adjektiv og gør flertal i -s ; så kan ordet ” he ” ikke bestemmes af en artikel eller et adjektiv og har en særlig bøjning.)
- @AlexP I så fald antager jeg, at ” taledele ” ville være IRI og datatype på disse sprog. Jeg ‘ Jeg bliver nødt til at tænke på, hvordan det bedst kan ordes. Jeg følte, at jeg allerede ville miste læseren, der prøvede at dykke dybt nok ned i sprogene til at binde dem til spørgsmålet.
- Fantastisk punkt om tidsforsinkelse i kommunikation og konnotationer af ord, der ændrer sig. Jeg ‘ Jeg forestiller mig udlændinge fra Gliese 581 c, som lærte engelsk fra Flintstones og hilser os ved at ønske os en ” gammeldags homoseksuel “. Ønsker også, at jeg kunne give dig ekstra point til Boondock Saints-referencen.
Svar
Sprog kan opdeles i flere lag.
- Fonologi er studiet af de mindste udelelige stykker, som sproget er konstrueret fra. Dette refererer til lyde som / g / eller / k / på det menneskelige sprog. Hvis dine lingvister studerede en radiotransmission, kunne det være en computerbit eller en anden lignende konstruktion.
- Morfologi er studiet af de mindste sprogstykker, der har betydning. Morfemer er naturligvis konstrueret af varierende antal fonemer. Et eksempel på en morfem ville være -isten i morfolog, som har betydning, selvom den ikke kan stå alene. Dele af tale falder ind under dette felt.
- Syntaks er undersøgelsen af, hvordan højttalere kombinerer morfemer for at lave grammatisk korrekte sætninger. For eksempel “Katten gik over bjerget brugte sine poter.” er ikke-grammatisk, selvom det er forståeligt.
- Semantik er studiet af, hvad sætninger betyder. “Katten fløj gennem bjerget med sine whiskers.” er grammatisk og har en semantisk betydning. Hvilket tilfældigvis er noget vrøvl.
- Pragmatik er studiet af, hvordan sprog forholder sig til den ydre verden. For eksempel “Kunne du lukke døren?”er semantisk et spørgsmål, men det er pragmatisk en anmodning (på engelsk). Et andet eksempel er med kontrakter. Ved at sige ja til en aftale siger du ikke kun, at du accepterer aftalen, men selve udsagnet er det, der gør aftalen gyldig .
Semantik og pragmatik er meget dårligt forståede felter.
For at analysere en transmission fra en fremmed art, skulle man Find ud af, hvad fonologien er, og træk derefter gennem hvert lag og prøv at finde ud af, hvordan stykkerne kan kombineres på gyldige og ugyldige måder.
Idet jeg specifikt henviser til taledele, er jeg bange for, at klassificeringssystemet adskiller sig efter sprog, da vi ikke klassificerer efter et eller andet universelt system, skelner vi ord i de samme dele af talen som grammatikken på det sprog bruger .
Lojban (da du spurgte) har ikke forskellige verb, substantiver, adverb og adjektiver. Det har prædikater som “prenu” (er en person) eller “xamgu” (er godt). Man kan sige “l e xamgu ku “(den ting, der er god) eller” le prenu ku “(den ting, som er en person eller bare” person “) og i visse tilfælde kan mange af disse partikler udelades, f.eks. “.i prenu cu xamgu” (personen er god) i stedet for “.i le prenu ku cu xamgu”. Dette fænomen (argumenterne for et prædikat) ligner noget substantivudsætninger på engelsk, men sproget skelner absolut ikke mellem, hvad man kunne overveje verb og adjektiver, og man bør heller ikke prøve at klassificere dem på den måde.
Kommentarer
- ” ” Katten fløj gennem bjerget ved sin whiskers. ” /…/ tilfældigvis er noget vrøvl. ” Vi er på Worldbuilding . Jeg ville ikke ‘ ikke være så sikker.
- Af « absolut ingen sondring mellem hvad man kunne betragte verb og adjektiver » Jeg kan kun antage, at du mener som en bekymring for syntaksen; for eksempel. “Er rødt” og “kører” håndteres begge på samme måde. Men part i et forhold og intern attribut er semantisk forskellige slags ting.
Svar
A “del af tale “er bare en klassificeringsordning, som forskerne pålægger sproget for at beskrive ordklasser. Disse grupper er baseret på disse ords grammatikfunktion, og at “hvor vi får” substantiv “og” verb “og” præposition, “de beskriver klasser af ord på engelsk. Men du har også navneord, der fungerer som verb (” Google det. “) Og mange yderligere underlige konstruktioner, der får hver” del af talen “til at blive opdelt i sin egen del af talen, hele vejen ned.
Så der er intet tal for det samlede beløb af “alle slags taledele.” Engelsk har en slags adverb; japansk har tre. Er disse separate taledele eller ej?
Nu , hvis du vil klassificere symbolerne på dit sprog, er der en god guide. Kontakt af Carl Sagan løser det nøjagtige problem, du beskriver; du skal starte med de første principper og bygge det ind i et komplekst sprog. SETI har forsøgt at komme med netop en sådan besked, og det er virkelig, virkelig svært.
Hvis du kan sende billeder, har du kun brug for en “del af talen”, TING. Med en TING, du kan specificere navneord; når du først har et navneord (ATOM), kan du oprette en “ligestillings ting” (ATOM = ATOM) og derefter fortsætte derfra og angive TING, som er tal, tæller ting osv.
Du kan bruge syntaks til at forklare begreber som ændring over tid (PROTON = PROTON, ELECTRON OPPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON AND ELECTRON = HYDROGEN), men alt er bare en ting.
Hvis dette lyder for håndbølget ( fordi det er ), vil du måske undersøge kodningsteorien; hvad du virkelig ønsker er en komprimeringsalgoritme / paritetsalgoritme, der forklarer matematik ved hjælp af generiske symboler.
Kommentarer
- ” Thing ” er slet ikke meningsfuld, da der ikke er nogen forskel. Men dit eksempel har
proton
(substantiv, generisk),=
(angiv et forhold),+
(udfør en operation),,
og( )
(struktur). Ja, det er alle ord, der kan kodes; at sige, at det ikke tilføjer noget. - « substantiver, der fungerer som verbum » dit eksempel er et verbum, der stammer fra et substantiv og bruges som et (handlings) verbum. Måske mente du at se på gerunds (eller hvad er det modsatte af det)?
- ” Ting ” var ikke det bedste ord, fordi jeg virkelig mener mere ” et symbol, der beskriver et objekt.” ” Google ” er et substantiv for en søgemaskine, men det kan være brugt som et verbum til at beskrive handlingen ved at lave en websøgning nu. Min hensigt var at sige, at (1) hvad du virkelig vil se på er en metode til at kode substantiver som symboler, ikke ” ord ” eller ” taledele, ” og (2) med klog kontekst og organisering, kan du kun bruge substantiver (og substantiver-som -verb) for at kommunikere komplekse ideer, og (3) ” taledele ” er meningsløs for din brugssag, hvad du virkelig har brug for er en metode til at kode symboler for objekter.