Considere um conlang projetado para uma transmissão interestelar para um destinatário que terá que descobrir para fora.
Estou pensando que será inventado com esse propósito, formal e rigoroso. Ele fará uma transição aparentemente sem sentido da notação matemática ou algoritmos de computador para a afirmação de fatos sobre coisas do mundo real.
Portanto, além dos substantivos e verbos óbvios, quantos “tipos” diferentes de palavras existem, realmente?
Alguém sabe alguma coisa sobre linguagens de ontologia ou Lojban ? Eu me pergunto se existem categorias mais universais do que as classes gramaticais usadas em inglês.
O motivo Estou perguntando é porque o número de categorias aparece diretamente no meu cenário. Não há ortografia no sentido convencional, pois a transmissão é apenas um monte de números. As palavras são simplesmente numeradas, então algo como Substantivo # 42 seria a grafia literal. Haverá códigos diferentes introduzindo categorias diferentes ou a categoria estará implícita por seu número: Palavra # 42 é um substantivo porque o tipo está implícito pelo resto do módulo de número 7 (ou quantos tipos precisamos).
Além disso, não há distinção entre o que consideramos palavras e pontuação. O agrupamento e os separadores também precisam de seus próprios códigos e são codificados da mesma maneira.
Comentários
- As partes do discurso são diferenciadas com base em seus padrões de inflexão (ou falta deles) e suas combinações permitidas. Por exemplo, em latim, existem três padrões de inflexão muito diferentes (conjugação verbal, declinação nominal e pronominal); advérbios, preposições e conjunções não têm inflexão, mas suas combinações permitidas são distintas (advérbios com adjetivos ou verbos, preposições com substantivos ou grupos nominais, conjunções com grupos nominais ou sentenças). Os gramáticos fazem tabelas com padrões de inflexão e combinações permitidas; as células são as classes gramaticais.
- @AlexP observe que, como as linguagens de computador modernas e a notação matemática, não haverá inflexões no conlang. Eu gosto de onde você está indo em termos de deixar a gramática conduzir o que são consideradas classes gramaticais, se você se importasse em desenvolver isso em uma resposta completa.
- Sobre qual idioma você está perguntando? Inglês? Latim ?? Seu conlang amplamente indefinido ??? Você está perguntando se existem universais ???? Pouco claro e IMHO muito amplo
- Uma questão fascinante e sem resposta é se existe alguma gramática profunda ou instinto de linguagem acima do desejo de aprender ‘ de um bebê, embutido em nós . Se houver, é exclusivamente humano ou um mamífero universal?
- Vale a pena ler sobre algumas línguas que não pertencem à família indo-européia. Xhosa, Navaho, Thai, … Todas as tentativas de codificar os universais falharam, mas qualquer bebê humano aprenderá todas as línguas humanas que formam uma parte significativa de sua infância.
Resposta
Partes do discurso são classes de palavras morfológicas ou morfossintáticas . Nem todos os idiomas têm classes gramaticais, mas naquelas que têm, como latim, francês ou inglês, as classes gramaticais são diferenciadas com base em seus padrões de inflexão (ou falta deles) e suas combinações permitidas.
(Para aqueles de nós que têm experiência com compiladores, as classes gramaticais são comparáveis às classes de tokens reconhecidos pelo lexer, como identificadores, números, operadores e separadores.)
Por exemplo, em latim existem três padrões muito diferentes de inflexão (conjugação verbal, declinação nominal e declinação pronominal); advérbios, preposições e conjunções não têm inflexão, mas suas combinações permitidas são distintas (advérbios com adjetivos ou verbos, preposições com substantivos ou grupos nominais, conjunções com grupos nominais ou sentenças). Os gramáticos fazem tabelas com padrões de inflexão e combinações permitidas; as células da mesa são as classes gramaticais.
Por exemplo, em inglês, podemos fazer a seguinte árvore de classificação:
-
A palavra tem um -ing forma, um tempo passado, pode formar um tempo futuro com irá ? Se sim, então é um verbo comum . (Exemplos: be, drink, put, see, take.)
-
Caso contrário, pode se aparecer na mesma posição sintática que um verbo regular? Se sim, então é um verbo modal . (Exemplos: pode, pode, deve.)
-
Caso contrário:
-
Ele pode determinar um verbo? Se sim, então é um advérbio . (Exemplos: rápido, rápido, de verdade, bem.)
-
Pode funcionar como sujeito de um verbo? Se sim, então é um substantivo ou um pronome :
-
A palavra identifica um objeto particular?Se sim, é um substantivo próprio .
-
Caso contrário, pode ser determinado por um adjetivo? Se sim, então é um substantivo comum .
-
Caso contrário, é um pronome . (Os pronomes em inglês também podem ser identificados por sua inflexão peculiar.)
-
-
Ele pode determinar um substantivo? Se sim, então é um artigo ou um adjetivo ou um numeral :
-
A palavra pode formar graus de comparação? (Morfologicamente falando – “mais único” é morfologicamente correto, embora logicamente bobo.) Se sim, é um adjetivo comum .
-
Caso contrário, é uma palavra de uma classe de adjetivos que devem aparecer com substantivos usados como sujeitos ou objetos diretos? Se sim, então é um artigo ou demonstrativo.
-
Caso contrário, expressa um número específico? Se sim, então é um numeral.
-
-
Muitas palavras pertencem a mais de uma dessas classes. Em particular, a grande maioria dos substantivos também pode funcionar como adjetivos e vice-versa.
-
-
Caso contrário, a palavra deve ser usada imediatamente antes de um substantivo ou grupo nominal, ou imediatamente após um verbo? Se sim, então é uma preposição.
-
Caso contrário, a palavra pode ser usada para ligar substantivos, ou grupos nominais, ou verbos, ou sentenças ? Se sim, então é uma conjunção.
-
Caso contrário, você encontrou uma palavra que não pode ser classificada por esta árvore de decisão. (Dica: considere interjeições como ah e oh.)
Em inglês , os verbos têm um padrão de inflexão diferente dos substantivos e ambos têm um padrão de inflexão diferente dos pronomes; ao contrário do latim, o inglês faz pouca ou nenhuma diferença entre substantivos e adjetivos (eles não são realmente diferentes classes gramaticais em inglês), mas o inglês tem artigos. (Os artigos funcionam sintaticamente exatamente como os adjetivos demonstrativos, a diferença é que se diz que uma linguagem tem artigos se houver construções sintáticas em que um artigo ou demonstrativo é absolutamente necessário, com o rótulo “artigos” sendo aplicado aos demonstrativos que têm o significado mais fraco .)
Em línguas com uma morfologia rica, a distinção entre partes do discurso é clara, e a estrutura da frase é carregada apenas pela morfologia ou com muito pouca ajuda da ordem das palavras.
Por outro lado Por outro lado, idiomas isolados como o mandarim não têm qualquer inflexão (ou quase nenhuma); nessas linguagens, a noção de “classes gramaticais” é muito confusa e se torna comparável à diferença entre palavras-chave e identificadores comuns em linguagens de programação. O inglês está bem encaminhado nesse sentido; muitas palavras em inglês podem funcionar como substantivos, adjetivos e verbos completamente inalterados (“they go ” – verbo, “we had a go ” – substantivo, “all systems são ir “- adjetivo; ou” ir para um lugar “- substantivo,” para colocar algo “- verbo; ou” beber uma bebida “- substantivo,” para beber alguma coisa “- verbo) ou com pouca alteração (” vermelho “- adjetivo ou substantivo;” avermelhar “) . Nessas linguagens sem morfologia ou com muito pouca morfologia, a distinção entre classes gramaticais é altamente atenuada e a estrutura sintática das frases é representada pela ordem das palavras, muito parecido com nas linguagens de programação.
Por exemplo, em latim “puer puellam vidit”, “puellam puer vidit”, “vidit puellam puer” etc. todos significam “[o] menino viu [a] menina”, ao passo que em inglês nenhuma outra ordem de palavras é possível sem alterar o significado ou fazer o enunciado incompreensível.
Resposta
As partes do discurso são, na verdade, uma divisão artificial escolhida pelos humanos para explicar a estrutura da nossa língua. Eles nem sempre se alinham perfeitamente. Tome o japonês como exemplo. O japonês tem “partículas”, que são palavras que não se enquadram em nenhuma categoria específica que nós, falantes de inglês, reconhecemos. Existem também as línguas polissintéticas em que uma única palavra captura o que nós, falantes de inglês, chamaríamos de frase. E, claro, em inglês, temos algumas palavras interessantes, como um palavrão particular começando com a letra F, que desafia a categorização (como demonstrado neste decididamente NSFW clipe dos Santos de Boondock ).
Uma opção interessante que segue as linhas de suas palavras numeradas é olhar para as linguagens usadas para descrever redes semânticas como RDF e OWL. RDF, por exemplo, é notavelmente simples. Existem três partes do “discurso”: sujeitos, predicados e objetos. Sujeitos e predicados são sempre “IRIs”, que são de natureza semelhante às suas palavras numeradas. Objetos são IRIs ou “valores de tipo de dados”, que são valores concretos como números. Isso é tudo que há para fazer, e ainda pode descrever o mundo com todo o sabor de qualquer linguagem mais avançada.
Claro, eles não ” envie-o como uma imagem como essa. Eles “renderizam o conteúdo em um formato diferente, como Turtle, que é baseado em texto e mais conciso, com paralelos mais fáceis para um formato de comunicação interestelar:
<http://example.org/123> dc:subject <http://example.org/subject32> . <http://example.org/subject32> rdf:type ex:ExampleSubjects ; dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
O OWL é semelhante em natureza, mas é bastante fascinante porque pode descrever sua própria semântica de forma bastante elegante. Por exemplo, você poderia realmente ter uma regra “Todas as palavras que são o assunto de uma frase também são substantivos.” Esses relacionamentos podem ser especificados com regularidade suficiente para que os usuários OWL possam usar “raciocinadores” para preencher os relacionamentos que não foram explicitamente escritos no documento.
O poder fantástico dessas linguagens da web semântica é que, se alguém não especificou a semântica do que a palavra 42 deve significar em uma construção particular, ou se não houver uma palavra que atenda às suas necessidades, você pode criar a semântica para ela. Você pode então anotar essa semântica (normalmente em uma Ontologia OWL). Outros podem ler essa semântica e agir com base em algoritmos. Portanto, posso definir uma nova palavra # 3.14 que você “nunca viu antes, e posso fazer isso de forma que você tenha a chance de entender o que quero dizer com ela!
Essa capacidade semântica seria seria extremamente importante se a defasagem de tempo fosse grande. Os idiomas evoluem com o tempo, e se houver defasagem de tempo suficiente entre as comunicações, é razoável acreditar que o significado do substantivo nº 42 pode mudar para uma cultura e não para outra. A capacidade de pelo menos tentar capturar a semântica do que você está dizendo seria muito importante para combater esses efeitos.
Comentários
- Isso ‘ é muito parecido com o que eu estava pensando. Um grande exemplo (e o que eu quero descobrir bem o suficiente para renderizar) é uma página onde eles nos dizem coisas que já sabemos: propriedades de nosso sistema solar, incluindo coisas como massa, raio e parâmetros orbitais dos planetas. São principalmente atributos de nomes
- Exceto que sujeitos, predicados e objetos são partes da frase e não classes gramaticais , ou seja, pertencem a sintaxe e não para morfologia . Este é um erro de categoria. Tanto a palavra ” ele ” e a palavra ” leitor ” pode funcionar como sujeitos ou objetos (partes sintáticas ou sentença), mas ” ele ” é um pronome e ” leitores ” é um substantivo (classes morfológicas). (A palavra ” leitor ” pode ser desfeita por um artigo ou um objetivo, e torna o plural em -s ; a palavra ” he ” não pode ser determinada por um artigo ou adjetivo e tem uma inflexão peculiar.)
- @AlexP Nesse caso, suponho que a ” classes gramaticais ” seria IRI e o tipo de dados nesses idiomas. Eu ‘ terei que pensar na melhor forma de expressar isso. Senti que já ia perder o leitor tentando mergulhar fundo o suficiente nas línguas para vinculá-los à pergunta.
- Ótimo ponto sobre o lapso de tempo nas comunicações e as conotações da mudança das palavras. Eu ‘ estou imaginando alienígenas de Gliese 581 c que aprenderam inglês com os Flintstones e saúdo-nos desejando-nos um ” tempos homossexuais “. Também gostaria de poder dar a você pontos extras para a referência dos Boondock Saints.
Resposta
O idioma pode ser dividido em várias camadas.
- A fonologia é o estudo das menores peças indivisíveis das quais a linguagem é construída. Refere-se a sons como / g / ou / k / na linguagem humana falada. Se os seus linguistas estudaram uma transmissão de rádio, poderia ser um bit de computador ou outra construção semelhante.
- Morfologia é o estudo das menores partes da linguagem que carregam significado. Morfemas sendo, é claro, construídos a partir de um número variável de fonemas. Um exemplo de morfema seria o -ist em morfologista, que carrega significado, embora não possa ser autônomo. As partes do discurso se enquadram neste campo.
- Sintaxe é o estudo de como os falantes combinam morfemas para formar sentenças gramaticalmente corretas. Por exemplo, “O gato caminhou pela montanha usando suas patas.” não é gramatical, embora seja compreensível.
- Semântica é o estudo do significado das sentenças. “O gato voou pela montanha pelos bigodes.” é gramatical e tem um significado semântico. O que não faz sentido.
- Pragmática é o estudo de como a linguagem se relaciona com o mundo externo. Por exemplo, “Você poderia fechar a porta?”é semanticamente uma pergunta, mas pragmaticamente é um pedido (em inglês). Outro exemplo são os contratos. Ao dizer sim a um acordo, você não está apenas dizendo que aceita o acordo, mas a própria declaração é o que torna o acordo válido .
A semântica e a pragmática são campos muito mal compreendidos.
Para analisar a transmissão de uma espécie exótica, seria necessário determinar o que é a fonologia e, em seguida, passar por cada camada tentando descobrir como as peças podem ser combinadas de maneiras válidas e inválidas.
Referindo-se especificamente às classes gramaticais, receio que o sistema de classificação difere por idioma, uma vez que não classificamos de acordo com algum sistema universal, distinguimos palavras nas mesmas classes gramaticais que a gramática desse idioma usa .
Lojban (já que você perguntou) não tem verbos, substantivos, advérbios e adjetivos distintos. Tem predicados como “prenu” (é uma pessoa) ou “xamgu” (é bom). Pode-se dizer “l e xamgu ku “(a coisa que é boa) ou” le prenu ku “(a coisa que é uma pessoa, ou apenas” pessoa “) e, em certos casos, muitas dessas partículas podem ser omitidas, por ex. “.i prenu cu xamgu” (a pessoa é boa) em vez de “.i le prenu ku cu xamgu”. Este fenômeno (os argumentos de um predicado) é parecido com sintagmas nominais em inglês, mas a língua não faz absolutamente nenhuma distinção entre o que se poderia considerar verbos e adjetivos, nem você deve tentar classificá-los dessa forma.
Comentários
- ” ” O gato voou pela montanha por seu bigodes. ” /…/ parece um absurdo. ” Estamos no Construção de mundos . Eu não ‘ não teria tanta certeza.
- Por « absolutamente nenhuma distinção entre o que se poderia considerar verbos e adjetivos » Só posso supor que você se refere a uma questão de sintaxe; por exemplo. “Está vermelho” e “está em execução” são ambos predicados tratados da mesma maneira. Mas parte de um relacionamento e atributo interno são tipos de coisas semanticamente diferentes.
Resposta
A “parte de discurso “é apenas um esquema de classificação, imposto à linguagem pelos pesquisadores, para descrever classes de palavras. Esses grupos são baseados na função gramatical dessas palavras, e é aí que obtemos “substantivo”, “verbo” e “preposição”; eles descrevem classes de palavras em inglês. Mas você também tem substantivos que agem como verbos (” Google isso. “) E muitas outras construções estranhas que fazem com que cada” classe gramatical “seja dividida em sua própria classe gramatical, até o fim.
Portanto, não há número para a soma total de “todos os tipos de classes gramaticais.” O inglês tem um tipo de advérbio; o japonês tem três. Essas classes gramaticais são separadas ou não?
Agora , se quiser classificar os símbolos em seu idioma, há um “guia muito bom. Contato de Carl Sagan resolve exatamente o problema que você está descrevendo; você precisa começar com os primeiros princípios e transformá-los em uma linguagem complexa. O SETI tem tentado apresentar essa mensagem e é muito, muito difícil.
Se você pode enviar fotos, só precisa de uma “classe gramatical”, a COISA. THING, você pode especificar substantivos; uma vez que você tenha um substantivo (ATOM), você pode criar uma “coisa de igualdade” (ATOM = ATOM) e continuar a partir daí, especificando COISAS que são números, contando coisas, etc.
Você pode usar a sintaxe para explicar conceitos como mudança ao longo do tempo (PROTON = PROTON, ELETRON OPOSITEOF PROTON, PROTON + NEUTRON = NEUTRON, PROTON E ELETRON = HYDROGEN), mas tudo é apenas uma COISA.
Se isso soa muito modesto ( porque é ), você pode querer dar uma olhada na teoria da codificação; o que você “realmente quer é um algoritmo de compactação / algoritmo de paridade que explica a matemática usando símbolos genéricos.
Comentários
- ” Coisa ” não é de todo significativo, pois não há distinções. Mas seu exemplo tem
proton
(substantivo, genérico),=
(indicar um relacionamento),+
(realizar uma operação),,
e( )
(estrutura). Sim, todas são palavras que podem ser codificadas; dizer que não acrescenta nada. - « substantivos que agem como verbos » seu exemplo é um verbo que veio de um substantivo e é usado como um verbo (de ação). Talvez você quisesse olhar para gerúndios (ou o que é o oposto disso)?
- ” Coisa ” não era a melhor palavra porque realmente quero dizer mais ” um símbolo que descreve um objeto.” ” Google ” é um nome próprio para um mecanismo de pesquisa, mas pode ser usado como um verbo para descrever a ação de fazer uma pesquisa na web agora. Minha intenção era dizer que (1) o que você realmente deseja é um método para codificar substantivos como símbolos, não ” palavras ” ou ” classes gramaticais, ” e (2) com contexto e organização inteligentes, você pode usar apenas substantivos (e substantivos como -verbs) para comunicar ideias complexas e (3) ” classes gramaticais ” não faz sentido para o seu caso de uso, o que você realmente precisa é um método para codificar símbolos para objetos.