A digitalização e o tratamento computacional do Vocabulário Ortográfico da Língua Portuguesa de 1940 enquadra-se num projeto mais amplo, a Edição Digital dos Vocabulários da Academia das Ciências, fruto de um protocolo entre a Academia das Ciências de Lisboa (ACL) e a Faculdade de Ciências Sociais e Humanas da Universidade NOVA de Lisboa (NOVA FCSH), por intermédio do grupo de Lexicologia, Lexicografia e Terminologia (LLT) do Centro de Linguística da Universidade NOVA de Lisboa (NOVA CLUNL). Para a assessoria computacional, o projeto conta com a participação do centro de investigação 2Ai – Applied Artificial Intelligence Laboratory, da Escola Superior de Tecnologia do Instituto Politécnico do Cávado e do Ave (IPCA). Para efeitos de edição, recorre-se ao LeXmart.

O VOLP-1940 é o primeiro de todos os vocabulários ortográficos publicados pela Academia das Ciências de Lisboa (ACL) a ser digitalizado com vista à criação de um corpus lexicográfico digital. O objetivo é reunir as versões de todas essas obras lexicográficas de referência impressas– as edições de 1940, 1947, 1970, e, por último, a de 2012.

O VOLP-1940 é o primeiro vocabulário académico português. Após a digitalização da obra, é iniciada a anotação linguística baseada na metalinguagem de anotação eletrónica, eXtensible Markup Language (XML), seguindo as diretivas de anotação da Text Encoding Initiative (TEI), mais concretamente a aplicação de TEI Lex-0, um subformato TEI de aplicação a dicionários e vocabulários.

O VOLP-1940 será de acesso aberto, em conformidade com os princípios FAIR (Findable, Accessible, Interoperable, Reusable), de forma a garantir a sua conexão futura a outros sistemas e recursos existentes, em particular do mundo lusófono.

VOLP-1940

No acervo lexicográfico português, o VOLP-1940 é o primeiro vocabulário ortográfico com a chancela da Academia das Ciências de Lisboa. Foi publicado no ano de 1940 pela Imprensa Nacional de Lisboa, num só volume, com um total de 821 páginas.

Academia das Ciências de Lisboa (1940). Vocabulário Ortográfico da Língua Portuguesa (VOLP-1940) (1940). Lisboa: Imprensa Nacional.

 

Vocabulário ortográfico

Um vocabulário ortográfico é uma lista de palavras na sua forma gráfica oficial com indicação da categoria morfossintática, podendo ainda incluir informações adicionais, como ortoépia, especificidades de flexão, regras de escrita, entre outras. É «um instrumento fundamental para a gestão da ortografia da língua» (Academia Brasileira de Letras, 2017).

In Salgado e Costa (2020), «O projeto Edição Digital dos Vocabulários da Academia das Ciências: o VOLP-1940», in Revista da Associação Portuguesa de Linguística, n.º 7 [no prelo]

 

VOLP-1940 no digital

No contexto português, este projeto vem preencher uma lacuna em relação a obras lexicográficas retrodigitalizadas online pesquisáveis, baseadas em padrões e metodologias atuais que promovem a partilha e a harmonização de dados. Propomo-nos aplicar estes novos princípios – métodos computacionais, padrões interoperáveis e tecnologias semânticas que facilitam a organização de grandes quantidades de dados lexicais – segundo uma metodologia rigorosa e tendo por base necessariamente o conhecimento linguístico e lexicográfico, muitas vezes ignorado ou subvalorizado na era da vertente mais tecnológica das Humanidades Digitais.

  

Apoios

X

Conteúdo protegido

Conteúdo protegido por direitos de autor