A digitalização e o tratamento computacional do Vocabulário Ortográfico da Língua Portuguesa de 1940 enquadra-se num projeto mais amplo, a Edição Digital dos Vocabulários da Academia das Ciências, fruto de um protocolo entre a Academia das Ciências de Lisboa (ACL) e a Faculdade de Ciências Sociais e Humanas da Universidade NOVA de Lisboa (NOVA FCSH), por intermédio do grupo de Lexicologia, Lexicografia e Terminologia (LLT) do Centro de Linguística da Universidade NOVA de Lisboa (NOVA CLUNL). Para a assessoria computacional, o projeto conta com a participação do centro de investigação 2Ai – Applied Artificial Intelligence Laboratory, da Escola Superior de Tecnologia do Instituto Politécnico do Cávado e do Ave (IPCA). Para efeitos de edição, recorre-se ao LeXmart.

O VOLP-1940 é o primeiro de todos os vocabulários ortográficos publicados pela Academia das Ciências de Lisboa (ACL) a ser digitalizado com vista à criação de um corpus lexicográfico digital. O objetivo é reunir as versões de todas essas obras lexicográficas de referência impressas– as edições de 1940, 1947, 1970, e, por último, a de 2012.

O VOLP-1940 é o primeiro vocabulário académico português. Após a digitalização da obra, é iniciada a anotação linguística baseada na metalinguagem de anotação eletrónica, eXtensible Markup Language (XML), seguindo as diretivas de anotação da Text Encoding Initiative (TEI), mais concretamente a aplicação de TEI Lex-0, um subformato TEI de aplicação a dicionários e vocabulários.

O VOLP-1940 será de acesso aberto, em conformidade com os princípios FAIR (Findable, Accessible, Interoperable, Reusable), de forma a garantir a sua conexão futura a outros sistemas e recursos existentes, em particular do mundo lusófono.