Chat with us, powered by LiveChat

Processo de desenvolvimento de tradução automática personalizada

Para lançar um novo Motor de tradução automática personalizado, a Trusted Translations precisa de um período de treinamento e configuração iniciais.

A seguir, um processo de implementação típico para criar um novo motor de MT.

Personalizando novos motores de MT para cada par de idiomas

Os dados de treinamento necessários para criar um motor de qualidade dependem muito das especificidades do tipo de domínio de conteúdo; assim, amostras de conteúdo existente serão extremamente úteis para criar dados de treinamento relevantes e, consequentemente, um motor de alta qualidade para cada par de idiomas. Existem várias opções disponíveis para reunir dados de treinamento para criar um motor personalizado.

  • Material traduzido existente:

    O ponto de partida ideal para qualquer motor de tradução automática personalizado é encontrar e utilizar material previamente traduzido, envolvendo conteúdo que seja muito semelhante ao que se deseja traduzir. Quanto mais material previamente traduzido estiver disponível, menos caro e mais rápido será o processo.

  • Dados monolingues existentes:

    Se existirem quantidades suficientes de conteúdo de origem, é possível extrair frases limpas e monolíngues que podem ser traduzidas pelos nossos especialistas. Ao criar um conjunto de dados paralelos para cada par de idiomas, podemos criar o conteúdo apropriado a partir do qual construiremos e treinaremos um motor personalizado.

  • Criar um corpus especializado de outras fontes:

    Além de utilizar dados monolingues, pesquisaremos na web materiais que sejam alinhados com o conteúdo que será executado no motor. Como os nossos motores são estatísticos por natureza, precisaremos pesquisar dados paralelos e monolingues. Inicialmente, construiremos sistemas usando os dados fornecidos pelo cliente juntamente com os dados suplementares extraídos da web para demonstrar a eficácia dessa abordagem.

    Os dados paralelos encontrados na web precisarão ser limpos (verificação ortográfica, verificação de alinhamento, exclusão de duplicatas, etc.) antes de serem usados ​​como dados de treinamento para um sistema MT. Quantidades muito maiores de envolvimento manual são necessárias neste cenário quando comparado com quando o cliente é capaz de fornecer desde o início quantidades suficientes de dados alinhados de boa qualidade. Levará de 4 a 6 semanas para construir o novo motor.

Conforme mais e mais resultados são pós-editados, isso pode ser convertido em dados de treinamento de boa qualidade. Assim, a qualidade do sistema irá melhorar muito rapidamente ao longo do tempo.

Novos motores de MT personalizados aprimoram a pós-edição humana

Existem vários fluxos de trabalho envolvendo um Motor de tradução automática personalizado. Uma configuração comum é integrar um processo de pós-edição humana. Sob este fluxo de trabalho, o resultado do Motor de tradução automática personalizado é editado por um de nossos especialistas linguistas para melhorar a qualidade do resultado atual, bem como para treinar novamente o motor para futuras traduções. Enquanto o editor modifica o resultado para melhorar a qualidade, o motor se torna mais inteligente. À medida que mais traduções fluem pelo motor, mais inteligentes se tornam os motores. Com o tempo, a lacuna de qualidade entre uma tradução humana completa e essa solução diminuirá muito. Além disso, o tempo de entrega e os custos serão significativamente menores. Na nossa opinião, esses motores se tornarão um ativo e um diferencial de mercado para qualquer cliente que tenha essa necessidade.

© 2019 by Trusted Translations, Inc. Todos os direitos reservados. | Mapa do site