Quantas vezes, até mesmo sem querer, você não acionou a legenda da sua televisão? Ou até mesmo em um estabelecimento comercial, em uma padaria, em uma sala de espera, pôde ver que, como o volume não atingiria a todos, a legenda estava lá? Essa tecnologia, chamada também de legenda oculta, é o que chamamos de Closed Caption. Apresentam esse nome porque só aparecem quando são acionadas no televisor.
O sistema, entre outras palavras, transmite legendas de programas de televisão, seja filmes, novelas, telejornais, entre outros, para garantir acessibilidade a quem está utilizando o aparelho eletrônico, principalmente para as pessoas com deficiência auditiva.
Muitos investimentos no extremo do conhecimento humano ainda continuam, com estação especial, vôos orbitais, pesquisa para viagem a marte, mas a simples necessidade de atravessar uma rua, ouvir um sinal sonoro, entender o que se passa em uma televisão, ainda persistem.
A ideia é que essa tecnologia transmita a quem não pode ouvir o que se passa na TV em determinado momento todos os detalhes possíveis do que está sendo veiculado na televisão. As legendas não apenas transcrevem o áudio em texto, mas também destacam outros detalhes sonoros, como vaias, choro, grito, palmas, silêncio, e outras informações que são relevantes para que a informação seja passada ao ouvinte da mesma forma como se ele estivesse vendo.
As legendas podem ser feitas por humanos, por pessoas que simplesmente digita rapidamente as palavras, um estenotipista. Eles são chamados assim porque usam uma máquina chama estenótipo digital, que tem número reduzido de teclar e envia a legenda ao computador. Muitas emissoras ainda usam essa técnica, no entanto, ela é falha, porque alguns conteúdos não são transmitidos ou mesmo captados.
O sistema de Closed Caption da Xtream Solutions, no entanto, é totalmente automatizado. Não precisa de ninguém para manuseá-lo no momento de alguma transmissão, seja ela ao vivo ou gravada. Tudo é feito por meio de um processamento após o upload do vídeo no sistema MAM. Esse sistema nada mais é que um gerenciamento dos ativos digitais de alta resolução, para agilizar o fluxo de trabalho de emissora de TV Digital, por exemplo. Ele classifica, categoriza, indexa e cataloga o seu acervo.
O processo extrai o áudio do vídeo e transcreve em uma timeline adaptada ao layout do sistema. Depois de transcrito, pode ser tratado. A partir de então é possível fazer traduções, filtros por palavras, entre outras funções.
É por meio desse sistema que os processos jurídicos podem passar por uma melhor automação e maior celeridade. Com a captação do vídeo com áudio ou apenas do áudio de sessões jurídicas, é possível fazer a transcrição em texto e, em seguida, extrair para um arquivo de texto simples.
Dessa forma, para não precisar ouvir todo o áudio ou assistir a toda a sessão novamente, para rever certas partes, os interessados podem realizar pesquisas a partir de tags, que são palavras-chaves, ou palavras que foram ditas nos discursos e que são de relevância para o que se procura.