Requisitos básicos para uma videoconferência bem sucedida


Componentes básicos

Como discutimos em nossa introdução O que é videoconferência? qualquer terminal de videoconferência deve ter alguns componentes básicos para "fazer o trabalho": uma câmera (para capturar o vídeo local), um display de vídeo (para exibir o vídeo distante), um microfone (para capturar o áudio local), e caixas de som (para tocar o áudio distante) Além destes componentes mais óbvios, um terminal de videoconferência inclui também um codec, uma interface de usuário, um sistema de computador para operar, e uma conexão de rede. Cada um destes componentes desempenha um papel chave em determinar a qualidade, confiabilidade e facilidade ao experimentar a videoconferência como também qualquer conveniência de um dado terminal de videoconferência para propósitos especiais. Uma compreensão básica de cada um dos papéis destes componentes o ajudará a mapear as capacidades da tecnologia de videoconferência para suas necessidades de aplicação específica.

A Câmera Principal

Por natureza da definição geral de videoconferência, pelo menos uma fonte de vídeo está tipicamente presente em cada terminal. A fonte de vídeo mais comum é uma câmera principal única que captura movimento ao vivo acontecendo em uma ponta de forma que ele possa ser enviado para a outra em tempo próximo ao real. ("Tempo próximo ao real” é um conceito importante no sucesso de uma videoconferência e é melhor analisado nas seções abaixo sobre o codec e em nossa seção sobre conexão de rede mais adiante.).

O componente mais importante da câmera é o sensor de imagem que captura instantâneos da visão em intervalos regulares (25-30 vezes por segundos.) Este sensor é caracterizado pelo número de pixeis ou pontos que ele pode distinguir em uma imagem, chamada resolução. As resoluções típicas são 640x480 pixeis para webcams, 720x480 para câmeras de NTSC e 720x576 para câmeras de PAL. (A altura, ou resolução vertical, é listada primeiro; a largura, ou resolução horizontal, é listada em segundo lugar.) A tecnologia na qual o sensor é baseado também é importante. Câmeras de videoconferência baratas, normalmente chamadas de "webcams" vem com um sensor de CMOS, que dá qualidade de imagem adequada, mas não pode entregar sinais de cor e brilho muito bem. Isto faz com que as cores pareçam opacas ou ligeiramente distorcidas e torna difícil também ajustar o contraste. As câmeras de CMOS são também muito afetadas pela qualidade de iluminação no ambiente. Câmeras melhores, pelo múltiplo do preço, incorporam sensores de CCD, semelhantes a aquelas usadas em câmeras profissionais, e podem então capturar uma imagem muito melhor, oferecendo muitas possibilidades de ajustes e adaptação para qualquer ambiente.

Ao selecionar uma câmera para videoconferência, é importante entender que a qualidade de sua câmera determina como seu vídeo aparecerá no receptor final. Freqüentemente nossa primeira reação é atribuir a qualidade de vídeo ao sistema receptor (i.e., “Por que a imagem parece tão ruim quando nós gastamos $XXXX neste sistema?!";) contudo, se você não pode ver o outro local claramente, na maioria das vezes a câmera do outro lado é culpada. Acontece que ao avaliar a qualidade da câmera, você precisa estar certo que lhe seja mostrado como sua imagem aparecerá para os outros. Além da qualidade de imagem, as câmeras variam em termos de outras características que afetarão ambas sua utilidade e seu custo. Entre elas estão: a habilidade de pan (mover uma câmera suavemente na horizontal), tilt (mover uma câmera de vídeo para cima e para baixo) e zoom (mudar o comprimento focal de uma lente para ampliar um objeto): freqüentemente abreviada como uma câmera PTZ), lente de ângulo largo versus ângulo estreito, foco manual versus autofoco, íris manual versus auto-íris, autolocalização, controle remoto, e/ou controle RS-232. Naturalmente, como características são somadas, custo sobe. Considerando o impacto da câmera principal no sucesso de uma videoconferência, é extremamente importante imaginar previamente como a câmera será realmente usada (i.e., instalações da sala, número de participantes, temperamento do usuário, etc.) e então assegurar que a câmera selecionada pode sustentar aqueles usos.

A Exibição do Vídeo

Além de capturar o vídeo local, uma solução de videoconferência deve incluir a habilidade de exibir o vídeo distante que está sendo recebido. Este vídeo entrante é exibido em um monitor, mais freqüentemente um monitor de computador, que influencia o quão claramente o local distante pode ser visto e também quantas pessoas no local receptor podem facilmente vê-lo. Considerações "típicas" quanto à qualidade de exibição do monitor como tamanho da tela e resolução afetam o tamanho e claridade da janela de vídeo entrante e também a integração da janela de vídeo entrante com a interface da aplicação que o cerca. A qualidade da imagem dentro da janela de vídeo propriamente está, porém, mais diretamente relacionada ao desempenho e capacidades do codec e à qualidade e à largura de banda da conexão de rede. No caso de um terminal de videoconferência desktop, a maioria oferece uma janela de vídeo em escala que compartilha o espaço de um PC desktop com outras janelas de programas /aplicações. Em tais casos, os aspectos da conferência mais afetados pelas capacidades do monitor do computador são o aparecimento da janela de vídeo propriamente (não o que está dentro dela) e a habilidade de manipular aquela janela dentro de um display maior. Em alguns casos, um monitor de exibição inteira pode ser dedicado a exibir vídeo entrante (uma conferência de "tela cheia") enquanto um segundo monitor é usado para controle de chamadas e compartilhamento de dados. Uma nota: As resoluções de vídeo sustentadas pelos padrões populares de videoconferência H.323 são CIF (352 X 288 pixeis) e QCIF (176 por 144 pixeis.) Já que estas resoluções são fixas, aumentando a largura de banda da rede de um telefonema além de um certo ponto não mostrará uma diferença apreciável em qualidade de vídeo dentro de qualquer frame de vídeo dado. Porém, a largura de banda adicional habilita taxas de quadros mais altos (i.e., o envio de frames de vídeo adicionais por segundo), que pode ter melhorias dramáticas na suavidade e qualidade de movimento do vídeo.

Uma coisa para ter em emnte relativa à exibição de vídeo é que as resoluções menciodas acima são bastante pequenas comparadas a uma resolução típica de 1024x768 de uma tela de computador. Se você aumentar a janela de vídeo em um PC, nem todo pixel exibido será "real". Por exemplo, se você dobrar a largura e a altura da janela para 704x576 pixeis, só um quarto dos pixeis serão as informações de imagem real:

352x288


704x576



Os pixeis brancos na segunda imagem estarão automaticamente preenchidos pelo sistema para parecerem semelhantes a seus vizinhos, mas eles não serão exatamente o que a imagem original era e a qualidade do vídeo será degradada. Este é o mesmo efeito que você pode ver quando você aumenta a janela de um media player (Windows, Quicktime, Real) tocando um clipe de vídeo. Então, se deveria aumentar uma imagem quando mais pessoas estiverem sentando ao redor um monitor e precisando ver a imagem.

Por outro lado, videoconferências em salas, normalmente os dispositivos de exibição são maiores. Um monitor de TV pode ser usado na maioria dos casos. Uma regra básica para selecionar o tamanho correto para o monitor é que os espectadores devem ficar a uma distância de 2 a 6 vezes o tamanho diagonal da tela. Como um exemplo, se os participantes na sala estão sentando entre 4 e 12 pés de distância do monitor, então um 24" TV seria suficiente. Em salas grandes, onde um projetor de LCD ou DLP pode ser instalado, o tamanho diagonal e a distância deveriam ainda aderir a esta relação.

Componentes do Áudio

Em uma videoconferência o áudio é tão importante, e freqüentemente considerado mais importante, quanto o vídeo. Se nós perdemos o vídeo ou se for de qualidade pobre em uma conferência mas o áudio permanece intacto, nós podemos ainda realizar muitos de nossos objetivos de comunicação. A conferência simplesmente se tornaria um teleconferência em lugar de uma videoconferência. Por outro lado, qualidade auditiva pobre ou corrompida elimina eficazmente uma videoconferência, freqüentemente fazendo com que os participantes busquem um telefone com "áudio nativo" para completar a reunião. Levando isso em conta, os dispositivos que capturam áudio local (microfones) e aqueles que reproduzem o áudio distante (caixas de som) são componentes críticos de uma conferência. Conjuntamente estão as características associadas à transmissão de áudio full duplex (simultâneas dos dois lados) compreensível, tais como o cancelamento do eco, a supressão de barulho e a mistura de áudio. Estas características são influenciadas por uma combinação dos microfones, caixas de som, e codecs. Semelhante a discussão sobre a câmera, seria impossível cobrir todas as características de desempenho de áudio aqui. Porém, uma solução para assegurar um áudio que suporte os requisitos e expectativas de uma conferência é examinar a localização, a quantidade e a qualidade de seus microfones e caixas de som. Novamente, quando características são somadas, o custo sobe, entretanto as diferenças de custo não podem ser tão pronunciadas quanto numa seleção de câmera. Já que a audição é freqüentemente o melhor teste, você pode falar e ouvir antes de você comprar!

Uma das dicas para ajustar a qualidade auditiva é que você nunca pode saber 100% que qualidade de som você está transmitindo. Isto pode ser determinado de forma mais útil por um colega que está comprometido em uma videoconferência com você e diz você como você soa. Se eles ouvirem reverberações ou ecos, isto indica um problema no seu terminal e você deveria fazer os ajustes necessários em seu sistema de áudio para corrigí-lo, e então conferir com seu colega para ver se funcionou. Existem também normalmente comandos de teste "loopback" em sistemas de videoconferência que permitem que você possa ouvir que sinal você está enviando, mas eles não são tão confiáveis. Por outro lado se você está for efeitos de eco quando você estiver falando com outro local, você pode fazer-lhes um favor avisando-os que eles precisem ajustar suas configurações. Eles não saberão a menos que você lhes diga!

Para videoconferências que não sejam pessoais, um áudio mixer pequeno ou maior é uma ferramenta muito útil. Ele habilita você a ajustar ganhos e volumes com mais precisão do que os ajustes embutidos da maioria dos sistemas de videoconferência. Também habilita você a separar e misturar sinais mais facilmente. Uma característica que é particularmente útil em mixers é a habilidade de produzir misturas diferentes dos mesmos sinais. Por exemplo, você quer enviar o sinal de áudio do local distante para seu amplificador ou caixas de som, mas você quer excluí-lo de qualquer sinal que seja realimentado para eles.

Em relação aos microfones, existe uma variedade muito grande que pode ser usada para videoconferências, desde um headset até uma variedade de microfones para salas. Os microfones baratos para computadores de mesa que custam em torno de US$2-3 achados em muitas lojas produzem freqüentemente um áudio não aceitável ou não são full duplex. Em uma nota oposta, as freqüências usadas em videoconferência não excedem 7 KHz, o que é mais do que suficiente para sinais de voz, por isso microfones caros e profissionais com resposta de freqüência extensiva não farão qualquer diferença na qualidade auditiva. Para uma videoconferência pessoal, um headset é freqüentemente a escolha preferida porque ele pode isolar o sinal que entra do sinal que sai, e assim elimina qualquer eco ou efeito de reverberação. Algumas pessoas preferem um speakerphone, porém, e estes estão disponíveis também. Para videoconferências em salas, uma microfone omni de alta qualidade direcional é freqüentemente usado, ou vários microfones direcionais pequenos são colocados ao longo do sala. Em todas as situações, é importante evitar colocar um microfone no alcance ativo de um locutor. Isto pode causar um efeito de eco que causa muita distração e difícil de contrabalançar.

Em relação às caixas de som, é normalmente mais fácil selecioná-las do que selecionar microfones. Como acima, para uma videoconferência pessoal um headset ou um conjunto de caixas de som de computador padrão é freqüentemente o suficiente. Para uma sala maior e mais pessoas, as caixas de som de um monitor de TV podem ser usadas. Para salas muito maiores um sistema de som separado poderia ser exigido incluindo um amplificador, um equalizador opcional e caixas de som.

O Codec

O codec foi mencionado acima quanto à sua influência no vídeo e no áudio em uma videoconferência. De fato, o codec forma realmente o coração de qualquer videoconferência terminal. A palavra "codec" está uma versão abreviada de "Compressor/Descompressor" e é especificamente aplicado para a variedade larga de algoritmos usados para comprimir ou descomprimir informações de áudio e/ou vídeo. Esta compressão tem sido historicamente necessária para tornar os dados de áudio/vídeo "pequenos o suficiente" e práticos para serem enviados via conexões de rede caras. Desta forma, existem muitos "codecs" de áudio e vídeo (metodologias específicas para compressão/ descompressão) que são suportadas como parte da maioria dos padrões e tecnologias de videoconferência. Para os propósitos desta seção, nós estamos considerando um sentido mais amplo para codec: o codec como a porção do terminal de videoconferência que é responsável por qualquer compressão/descompressão de sinais de áudio/vídeo que esteja acontecendo. Os processos de compressão e descompressão são também chamados de codificação e decodificação respectivamente.

Esta definição mais ampla e posterior permite que o codec seja um componente de software ou de hardware, e confere grande responsabilidade ao codec no sucesso da videoconferência. A quantia de dados exigidos para descrever" áudio e vídeo em um formato digital é muito grande pelos padrões de dados em rede de hoje. Sem alguma forma de codec, a transmissão de uma videoconferência exige quantias extremamente altas de largura de banda na rede. É o codec que toma as imagens e sons capturados pela câmera e microfone locais, e então comprime aquelas informações de forma que possam ser transmitidas através de uma rede rápida o suficiente para habilitar uma comunicação próxima ao tempo real. Quando as informações comprimidas são recebidas no local distante, o codec dentro do terminal de videoconferência do local distante descomprime-as e habilita o "play back" através das caixas de som e display. Embora nós pensemos sobre a conferência como uma conversação em tempo real, o sentimento de tempo real é uma função do quão rápido cada um dos codecs estão comprimindo/descomprimindo os dados, e o quão rápidos e confiáveis os dados comprimidos estão indo de um lado para o outro através da rede. A compressão de vídeo é muito mais exigente do que a compressão auditiva, e isto é o que estabelece os limites de capacidade dos codecs. Levando isto em conta, alguns fatores a considerar ao avaliar os codecs são:

Recentemente, uma nova geração de codecs de hardware foram introduzidas no mercado, prometendo qualidade de transmissão de vídeo muito melhor em uma largura de banda de rede limitado. O H.264 é um protocolo muito exigente em termos de força de processamento e por isso exige hardware especializado e não pode ser implementado ainda como um componente de software. A capacidade do H.264 está sendo incluída com freqüência crescente em soluções de videoconferência atuais e emergentes.

A Interface de Usuário

Todos os sistemas que são designados para uso tem uma interface de usuário. A facilidade da interface de usuário determina largamente se o sistema é utilizado por usuários finais, ou abordado com relutância na base do "só-se-eu-tiver-de". As implicações e importância da interface de usuário podem ser facilmente omitidas ou subsumidas se a funcionalidade principal do sistema é complexa ou interessante até o ponto de distração. Isso pode ser o caso da videoconferência. Freqüentemente nós consideramos e comparamos terminais de videoconferência baseando-nos somente na qualidade do vídeo e do áudio -- o que nos parece e o que sentimos quando estamos realmente em uma conferência -- e nós não paramos necessariamente para considerar as outras características do sistema. Estas outras características podem determinar como nós entramos e saímos de conferências, o que nós podemos fazer junto com uma videoconferência e até o que nós sabemos sobre como a está indo ou o que nós documentamos sobre a chamada uma vez que esteja terminado. Uma amostragem de características e considerações específicas são listadas abaixo, algumas das quais já tínhamos falado e outras que são tratadas em maiores detalhe em seções a seguir: